Definizione di data mining
Varie / / July 04, 2021
Di Guillem Alsina González, nel nov. 2018
Da tempo sento la massima che i dati sono il nuovo olio, ma se dobbiamo giudicare dal nome di una delle discipline che si occupa del suo sfruttamento e utilizzo, la cosiddetta estrazione di dati, preferirei chiamarli "il nuovo carbone", per analogia delle loro forme di estrazione.
Il data mining è una disciplina che consiste nel trarre conclusioni dall'analisi statistica automatizzata di un'ampia raccolta di dati.
Questi dati possono provenire da molte fonti, avere strutture diverse o addirittura non essere strutturati. Per questo motivo, il data mining coinvolge sistemi di intelligenza artificiale e di apprendimento automatico in grado di adattarsi a dati non strutturati e di passarli attraverso filtri che ne consentono l'analisi.
Alla fine, il punto è che le conclusioni servono ad aiutare il il processo decisionale su un certo sistema, che può essere molto vario: dal traffico stradale di una città o di una regione, a disposizione dei vigili del fuoco e di altri servizi pubblici per far fronte a eventuali emergenze.
Si tratta anche di scoprire schemi che seguono i dati e che, fino ad ora, erano nascosti oppure non potevamo vedere chiaramente, in mezzo a tutto il pantano, la grande quantità di dati esistenti.
Cosa separa il data mining da grandi dati? Bene, il mining si occupa solo di analisi, mentre il mining grandi dati È una disciplina che è responsabile dell'acquisizione e dell'archiviazione dei dati, nonché della sua amministrazione.
Per analizzare correttamente i dati, prima di tutto dobbiamo determinare alcuni obiettivi che perseguiamo con il analisi, una serie di domande a cui dobbiamo trovare una risposta, poiché queste guideranno dove dobbiamo cercare.
Partendo da queste domande in forma di premessa, scegliamo i dati da trattare (può darsi che ci serva solo una parte del Banca dati, e non tutti).
La fase di elaborazione differisce in ogni caso e utilizza strumenti di intelligenza artificiale e apprendimento automatico, in modo che possano adattarsi dinamicamente ai dati inseriti, modificando se necessario le loro operazioni.
Il prodotto finale di questa elaborazione dovrebbe essere una serie di conclusioni, ma non confondiamole con quelle che devono trarre i responsabili del sistema o coloro che prendono le decisioni finali. Queste conclusioni riguardano il volume dei dati analizzati.
Se riprendiamo l'esempio del traffico stradale in una città, possiamo ottenere il conclusione che una certa strada riceve un flusso eccessivo di veicoli, ma il sistema non ci darà ricette magiche per risolvere tale eccesso.
Sebbene il sistema possieda intelligenza artificiale in grado di proporre soluzioni, sarà sempre compito del personale umano avere l'ultima parola.
Il data mining trova applicazione pratica in un gran numero di discipline, tra cui spiccano quelle finanziarie.
Pertanto, possiamo trovare applicazioni in sezioni come il mercato azionario (per prevedere il comportamento delle azioni), ma anche in settori non prettamente finanziari ma in stretto rapporto con il settore, come nel caso di assicurazione.
L'elaborazione del linguaggio naturale, le ricerche online o le auto intelligenti sono altre discipline in cui viene applicato il data mining.
Fotolia foto: Moartist / Thinglass
Argomenti in Data Mining