Definiția Data Mining
Miscellanea / / July 04, 2021
De Guillem Alsina González, în noi. 2018
Am auzit de multă vreme că datele sunt noul petrol, dar dacă trebuie să judecăm după numele uneia dintre disciplinele care se ocupă de exploatarea și utilizarea sa, așa-numitul minerit de date, Aș prefera să le numesc „noul cărbune”, prin analogie a formelor lor de extracţie.
Exploatarea datelor este o disciplină care constă în tragerea concluziilor din analiza statistică automatizată a unei mari colecții de date.
Aceste date pot proveni din mai multe surse, pot avea structuri diferite sau chiar nu pot fi structurate. Din acest motiv, exploatarea datelor implică sisteme de inteligență artificială și de învățare automată capabil să se adapteze la date nestructurate și să le treacă prin filtre care permit analiza acestora.
În cele din urmă, punctul este că concluziile servesc pentru a ajuta luarea deciziilor pe un anumit sistem, care poate fi foarte variat: de la trafic rutier într-un oraș sau regiune, până la dispoziţie a pompierilor și a altor servicii publice pentru a face față unor eventuale situații de urgență.
Este vorba, de asemenea, despre descoperirea unor tipare pe care datele le urmează și care, până acum, erau ascunse sau nu am putut vedea clar, în mijlocul tuturor tâmpenilor, cantitatea mare de date existente.
Ceea ce separă extragerea datelor Date mare? Ei bine, mineritul se ocupă doar de analiză, în timp ce minarea Date mare Este o disciplină care răspunde de captarea și stocarea datelor, precum și de administrarea acestora.
La a analiza datele corect, în primul rând trebuie să stabilim câteva obiective pe care le urmărim cu analiză, o serie de întrebări la care trebuie să găsim un răspuns, deoarece acestea vor ghida unde trebuie să căutăm.
Pornind de la aceste întrebări sub formă de premise, alegem datele de procesat (poate că avem nevoie doar de o parte din Bază de date, și nu toate).
Faza de procesare diferă în fiecare caz și folosește instrumente de inteligență artificială și învățare automată, astfel încât să se poată adapta dinamic la datele introduse, modificându-și operațiunile dacă este necesar.
Produsul final al acestei prelucrări ar trebui să fie o serie de concluzii, dar să nu le confundăm cu cele pe care trebuie să le tragă cei responsabili de sistem sau cei care iau deciziile finale. Aceste concluzii se referă la volumul de date analizate.
Dacă luăm din nou exemplul traficului rutier într-un oraș, putem obține concluzie că o anumită stradă primește un flux excesiv de vehicule, dar sistemul nu ne va oferi rețete magice pentru a rezolva excesul menționat.
Deși sistemul posedă inteligență artificial care poate propune soluții, va fi întotdeauna sarcina personalului uman să aibă ultimul cuvânt.
Exploatarea datelor este aplicată în practică într-un număr mare de discipline, printre care se remarcă cele financiare.
Astfel, putem găsi aplicații în secțiuni precum piața de valori (pentru a prezice comportamentul stocurilor), dar și în sectoare care nu sunt strict financiare, dar care au o relație strânsă cu sectorul, cum este cazul asigurare.
Prelucrarea limbajului natural, căutările online sau mașinile inteligente sunt alte discipline în care se aplică extragerea datelor.
Fotografii Fotolia: Moartist / Thinglass
Subiecte în minerit de date