Definitie van datamining
Diversen / / July 04, 2021
Door Guillem Alsina González, in nov. 2018
Ik hoor al heel lang de stelregel dat data de nieuwe olie is, maar als we moeten oordelen naar de naam van een van de disciplines die zich bezighoudt met de exploitatie en het gebruik ervan, de zogenaamde mijnbouw Van de gegevens, zou ik ze liever "de nieuwe steenkool" noemen, naar analogie van hun vormen van extractie.
Datamining is een discipline die bestaat uit het trekken van conclusies uit de geautomatiseerde statistische analyse van een grote verzameling gegevens.
Deze gegevens kunnen uit vele bronnen komen, verschillende structuren hebben of zelfs niet gestructureerd zijn. Om deze reden omvat datamining systemen van: kunstmatige intelligentie en van machine learning in staat om zich aan te passen aan ongestructureerde gegevens en deze door filters te laten gaan die analyse mogelijk maken.
Uiteindelijk gaat het erom dat de conclusies dienen om de besluitvorming op een bepaald systeem, dat zeer gevarieerd kan zijn: van het wegverkeer van een stad of regio tot de
voorziening brandweerlieden en andere openbare diensten om mogelijke noodsituaties het hoofd te bieden.Het gaat ook om het aan het licht brengen van patronen die de data volgen en die tot nu toe verborgen waren of we konden niet goed zien, te midden van al het moeras, de grote hoeveelheid bestaande data.
Wat scheidt datamining van? grote gegevens? Nou, mijnbouw houdt zich alleen bezig met analyse, terwijl mijnbouw grote gegevens Het is een discipline die verantwoordelijk is voor het vastleggen en opslaan van gegevens, evenals voor het beheer ervan.
Naar analyseren de gegevens correct, eerst en vooral moeten we een aantal doelen bepalen die we nastreven met de analyse, een reeks vragen waarop we een antwoord moeten vinden, aangezien deze zullen leiden waar we moeten zoeken.
Uitgaande van deze vragen in de vorm van premissen kiezen we welke gegevens we gaan verwerken (het kan zijn dat we maar een deel van de databaseen niet allemaal).
De verwerkingsfase verschilt in elk geval en maakt gebruik van kunstmatige-intelligentietools en machine learning, zodat ze zich dynamisch kunnen aanpassen aan de ingevoerde gegevens en zo nodig hun activiteiten kunnen aanpassen.
Het eindproduct van deze verwerking zou een reeks conclusies moeten zijn, maar laten we deze niet verwarren met de conclusies die moeten worden getrokken door degenen die verantwoordelijk zijn voor het systeem of degenen die de uiteindelijke beslissingen nemen. Deze conclusies gaan over de hoeveelheid geanalyseerde gegevens.
Als we opnieuw het voorbeeld nemen van het wegverkeer in een stad, kunnen we de krijgen conclusie dat een bepaalde straat een overmatige stroom van voertuigen ontvangt, maar het systeem zal ons geen magische recepten geven om die overmaat op te lossen.
Hoewel het systeem beschikt over: intelligentie- kunstmatig die oplossingen kan voorstellen, zal het altijd de taak van het menselijke personeel zijn om het laatste woord te hebben.
Datamining wordt in de praktijk toegepast in een groot aantal disciplines, waaronder de financiële.
Zo kunnen we toepassingen vinden in rubrieken zoals de aandelenmarkt (om het gedrag van aandelen te voorspellen), maar ook in sectoren die niet strikt financieel zijn maar een nauwe relatie hebben met de sector, zoals het geval is verzekering.
Natuurlijke taalverwerking, online zoeken of slimme auto's zijn andere disciplines waarin datamining wordt toegepast.
Fotolia-foto's: Moartist / Thinglass
Onderwerpen in datamining