Definition av Data Mining
Miscellanea / / July 04, 2021
Av Guillem Alsina González i nov. 2018
Jag har hört maximalt att data är den nya oljan under lång tid, men om vi måste bedöma efter namnet på en av de discipliner som handlar om dess utnyttjande och användning, så kallade brytning av data, Skulle jag hellre kalla dem "det nya kolet", analogt med deras former av extraktion.
Data mining är en disciplin som består av att dra slutsatser från den automatiserade statistiska analysen av en stor datainsamling.
Dessa data kan komma från många källor, ha olika strukturer eller inte ens vara strukturerade. Av denna anledning involverar data mining system av artificiell intelligens och av maskininlärning kan anpassa sig till ostrukturerad data och skicka den genom filter som gör det möjligt att analysera dem.
I slutändan är poängen att slutsatserna hjälper till beslutsfattande på ett visst system, som kan vara mycket varierat: från vägtrafik i en stad eller region, till tillhandahållande brandmän och andra offentliga tjänster för att hantera eventuella nödsituationer.
Det handlar också om att avslöja mönster som data följer och som hittills var dolda eller så kunde vi inte tydligt se den stora mängden befintlig data mitt i all skräck.
Vad skiljer data mining från stora data? Tja, gruvdrift handlar bara om analys medan gruvdrift stora data Det är en disciplin som ansvarar för att fånga och lagra data, liksom dess administration.
Till analysera uppgifterna korrekt, först och främst måste vi bestämma några mål som vi strävar efter med analys, en serie frågor som vi måste hitta svar på, eftersom dessa kommer att vägleda var vi måste söka.
Med utgångspunkt från dessa frågor i form av lokaler väljer vi de data som ska bearbetas (det kan vara så att vi bara behöver en del av databasoch inte alla).
Bearbetningsfasen skiljer sig åt i båda fallen och den använder artificiell intelligensverktyg och maskininlärning, så att de dynamiskt kan anpassa sig till de angivna uppgifterna och ändra deras operationer vid behov.
Slutprodukten av denna bearbetning bör vara en serie slutsatser, men låt oss inte förväxla dessa med dem som ska dras av de som är ansvariga för systemet eller de som fattar de slutgiltiga besluten. Dessa slutsatser handlar om analyserad datamängd.
Om vi tar exemplet med vägtrafik i en stad igen kan vi få slutsats att en viss gata får ett för stort flöde av fordon, men systemet kommer inte att ge oss magiska recept för att lösa nämnda överskott.
Även om systemet har intelligens konstgjord som kan föreslå lösningar, kommer det alltid att vara mänsklig personal att ha det sista ordet.
Datautvinning tillämpas i praktiken i ett stort antal discipliner, bland vilka de finansiella sticker ut.
Således kan vi hitta applikationer i avsnitt som aktiemarknaden (för att förutsäga aktiens beteende), men också i sektorer som inte är strikt finansiella men som har en nära relation till sektorn, vilket är fallet med försäkring.
Naturlig språkbehandling, online-sökningar eller smarta bilar är andra discipliner där datautvinning tillämpas.
Fotolia-foton: Moartist / Thinglass
Ämnen inom Data Mining