Määritelmä tiedonlouhinta
Sekalaista / / July 04, 2021
Kirjoittanut Guillem Alsina González, marraskuussa. 2018
Olen kuullut, että data on uusi öljy jo pitkään, mutta jos joudumme arvioimaan jonkin sen hyödyntämistä ja käyttöä käsittelevän tieteenalan nimellä, niin sanotulla ns. kaivostoiminta tietoja, Kutsuisin heitä mieluummin "uusiksi kivihiiliksi" analogisesti niiden muodoista uuttaminen.
Tiedon louhinta on tieteenala, joka koostuu johtopäätösten tekemisestä automaattisen tilastollisen analyysin perusteella laajasta tietokokoelmasta.
Nämä tiedot voivat olla peräisin monista lähteistä, niillä voi olla erilainen rakenne tai ne eivät voi olla edes jäsenneltyjä. Tästä syystä tiedonlouhintaan liittyy tekoäly ja koneoppiminen pystyy sopeutumaan strukturoimattomaan dataan ja siirtämään sen suodattimien läpi, jotka mahdollistavat sen analysoinnin.
Loppujen lopuksi asia on, että johtopäätökset auttavat päätöksenteko tietyllä järjestelmällä, joka voi vaihdella hyvin: tieliikenteestä kaupungissa tai alueella säännös palomiehiä ja muita julkisia palveluja mahdollisten hätätilanteiden ratkaisemiseksi.
Kyse on myös mallien paljastamisesta, joita data seuraa ja jotka tähän asti on piilotettu tai emme voineet nähdä keskellä kaikkea moraalia selvästi olemassa olevan tiedon suurta määrää.
Mikä erottaa tiedon louhinnan Suuri data? Kaivostoiminta käsittelee vain analyysia, kun taas kaivostoiminta Suuri data Se on tieteenala, joka vastaa tietojen sieppaamisesta ja tallentamisesta sekä sen hallinnoinnista.
Vastaanottaja analysoida tiedot oikein, ensinnäkin meidän on määritettävä jotkut tavoitteet, joihin pyrimme analyysi, sarja kysymyksiä, joihin meidän on löydettävä vastaus, koska nämä ohjaavat minne meidän on etsittävä.
Aloittaessamme näistä tilojen muodossa olevista kysymyksistä valitsemme käsiteltävät tiedot (voi olla, että tarvitsemme vain osan tietokanta, eikä kaikki).
Käsittelyvaihe vaihtelee kussakin tapauksessa, ja siinä käytetään tekoälyn työkaluja ja koneoppiminen, jotta he voivat dynaamisesti sopeutua syötettyihin tietoihin muuttamalla toimintaansa tarvittaessa.
Tämän käsittelyn lopputuotteen tulisi olla sarja johtopäätöksiä, mutta älkäämme sekoittako niitä järjestelmään vastaavien tai lopullisten päätösten tekijöiden tekemiin tuloksiin. Nämä päätelmät koskevat analysoitujen tietojen määrää.
Jos otamme jälleen esimerkin tieliikenteestä kaupungissa, voimme saada johtopäätös että tietylle kadulle saapuu liikaa ajoneuvoja, mutta järjestelmä ei anna meille maagisia reseptejä mainitun ylimäärän ratkaisemiseksi.
Vaikka järjestelmällä on älykkyys keinotekoinen, joka voi ehdottaa ratkaisuja, viimeinen sana on aina ihmishenkilöstön tehtävä.
Tiedon louhintaa käytetään käytännössä useilla tieteenaloilla, joista taloudelliset erottautuvat.
Siten voimme löytää sovelluksia esimerkiksi osakemarkkinoista (osakkeiden käyttäytymisen ennustamiseksi), mutta myös sektorit, jotka eivät ole pelkästään taloudellisia, mutta joilla on läheinen suhde alaan, kuten on vakuutus.
Luonnollisen kielen käsittely, verkkohaut tai älyautot ovat muita tieteenaloja, joissa tiedonlouhintaa käytetään.
Fotolia-valokuvat: Moartist / Thinglass
Aiheet tiedonlouhinnassa