Andmekaevanduse määratlus
Miscellanea / / July 04, 2021
Autor Guillem Alsina González, nov. 2018
Ma olen pikka aega kuulnud maksimumit, et andmed on uus õli, kuid kui peame otsustama ühe selle ekspluateerimise ja kasutamisega tegeleva eriala nime järgi, siis nn. kaevandamine andmete kohta, Nimetaksin neid pigem "uueks kivisöeks", analoogiliselt nende vormidele kaevandamine.
Andmekaevandus on teadusharu, mis koosneb järelduste tegemisest suure andmekogumi automatiseeritud statistilise analüüsi põhjal.
Need andmed võivad pärineda paljudest allikatest, neil võib olla erinev struktuur või isegi mitte struktureerida. Sel põhjusel hõlmab andmete kaevandamine süsteeme tehisintellekt ja masinõpe võimeline kohanema struktureerimata andmetega ja edastama need läbi filtrite, mis võimaldavad neid analüüsida.
Lõppkokkuvõttes on asi selles, et järeldused aitavad otsuse tegemine teatud süsteemis, mis võib olla väga erinev: alates linna või piirkonna maanteeliiklusest kuni säte tuletõrjujate ja muude avalike teenuste osutamine võimalike hädaolukordade lahendamiseks.
See puudutab ka andmete järgitavaid mustreid, mida seni peideti või me ei suutnud neid kogu moraali keskel selgelt näha, olemasolevate andmete suurt hulka.
Mis eraldab andmete kaevandamist Suured andmed? Noh, kaevandamine tegeleb ainult analüüsiga, samal ajal kui kaevandamine Suured andmed See on teadusharu, mis vastutab andmete hõivamise ja säilitamise ning haldamise eest.
To analüüsima Andmed õigesti, kõigepealt peame määrama mõned eesmärgid, mida me taotleme analüüs, rida küsimusi, millele peame vastuse leidma, sest need juhatavad kuhu peame otsima.
Alustades nendest küsimustest ruumide näol, valime töödeldavad andmed (võib juhtuda, et vajame ainult osa andmebaasija mitte kõik).
Töötlemisetapp on igal juhul erinev ja selles kasutatakse tehisintellekti tööriistu ja masinõpe, et nad saaksid dünaamiliselt kohaneda sisestatud andmetega, muutes vajadusel oma toiminguid.
Selle töötlemise lõpptoode peaks olema rida järeldusi, kuid ärgem segamini ajamast neid, mida süsteemi eest vastutavad või lõplike otsuste langetajad peavad tegema. Need järeldused käsitlevad analüüsitud andmete mahtu.
Kui me võtame uuesti näite linna liiklusest, võime selle hankida järeldus et teatud tänav võtab vastu liigset sõidukite voogu, kuid süsteem ei anna meile võluretsepte nimetatud liiasuse lahendamiseks.
Ehkki süsteem omab intelligentsus kunstlik, mis suudab pakkuda lahendusi, jääb alati viimase sõna ütlemine inimtöötajate ülesandeks.
Andmekaevandust rakendatakse praktikas paljudel erialadel, mille hulgas paistavad silma rahalised.
Seega võime leida rakendusi sellistest sektsioonidest nagu aktsiaturg (aktsiate käitumise ennustamiseks), aga ka aastal sektorid, mis ei ole rangelt rahalised, kuid on sektoriga tihedalt seotud, nagu seda tehakse kindlustus.
Loomulik keele töötlemine, veebiotsingud või nutikad autod on muud teadusharud, milles rakendatakse andmekaevandust.
Fotolia fotod: Moartist / Thinglass
Teemad andmekaevanduses