Datu ieguves definīcija
Miscellanea / / July 04, 2021
Autore Guillem Alsina González, nov. 2018
Es jau sen dzirdu maksimumu, ka dati ir jaunā eļļa, bet, ja mums ir jāvērtē pēc vienas no disciplīnām, kas nodarbojas ar tās izmantošanu un izmantošanu, t.s. kalnrūpniecība datuEs tos drīzāk nosaucu par "jaunajām oglēm" pēc analoģijas to formām ieguve.
Datu ieguve ir disciplīna, kas sastāv no secinājumu izdarīšanas no lielas datu kolekcijas automatizētās statistiskās analīzes.
Šie dati var nākt no daudziem avotiem, tiem var būt atšķirīga struktūra vai pat tie nevar būt strukturēti. Šī iemesla dēļ datu ieguve ir saistīta ar mākslīgais intelekts un mašīnmācīšanās spēj pielāgoties nestrukturētiem datiem un nodot tos caur filtriem, kas ļauj tos analizēt.
Galu galā būtība ir tāda, ka secinājumi palīdz lēmumu pieņemšana uz noteiktu sistēmu, kas var būt ļoti dažāda: sākot no pilsētas vai reģiona ceļu satiksmes līdz pat noteikums ugunsdzēsēju un citu sabiedrisko pakalpojumu sniedzējiem, lai risinātu iespējamās ārkārtas situācijas.
Tas ir arī par modeļu atklāšanu, kas seko datiem un kuri līdz šim tika slēpti vai arī mēs nevarējām skaidri redzēt visu mocību vidū esošo datu lielo daudzumu.
Kas atšķir datu ieguvi no lielie dati? Kalnrūpniecība nodarbojas tikai ar analīzi, bet kalnrūpniecība lielie dati Tā ir disciplīna, kas ir atbildīga par datu uztveršanu un glabāšanu, kā arī par tā administrēšanu.
Uz analizēt pareizi, vispirms mums jānosaka daži mērķi, kurus mēs tiecamies analīze, virkne jautājumu, uz kuriem mums jāatrod atbilde, jo tie virzīs kur mums jāmeklē.
Sākot no šiem jautājumiem telpu veidā, mēs izvēlamies apstrādājamos datus (var būt, ka mums ir nepieciešama tikai daļa no datu bāzē, un ne visi).
Apstrādes fāze katrā gadījumā atšķiras, un tajā tiek izmantoti mākslīgā intelekta rīki un mašīnmācīšanās, lai viņi varētu dinamiski pielāgoties ievadītajiem datiem, vajadzības gadījumā modificējot savas darbības.
Šīs apstrādes galaproduktam vajadzētu būt secinājumu virknei, taču nejauksim tos ar tiem, kas jāizdara tiem, kas atbildīgi par sistēmu, vai tiem, kas pieņem galīgos lēmumus. Šie secinājumi attiecas uz analizēto datu apjomu.
Ja mēs atkal izmantosim ceļu satiksmes piemēru pilsētā, mēs varam iegūt secinājums ka noteiktā ielā ir pārmērīga transportlīdzekļu plūsma, taču sistēma nedos mums burvju receptes, lai atrisinātu minēto pārsniegumu.
Kaut arī sistēmai piemīt inteliģence mākslīgs, kas var piedāvāt risinājumus, pēdējais vārds vienmēr būs cilvēku personāla uzdevums.
Datu ieguve praksē tiek izmantota daudzās disciplīnās, starp kurām izceļas arī finansiālās.
Tādējādi mēs varam atrast lietojumus tādās sadaļās kā akciju tirgus (lai prognozētu akciju uzvedību), bet arī iekš nozares, kuras nav stingri finanšu, bet kurām ir cieša saikne ar šo nozari, kā tas ir apdrošināšana.
Dabas valodas apstrāde, meklēšana tiešsaistē vai viedās automašīnas ir citas disciplīnas, kurās tiek izmantota datu ieguve.
Fotolia fotogrāfijas: Moartist / Thinglass
Datu ieguves tēmas