Definice dolování dat
Různé / / July 04, 2021
Guillem Alsina González, v listopadu 2018
Maxim už dlouho slyším, že data jsou novým olejem, ale pokud bychom měli soudit podle názvu jedné z disciplín, která se zabývá jeho využíváním a používáním, tzv. hornictví dat, Nazval bych je spíše „novým uhlím“, analogicky k jejich formám extrakce.
Dolování dat je disciplína, která spočívá ve vyvozování závěrů z automatizované statistické analýzy velké sbírky dat.
Tato data mohou pocházet z mnoha zdrojů, mohou mít různé struktury nebo dokonce nemusí být strukturována. Z tohoto důvodu dolování dat zahrnuje systémy umělá inteligence a strojové učení schopný přizpůsobit se nestrukturovaným datům a předávat je filtry, které umožňují jejich analýzu.
Nakonec jde o to, že závěry slouží k pomoci rozhodování na určitém systému, který se může velmi lišit: od silničního provozu ve městě nebo regionu až po ustanovení hasičů a dalších veřejných služeb při řešení případných mimořádných událostí.
Jde také o odhalování vzorů, kterými se data řídí a které byly až dosud skryté nebo jsme je nemohli vidět jasně, uprostřed veškerého bahna, velkého množství existujících dat.
Co odděluje těžbu dat od velká data? Těžba se zabývá pouze analýzou, zatímco těžbou velká data Je to disciplína, která je zodpovědná za sběr a ukládání dat, jakož i za jejich správu.
Na analyzovat správně data, nejprve musíme určit některé cíle, které sledujeme s analýza, řada otázek, na které musíme najít odpověď, protože ty budou vést kam musíme hledat.
Počínaje těmito otázkami ve formě prostor, vybíráme data ke zpracování (může se stát, že potřebujeme pouze část databázea ne všechny).
Fáze zpracování se v každém případě liší a využívá nástroje umělé inteligence a strojové učení, aby se mohli dynamicky přizpůsobit zadaným údajům a případně upravit své operace.
Konečným produktem tohoto zpracování by měla být řada závěrů, ale nezaměňujme je za závěry, které mají vyvodit osoby odpovědné za systém nebo osoby, které činí konečná rozhodnutí. Tyto závěry se týkají objemu analyzovaných dat.
Vezmeme-li znovu příklad silničního provozu ve městě, můžeme získat závěr že určitá ulice dostává nadměrný tok vozidel, ale systém nám neposkytne kouzelné recepty, jak tento přebytek vyřešit.
Ačkoli systém má inteligence umělý, který může navrhovat řešení, bude vždy úkolem lidského personálu mít poslední slovo.
Dolování dat se v praxi uplatňuje v mnoha oborech, mezi nimiž vynikají ty finanční.
Můžeme tedy najít aplikace v sekcích, jako je akciový trh (pro predikci chování akcií), ale také v odvětví, která nejsou čistě finanční, ale mají s tímto odvětvím úzký vztah, jako je tomu v případě pojištění.
Zpracování přirozeného jazyka, online vyhledávání nebo inteligentní automobily jsou další disciplíny, ve kterých se využívá dolování dat.
Fotky Fotolia: Moartist / Thinglass
Témata v oblasti dolování dat