Definicja eksploracji danych
Różne / / July 04, 2021
Autorstwa Guillem Alsina González, listopad. 2018
Od dawna słyszę maksymę, że dane to nowy olej, ale jeśli mamy sądzić po nazwie jednej z dyscyplin, która zajmuje się jego eksploatacją i użytkowaniem, tzw. górnictwo danych, nazwałbym je raczej „nowym węglem”, przez analogię do ich form their ekstrakcja.
Eksploracja danych to dyscyplina polegająca na wyciąganiu wniosków z automatycznej analizy statystycznej dużego zbioru danych.
Dane te mogą pochodzić z wielu źródeł, mieć różną strukturę, a nawet nie być ustrukturyzowane. Z tego powodu eksploracja danych obejmuje systemy sztuczna inteligencja i nauczanie maszynowe zdolne do dostosowania się do nieustrukturyzowanych danych i przepuszczania ich przez filtry, które umożliwiają ich analizę.
W końcu chodzi o to, aby wnioski służyły pomocy podejmowanie decyzji w określonym systemie, który może być bardzo zróżnicowany: od ruchu drogowego w mieście lub regionie po zaopatrzenie strażaków i innych służb publicznych w celu radzenia sobie z ewentualnymi sytuacjami awaryjnymi. .
Chodzi też o wydobycie na światło dzienne wzorców, za którymi podążają dane i które do tej pory były ukryte. albo nie mogliśmy wyraźnie zobaczyć, pośrodku całego bagna, dużej ilości istniejących danych.
Co odróżnia eksplorację danych od duże zbiory danych? Cóż, wydobycie zajmuje się tylko analizą, podczas wydobycia duże zbiory danych Jest to dyscyplina, która odpowiada za przechwytywanie i przechowywanie danych oraz administrowanie nimi.
Do analizować dane poprawnie, przede wszystkim musimy określić niektóre cele, które realizujemy z analiza, seria pytań, na które musimy znaleźć odpowiedź, bo to one wskażą gdzie musimy szukać.
Zaczynając od tych pytań w postaci przesłanek, wybieramy dane do przetwarzania (może być tak, że potrzebujemy tylko części Baza danychi nie wszystkie).
Faza przetwarzania różni się w każdym przypadku i wykorzystuje narzędzia sztucznej inteligencji oraz nauczanie maszynowe, dzięki czemu mogą dynamicznie dostosowywać się do wprowadzanych danych, modyfikując w razie potrzeby swoje działanie.
Produktem końcowym tego przetwarzania powinna być seria wniosków, ale nie mylmy ich z tymi, które wyciągają osoby odpowiedzialne za system lub podejmujące ostateczne decyzje. Te wnioski dotyczą ilości analizowanych danych.
Jeśli ponownie weźmiemy przykład z ruchem drogowym w mieście, możemy uzyskać wniosek że pewna ulica otrzymuje nadmierny przepływ pojazdów, ale system nie da nam magicznych przepisów na rozwiązanie tego nadmiaru.
Chociaż system posiada inteligencja sztuczne, które potrafią proponować rozwiązania, to ostatnie słowo zawsze będzie należało do personelu ludzkiego.
Data mining znajduje zastosowanie w praktyce w wielu dyscyplinach, wśród których wyróżniają się dyscypliny finansowe.
W ten sposób możemy znaleźć aplikacje w sekcjach takich jak giełda (do przewidywania zachowania akcji), ale także w sektory, które nie są ściśle finansowe, ale mają ścisły związek z sektorem, jak ma to miejsce w przypadku ubezpieczenie.
Przetwarzanie języka naturalnego, wyszukiwanie online lub inteligentne samochody to inne dyscypliny, w których stosuje się eksplorację danych.
Zdjęcia Fotolia: Moartist / Cienkie szkło
Tematy w eksploracji danych