Визначення видобутку даних
Різне / / July 04, 2021
Гілем Алсіна Гонсалес, у листопаді 2018
Я вже давно чую максиму, що дані - це нова олія, але якщо нам доведеться судити за назвою однієї з дисциплін, яка займається її експлуатацією та використанням, то т.зв. видобуток корисних копалин даних, Я б скоріше назвав їх "новим вугіллям", за аналогією їх форм видобуток.
Видобуток даних - це дисципліна, яка складається з висновків на основі автоматизованого статистичного аналізу великої колекції даних.
Ці дані можуть надходити з багатьох джерел, мати різну структуру або навіть не бути структурованими. З цієї причини для видобутку даних використовуються системи штучний інтелект та з машинне навчання здатний адаптуватися до неструктурованих даних і передавати їх через фільтри, що дозволяють їх аналізувати.
Врешті-решт, справа в тому, що висновки слугують допомозі прийняття рішень за певною системою, яка може бути найрізноманітнішою: від дорожнього руху міста чи регіону до забезпечення пожежників та інших державних служб для вирішення можливих надзвичайних ситуацій.
Йдеться також про розкриття закономірностей, яких слідують дані і які до цього часу були приховані або ми не могли їх чітко побачити, серед усього болота, велика кількість існуючих даних.
Що відокремлює аналіз даних від великі дані? Ну, майнінг займається лише аналізом, тоді як майнінг великі дані Це дисципліна, яка відповідає за збір та зберігання даних, а також за їх адміністрування.
До аналізувати дані правильно, перш за все ми повинні визначити деякі цілі, які ми переслідуємо з аналіз, серія запитань, на які ми повинні знайти відповідь, оскільки вони будуть вести куди ми повинні шукати.
Починаючи з цих питань у формі приміщення, ми вибираємо дані для обробки (можливо, нам потрібна лише частина база данихі не всі).
Фаза обробки в кожному випадку відрізняється, і в ній використовуються засоби штучного інтелекту та машинне навчання, щоб вони могли динамічно адаптуватися до введених даних, змінюючи свої операції, якщо це необхідно.
Кінцевим продуктом цієї обробки має бути низка висновків, але давайте не будемо плутати їх з тими, які мають зробити відповідальні за систему або ті, хто приймає остаточні рішення. Ці висновки стосуються обсягу аналізованих даних.
Якщо знову взяти приклад дорожнього руху в місті, ми можемо отримати висновок що певна вулиця отримує надмірний потік транспортних засобів, але система не дасть нам чарівних рецептів для вирішення зазначеного надлишку.
Хоча система має інтелект штучний, який може запропонувати рішення, людським персоналом завжди буде останнє слово.
Видобуток даних застосовується на практиці у великій кількості дисциплін, серед яких виділяються фінансові.
Таким чином, ми можемо знайти застосування в таких розділах, як фондовий ринок (для прогнозування поведінки акцій), а також у сектори, які не є суто фінансовими, але мають тісний взаємозв'язок із сектором, як це відбувається у страхування.
Обробка природних мов, пошук в Інтернеті або розумні машини - це інші дисципліни, в яких застосовується аналіз даних.
Фотографії фото: Moartist / Thinglass
Теми з видобутку даних