Définition de l'exploration de données
Divers / / July 04, 2021
Par Guillem Alsina González, en nov. 2018
J'entends depuis longtemps la maxime selon laquelle les données sont le nouveau pétrole, mais si nous devons en juger par le nom de l'une des disciplines qui traitent de son exploitation et de son utilisation, la soi-disant exploitation minière de données, je les appellerais plutôt "le nouveau charbon", par analogie de leurs formes de extraction.
Le data mining est une discipline qui consiste à tirer des conclusions de l'analyse statistique automatisée d'une large collection de données.
Ces données peuvent provenir de plusieurs sources, avoir des structures différentes ou même ne pas être structurées. Pour cette raison, l'exploration de données implique des systèmes de intelligence artificielle et de apprentissage automatique capable de s'adapter à des données non structurées et de les faire passer à travers des filtres qui permettent leur analyse.
En fin de compte, le fait est que les conclusions servent à aider le prise de décisions sur un certain système, qui peut être très varié: du trafic routier d'une ville ou d'une région, à la
disposition des pompiers et autres services publics pour faire face à d'éventuelles urgences.Il s'agit aussi de découvrir des modèles que suivent les données et qui, jusqu'à présent, étaient cachés ou nous ne pouvions pas voir clairement, au milieu de tout le bourbier, la grande quantité de données existantes.
Qu'est-ce qui sépare l'exploration de données de Big Data? Eh bien, l'exploitation minière ne traite que de l'analyse, tandis que l'exploitation minière Big Data C'est une discipline qui est responsable de la capture et du stockage des données, ainsi que de leur administration.
Pour pouvoir analyser correctement les données, nous devons tout d'abord déterminer certains objectifs que nous poursuivons avec le analyse, une série de questions auxquelles nous devons trouver une réponse, car celles-ci guideront où nous devons chercher.
A partir de ces questions sous forme de prémisses, nous choisissons les données à traiter (il se peut que nous n'ayons besoin que d'une partie des base de données, et pas tous).
La phase de traitement diffère dans chaque cas, et elle utilise des outils d'intelligence artificielle et apprentissage automatique, afin qu'ils puissent s'adapter dynamiquement aux données saisies, en modifiant leurs opérations si nécessaire.
Le produit final de ce traitement devrait être une série de conclusions, mais ne les confondons pas avec celles que doivent tirer les responsables du système ou ceux qui prennent les décisions finales. Ces conclusions portent sur le volume de données analysées.
Si l'on reprend l'exemple du trafic routier dans une ville, on peut obtenir le conclusion qu'une certaine rue reçoit un flux excessif de véhicules, mais le système ne nous donnera pas de recettes magiques pour résoudre cet excès.
Bien que le système possède intelligence artificielle qui peut proposer des solutions, il appartiendra toujours au personnel humain d'avoir le dernier mot.
L'exploration de données est appliquée dans la pratique dans un grand nombre de disciplines, parmi lesquelles les financières se distinguent.
Ainsi, on peut trouver des applications dans des rubriques comme la bourse (pour prédire le comportement des actions), mais aussi dans secteurs qui ne sont pas strictement financiers mais qui ont une relation étroite avec le secteur, comme c'est le cas de Assurance.
Le traitement du langage naturel, les recherches en ligne ou les voitures intelligentes sont d'autres disciplines dans lesquelles l'exploration de données est appliquée.
Photos Fotolia: Moartist / Thinglass
Sujets dans l'exploration de données