Definição de Data Mining
Miscelânea / / July 04, 2021
Por Guillem Alsina González, em novembro 2018
Há muito tempo que ouço a máxima de que os dados são o novo petróleo, mas se tivermos que julgar pelo nome de uma das disciplinas que trata de sua exploração e uso, a chamada mineração De dados, Prefiro chamá-los de "o novo carvão", por analogia com suas formas de Extração.
A mineração de dados é uma disciplina que consiste em tirar conclusões a partir da análise estatística automatizada de uma grande coleção de dados.
Esses dados podem vir de várias fontes, ter estruturas diferentes ou mesmo não estar estruturados. Por este motivo, a mineração de dados envolve sistemas de inteligência artificial e de aprendizado de máquina capaz de se adaptar a dados não estruturados e passá-los por filtros que permitem sua análise.
No final das contas, a questão é que as conclusões servem para ajudar o tomando uma decisão em um determinado sistema, que pode ser muito variado: do tráfego rodoviário em uma cidade ou região, para provisão de bombeiros e outros serviços públicos para lidar com possíveis emergências.
Trata-se também de descobrir padrões que os dados seguem e que, até agora, estavam ocultos ou não podíamos ver claramente, no meio de todo o pântano, a grande quantidade de dados existentes.
O que separa a mineração de dados de big data? Bem, a mineração lida apenas com a análise, enquanto a mineração big data É uma disciplina responsável pela captura e armazenamento dos dados, bem como pela sua administração.
Para poder analisar os dados corretamente, em primeiro lugar devemos determinar alguns objetivos que perseguimos com o análise, uma série de questões para as quais devemos encontrar uma resposta, pois estas guiarão onde devemos pesquisar.
Partindo dessas questões na forma de premissas, escolhemos os dados a serem processados (pode ser que precisemos apenas de uma parte do base de dadose não todos).
A fase de processamento é diferente em cada caso, e usa ferramentas de inteligência artificial e aprendizado de máquina, para que possam se adaptar dinamicamente aos dados inseridos, modificando suas operações se necessário.
O produto final desse processamento deve ser uma série de conclusões, mas não vamos confundi-las com aquelas a serem tiradas pelos responsáveis pelo sistema ou por aqueles que tomam as decisões finais. Essas conclusões são sobre o volume de dados analisados.
Se tomarmos o exemplo do tráfego rodoviário em uma cidade novamente, podemos obter o conclusão que uma determinada rua recebe um fluxo excessivo de veículos, mas o sistema não nos dará receitas mágicas para resolver esse excesso.
Embora o sistema possua inteligência artificial que pode propor soluções, caberá sempre ao pessoal humano ter a última palavra.
A mineração de dados está sendo aplicada na prática em um grande número de disciplinas, entre as quais se destacam as financeiras.
Assim, podemos encontrar aplicações em seções como o mercado de ações (para prever o comportamento das ações), mas também em setores que não são estritamente financeiros, mas têm estreita relação com o setor, como é o caso de seguro.
Processamento de linguagem natural, buscas online ou carros inteligentes são outras disciplinas nas quais a mineração de dados está sendo aplicada.
Fotos da Fotolia: Moartist / Thinglass
Tópicos em mineração de dados