Definition von Data Mining
Verschiedenes / / July 04, 2021
Von Guillem Alsina González, im Nov. 2018
Ich höre schon lange die Maxime, dass Daten das neue Öl sind, aber wenn wir nach dem Namen einer der Disziplinen urteilen müssen, die sich mit ihrer Gewinnung und Nutzung beschäftigt, der sogenannten Bergbau von Dateien, ich würde sie eher "die neue Kohle" nennen, in Analogie zu ihren Formen von Extraktion.
Data Mining ist eine Disziplin, die darin besteht, Schlussfolgerungen aus der automatisierten statistischen Analyse einer großen Datensammlung zu ziehen.
Diese Daten können aus vielen Quellen stammen, unterschiedliche Strukturen aufweisen oder gar nicht strukturiert sein. Aus diesem Grund umfasst Data Mining Systeme von künstliche Intelligenz und von maschinelles Lernen in der Lage, sich an unstrukturierte Daten anzupassen und sie durch Filter zu leiten, die ihre Analyse ermöglichen.
Letztlich geht es darum, dass die Schlussfolgerungen dazu dienen, den Entscheidung fällen auf einem bestimmten System, das sehr unterschiedlich sein kann: vom Straßenverkehr in einer Stadt oder Region bis hin zu
Bereitstellung von Feuerwehrleuten und anderen öffentlichen Diensten, um mögliche Notfälle zu bewältigen.Es geht auch darum, Muster aufzudecken, denen die Daten folgen und die bisher verborgen waren oder wir konnten sie inmitten all des Morasts, der großen Menge an vorhandenen Daten, nicht klar sehen.
Was unterscheidet Data Mining von Große Daten? Nun, Mining beschäftigt sich nur mit Analyse, während Mining Große Daten Es ist eine Disziplin, die für die Erfassung und Speicherung von Daten sowie deren Verwaltung verantwortlich ist.
Zu analysieren die Daten korrekt, müssen wir zunächst einige Ziele festlegen, die wir mit dem Analyse, eine Reihe von Fragen, auf die wir eine Antwort finden müssen, da diese führen werden, wohin wir müssen suchen.
Ausgehend von diesen Fragen in Form von Prämissen wählen wir die zu verarbeitenden Daten aus (eventuell benötigen wir nur einen Teil der Datenbank, und nicht alle).
Die Verarbeitungsphase ist jeweils unterschiedlich und verwendet Werkzeuge der künstlichen Intelligenz und maschinelles Lernen, damit sie sich dynamisch an die eingegebenen Daten anpassen und ihre Operationen bei Bedarf ändern können.
Das Endprodukt dieser Verarbeitung sollte eine Reihe von Schlussfolgerungen sein, aber verwechseln wir diese nicht mit denen, die von den Systemverantwortlichen oder denjenigen, die die letzten Entscheidungen treffen, gezogen werden. Diese Schlussfolgerungen beziehen sich auf die Menge der analysierten Daten.
Nehmen wir noch einmal das Beispiel des Straßenverkehrs in einer Stadt, können wir die Fazit dass eine bestimmte Straße einen übermäßigen Fahrzeugstrom erhält, aber das System wird uns keine magischen Rezepte geben, um diesen Überschuss zu lösen.
Obwohl das System über Intelligenz künstlich, die Lösungen vorschlagen kann, wird es immer die Aufgabe des menschlichen Personals sein, das letzte Wort zu haben.
Data Mining wird in einer Vielzahl von Disziplinen in der Praxis angewendet, von denen die Finanzwissenschaften hervorstechen.
So finden wir Anwendungen in Bereichen wie dem Aktienmarkt (um das Verhalten von Aktien vorherzusagen), aber auch in Sektoren, die nicht ausschließlich Finanzsektoren sind, aber eine enge Beziehung zu diesem Sektor aufweisen, wie im Fall von Versicherung.
Natural Language Processing, Online-Suche oder Smart Cars sind weitere Disziplinen, in denen Data Mining zum Einsatz kommt.
Fotolia Fotos: Moartist / Thinglass
Themen im Data Mining