Ορισμός της Εξόρυξης Δεδομένων
Miscellanea / / July 04, 2021
Του Guillem Alsina González, το Νοέμβριο 2018
Ακούω το μέγιστο ότι τα δεδομένα είναι το νέο λάδι για μεγάλο χρονικό διάστημα, αλλά αν πρέπει να κρίνουμε με το όνομα ενός από τους κλάδους που ασχολείται με την εκμετάλλευση και τη χρήση του, το λεγόμενο εξόρυξη δεδομένωνΘα προτιμούσα να τους αποκαλέσω «ο νέος άνθρακας», κατ 'αναλογία των μορφών τους εξαγωγή.
Η εξόρυξη δεδομένων είναι ένας κλάδος που συνίσταται στην εξαγωγή συμπερασμάτων από την αυτοματοποιημένη στατιστική ανάλυση μιας μεγάλης συλλογής δεδομένων.
Αυτά τα δεδομένα μπορούν να προέρχονται από πολλές πηγές, να έχουν διαφορετικές δομές ή ακόμη και να μην είναι δομημένα. Για το λόγο αυτό, η εξόρυξη δεδομένων περιλαμβάνει συστήματα τεχνητή νοημοσύνη και του μηχανική εκμάθηση ικανός να προσαρμόζεται σε μη δομημένα δεδομένα και να τα περνά μέσα από φίλτρα που επιτρέπουν την ανάλυσή του.
Στο τέλος, το θέμα είναι ότι τα συμπεράσματα χρησιμεύουν για να βοηθήσουν λήψη αποφάσης σε ένα συγκεκριμένο σύστημα, το οποίο μπορεί να ποικίλλει: από την οδική κυκλοφορία σε μια πόλη ή περιοχή, έως
πρόβλεψη πυροσβεστών και άλλων δημόσιων υπηρεσιών για την αντιμετώπιση πιθανών καταστάσεων έκτακτης ανάγκης.Πρόκειται επίσης για την αποκάλυψη μοτίβων που ακολουθούν τα δεδομένα και ότι, μέχρι τώρα, ήταν κρυμμένα ή δεν μπορούσαμε να δούμε ξεκάθαρα, στη μέση όλου του χάους, το μεγάλο ποσό των υπαρχόντων δεδομένων.
Αυτό που διαχωρίζει την εξόρυξη δεδομένων από μεγάλα δεδομένα? Λοιπόν, η εξόρυξη ασχολείται μόνο με την ανάλυση, ενώ η εξόρυξη μεγάλα δεδομένα Είναι μια πειθαρχία που είναι υπεύθυνη για τη σύλληψη και αποθήκευση δεδομένων, καθώς και για τη διαχείρισή τους.
Προς την αναλύει τα δεδομένα σωστά, πρώτα απ 'όλα πρέπει να καθορίσουμε ορισμένους στόχους που επιδιώκουμε με το ανάλυση, μια σειρά ερωτήσεων στις οποίες πρέπει να βρούμε μια απάντηση, καθώς αυτές θα καθοδηγήσουν πού πρέπει να ψάξουμε.
Ξεκινώντας από αυτές τις ερωτήσεις με τη μορφή χώρων, επιλέγουμε τα δεδομένα για επεξεργασία (μπορεί να χρειαζόμαστε μόνο ένα μέρος του βάση δεδομένωνκαι όχι όλα).

Η φάση επεξεργασίας διαφέρει σε κάθε περίπτωση και χρησιμοποιεί εργαλεία τεχνητής νοημοσύνης και μηχανική εκμάθηση, έτσι ώστε να μπορούν να προσαρμόζονται δυναμικά στα δεδομένα που εισάγονται, τροποποιώντας τις λειτουργίες τους εάν είναι απαραίτητο.
Το τελικό προϊόν αυτής της επεξεργασίας θα πρέπει να είναι μια σειρά συμπερασμάτων, αλλά ας μην τα συγχέουμε με αυτά που πρέπει να εξαχθούν από εκείνους που είναι υπεύθυνοι για το σύστημα ή εκείνους που λαμβάνουν τις τελικές αποφάσεις. Αυτά τα συμπεράσματα αφορούν τον όγκο των δεδομένων που αναλύθηκαν.
Εάν πάρουμε ξανά το παράδειγμα της οδικής κυκλοφορίας σε μια πόλη, μπορούμε να αποκτήσουμε το συμπέρασμα ότι ένας συγκεκριμένος δρόμος λαμβάνει υπερβολική ροή οχημάτων, αλλά το σύστημα δεν θα μας δώσει μαγικές συνταγές για την επίλυση της εν λόγω περίσσειας.
Αν και το σύστημα διαθέτει νοημοσύνη τεχνητή που μπορεί να προτείνει λύσεις, θα είναι πάντα καθήκον του ανθρώπινου προσωπικού να έχει την τελευταία λέξη.
Η εξόρυξη δεδομένων εφαρμόζεται στην πράξη σε μεγάλο αριθμό επιστημονικών κλάδων, μεταξύ των οποίων ξεχωρίζουν τα οικονομικά.
Έτσι, μπορούμε να βρούμε εφαρμογές σε τμήματα όπως το χρηματιστήριο (για να προβλέψουμε τη συμπεριφορά των αποθεμάτων), αλλά και σε τομείς που δεν είναι αυστηρά οικονομικοί αλλά έχουν στενή σχέση με τον τομέα, όπως συμβαίνει στην περίπτωση του ΑΣΦΑΛΙΣΗ.
Η επεξεργασία φυσικής γλώσσας, οι διαδικτυακές αναζητήσεις ή τα έξυπνα αυτοκίνητα είναι άλλοι κλάδοι στους οποίους εφαρμόζεται η εξόρυξη δεδομένων.
Φωτογραφίες Fotolia: Moartist / Thinglass
Θέματα στην Εξόρυξη Δεδομένων