הגדרת כריית נתונים
Miscellanea / / July 04, 2021
מאת גוילם אלסינה גונזלס, בנובמבר. 2018
אני שומע את המקסימום שהנתונים הם הנפט החדש כבר הרבה זמן, אבל אם עלינו לשפוט לפי אחד התחומים העוסקים בניצולו ובשימושו, מה שמכונה כְּרִיָה של מידעאני מעדיף לקרוא להם "הפחם החדש", באנלוגיה של צורותיהם של הוֹצָאָה.
כריית נתונים היא תחום המורכב מהסקת מסקנות מניתוח סטטיסטי אוטומטי של אוסף גדול של נתונים.
נתונים אלה יכולים להגיע ממקורות רבים, להיות בעלי מבנים שונים או אפילו לא להיות מובנים. מסיבה זו, כריית נתונים כוללת מערכות של בינה מלאכותית ושל למידת מכונה מסוגלים להסתגל לנתונים לא מובנים ולהעביר אותם דרך פילטרים המאפשרים את ניתוחם.
בסופו של דבר, העניין הוא שהמסקנות עוזרות ל קבלת החלטות במערכת מסוימת, שיכולה להיות מגוונת מאוד: מתעבורת הכבישים של עיר או אזור, ועד אַספָּקָה של צוותי כיבוי ושירותים ציבוריים אחרים לטיפול במצבי חירום אפשריים.
מדובר גם בהבאת דפוסים שהנתונים עוקבים אחריהם ועד כה הוסתרו או שלא הצלחנו לראות בבירור, באמצע כל המורל, את כמות הנתונים הגדולה הקיימת.
מה שמפריד בין כריית נתונים לבין נתונים גדולים? ובכן, כרייה עוסקת רק בניתוח, בזמן כרייה נתונים גדולים זו תחום שאחראי על לכידת נתונים ואחסוןם, כמו גם על ניהולו.
ל לְנַתֵחַ את הנתונים בצורה נכונה, ראשית כל עלינו לקבוע כמה יעדים שאנו שואפים עם ניתוח, סדרת שאלות שעלינו למצוא תשובה, מכיוון שאלו ינחו היכן אנחנו חייבים לחפש.
החל משאלות אלה בצורה של הנחות, אנו בוחרים את הנתונים לעיבוד (יכול להיות שאנחנו זקוקים רק לחלק מה- מאגר מידע, ולא הכל).
שלב העיבוד שונה בכל אחד מהמקרים, והוא משתמש בכלי בינה מלאכותית למידת מכונה, כך שהם יוכלו להסתגל באופן דינמי לנתונים שהוזנו, ולשנות את פעולותיהם במידת הצורך.
התוצר הסופי של עיבוד זה אמור להיות סדרה של מסקנות, אך אל לנו לבלבל את אלה עם אלה שיופנו על ידי האחראים למערכת או עם אלו שמקבלים את ההחלטות הסופיות. מסקנות אלה עוסקות בנפח הנתונים שניתחו.
אם ניקח שוב את הדוגמה של תנועת כבישים בעיר, נוכל להשיג את סיכום שרחוב מסוים מקבל זרימה מוגזמת של כלי רכב, אך המערכת לא תיתן לנו מתכוני קסמים לפתרון עודף זה.
למרות שהמערכת מחזיקה אינטליגנציה מלאכותי שיכול להציע פתרונות, תמיד תהיה המשימה של אנשי אנוש לקבל את המילה האחרונה.
כריית נתונים מיושמת בפועל במספר רב של תחומים, ביניהם פיננסים בולטים.
לפיכך, אנו יכולים למצוא יישומים בסעיפים כגון שוק המניות (כדי לחזות את התנהגות המניות), אך גם ב מגזרים שאינם כלכליים אך קשורים קשר הדוק עם המגזר, כפי שקורה ביטוח.
עיבוד שפה טבעית, חיפושים מקוונים או מכוניות חכמות הם תחומים אחרים בהם מיושם כריית נתונים.
תמונות פוטוליה: מוארטיסט / תיאטרון
נושאים בכריית נתונים