تعريف التنقيب في البيانات
منوعات / / July 04, 2021
بقلم: غويلم ألسينا غونزاليس ، نوفمبر. 2018
لقد سمعت مقولة مفادها أن البيانات هي النفط الجديد لفترة طويلة ، ولكن إذا كان علينا أن نحكم على اسم أحد التخصصات التي تتعامل مع استغلاله واستخدامه ، فإن ما يسمى التعدين البيانات، أفضل أن أسميهم "الفحم الجديد" ، قياساً على أشكالهم استخلاص.
التنقيب في البيانات هو تخصص يتكون من استخلاص النتائج من التحليل الإحصائي الآلي لمجموعة كبيرة من البيانات.
يمكن أن تأتي هذه البيانات من العديد من المصادر ، أو لها هياكل مختلفة ، أو حتى لا تكون منظمة. لهذا السبب ، يتضمن التنقيب عن البيانات أنظمة الذكاء الاصطناعي وبناءا على التعلم الالي قادرة على التكيف مع البيانات غير المهيكلة وتمريرها من خلال المرشحات التي تسمح بتحليلها.
في النهاية ، فإن النقطة هي أن الاستنتاجات تعمل على مساعدة اتخاذ القرار على نظام معين ، والذي يمكن أن يكون شديد التنوع: من حركة المرور على الطرق في مدينة أو منطقة ، إلى رزق من رجال الإطفاء والخدمات العامة الأخرى للتعامل مع حالات الطوارئ المحتملة.
يتعلق الأمر أيضًا بكشف الأنماط التي تتبعها البيانات والتي كانت مخفية حتى الآن أو لم نتمكن من رؤية الكم الهائل من البيانات الموجودة في وسط هذا المستنقع.
ما الذي يفصل تعدين البيانات عن البيانات الكبيرة? حسنًا ، التعدين يتعامل فقط مع التحليل ، أثناء التعدين البيانات الكبيرة إنه نظام مسؤول عن التقاط البيانات وتخزينها ، فضلاً عن إدارتها.
ل تحليل البيانات بشكل صحيح ، أولاً وقبل كل شيء يجب أن نحدد بعض الأهداف التي نتابعها مع التحليل ، سلسلة من الأسئلة التي يجب أن نجد إجابة لها ، لأن هذه ستوجه إلى أين يجب علينا البحث.
بدءًا من هذه الأسئلة في شكل أماكن عمل ، نختار البيانات المراد معالجتها (قد نحتاج فقط إلى جزء من قاعدة البياناتوليس كلهم).
تختلف مرحلة المعالجة في كل حالة ، وهي تستخدم أدوات الذكاء الاصطناعي و التعلم الالي، حتى يتمكنوا من التكيف ديناميكيًا مع البيانات المدخلة ، وتعديل عملياتهم إذا لزم الأمر.
يجب أن يكون المنتج النهائي لهذه المعالجة عبارة عن سلسلة من الاستنتاجات ، لكن دعونا لا نخلط بينها وبين تلك التي يمكن استخلاصها من قبل المسؤولين عن النظام أو أولئك الذين يتخذون القرارات النهائية. هذه الاستنتاجات حول حجم البيانات التي تم تحليلها.
إذا أخذنا مثال حركة المرور على الطرق في مدينة ما مرة أخرى ، فيمكننا الحصول على استنتاج أن شارعًا معينًا يتلقى تدفقًا مفرطًا للمركبات ، لكن النظام لن يقدم لنا وصفات سحرية لحل هذه الزيادة المذكورة.
على الرغم من أن النظام يمتلك ذكاء يمكن أن يقترح حلولًا اصطناعية ، ستكون دائمًا مهمة الموظفين البشريين أن تكون لهم الكلمة الأخيرة.
يتم تطبيق التنقيب عن البيانات في الممارسة العملية في عدد كبير من التخصصات ، من بينها التخصصات المالية.
وبالتالي ، يمكننا العثور على تطبيقات في أقسام مثل سوق الأوراق المالية (للتنبؤ بسلوك الأسهم) ، ولكن أيضًا في القطاعات غير المالية بشكل صارم ولكن لها علاقة وثيقة بالقطاع ، كما هو الحال في تأمين.
تعد معالجة اللغة الطبيعية أو عمليات البحث عبر الإنترنت أو السيارات الذكية من التخصصات الأخرى التي يتم فيها تطبيق التنقيب عن البيانات.
صور فوتوليا: Moartist / Thinglass
موضوعات في التنقيب عن البيانات