คำจำกัดความของการทำเหมืองข้อมูล
เบ็ดเตล็ด / / July 04, 2021
โดย Guillem Alsina González ในเดือนพฤศจิกายน 2018
เคยได้ยินคติที่ว่า data เป็นน้ำมันใหม่มาช้านานแล้ว แต่ถ้าต้องพิจารณาจากชื่อวิชาใดวิชาหนึ่งที่เกี่ยวข้องกับการเอารัดเอาเปรียบและใช้งาน เรียกว่า การขุด ของข้อมูล, ฉันอยากจะเรียกพวกเขาว่า "ถ่านหินใหม่" โดยการเปรียบเทียบรูปแบบของพวกเขา การสกัด.
การทำเหมืองข้อมูลเป็นวินัยที่ประกอบด้วยการสรุปผลจากการวิเคราะห์ทางสถิติอัตโนมัติของชุดข้อมูลขนาดใหญ่
ข้อมูลนี้อาจมาจากหลายแหล่ง มีโครงสร้างต่างกัน หรือแม้แต่จัดโครงสร้างไม่ได้ ด้วยเหตุนี้การทำเหมืองข้อมูลจึงเกี่ยวข้องกับระบบของ ปัญญาประดิษฐ์ และของ การเรียนรู้ของเครื่อง สามารถปรับให้เข้ากับข้อมูลที่ไม่มีโครงสร้างและส่งผ่านตัวกรองที่อนุญาตให้วิเคราะห์ได้
ในท้ายที่สุด ประเด็นก็คือข้อสรุปมีไว้เพื่อช่วย การตัดสินใจ ในระบบใดระบบหนึ่ง ซึ่งสามารถเปลี่ยนแปลงได้มาก ตั้งแต่การจราจรบนถนนในเมืองหรือภูมิภาค ไปจนถึง บทบัญญัติ ของนักผจญเพลิงและบริการสาธารณะอื่น ๆ เพื่อจัดการกับเหตุฉุกเฉินที่อาจเกิดขึ้น
นอกจากนี้ยังเกี่ยวกับการเปิดเผยรูปแบบที่ข้อมูลตามมาและถูกซ่อนไว้จนถึงปัจจุบัน now หรือเราไม่สามารถมองเห็นได้ชัดเจน ท่ามกลางความโกลาหลทั้งหมด ข้อมูลที่มีอยู่จำนวนมาก
สิ่งที่แยกการขุดข้อมูลออกจาก ข้อมูลใหญ่? การขุดเกี่ยวข้องกับการวิเคราะห์เท่านั้น ในขณะที่การขุด ข้อมูลใหญ่ เป็นวินัยที่รับผิดชอบในการเก็บรวบรวมและจัดเก็บข้อมูลตลอดจนการบริหาร
ถึง วิเคราะห์ ข้อมูลอย่างถูกต้องก่อนอื่นเราต้องกำหนดวัตถุประสงค์บางอย่างที่เราดำเนินการกับ วิเคราะห์ชุดคำถามที่เราต้องหาคำตอบ เพราะสิ่งเหล่านี้จะชี้นำว่า เราต้องค้นหา
เริ่มจากคำถามเหล่านี้ในรูปแบบของสถานที่ เราเลือกข้อมูลที่จะประมวลผล (อาจเป็นไปได้ว่าเราต้องการเพียงส่วนหนึ่งของ ฐานข้อมูลและไม่ทั้งหมด)
![](/f/63193a5714690f3f747cc30cfc98f8bf.jpg)
ขั้นตอนการประมวลผลจะแตกต่างกันไปในแต่ละกรณี โดยใช้เครื่องมือปัญญาประดิษฐ์และ การเรียนรู้ของเครื่องเพื่อให้สามารถปรับให้เข้ากับข้อมูลที่ป้อนแบบไดนามิก แก้ไขการดำเนินการหากจำเป็น
ผลิตภัณฑ์สุดท้ายของการประมวลผลนี้ควรเป็นชุดของข้อสรุป แต่อย่าสับสนกับผลลัพธ์ที่ผู้รับผิดชอบระบบหรือผู้ที่ทำการตัดสินใจขั้นสุดท้าย ข้อสรุปเหล่านี้เกี่ยวกับปริมาณข้อมูลที่วิเคราะห์
หากเรานำตัวอย่างการจราจรบนถนนในเมืองอีกครั้ง เราจะได้ บทสรุป ว่าถนนสายหนึ่งได้รับยานพาหนะมากเกินไป แต่ระบบจะไม่ให้สูตรมหัศจรรย์แก่เราในการแก้ปัญหาส่วนเกินดังกล่าว
แม้ว่าระบบจะครอบครอง ปัญญา ประดิษฐ์ที่สามารถเสนอแนวทางแก้ไขได้ ย่อมเป็นหน้าที่ของบุคลากรมนุษย์ที่จะต้องพูดให้จบสิ้น
การทำเหมืองข้อมูลถูกนำไปใช้ในทางปฏิบัติในสาขาวิชาต่างๆ จำนวนมาก ซึ่งสาขาวิชาการเงินมีความโดดเด่น
ดังนั้น เราสามารถหาแอปพลิเคชันในส่วนต่างๆ เช่น ตลาดหุ้น (เพื่อทำนายพฤติกรรมของหุ้น) แต่ยังรวมถึงใน ภาคที่ไม่ใช่ภาคการเงินอย่างเคร่งครัด แต่มีความสัมพันธ์ใกล้ชิดกับภาคส่วน เช่น ประกันภัย.
การประมวลผลภาษาธรรมชาติ การค้นหาออนไลน์ หรือรถยนต์อัจฉริยะเป็นสาขาวิชาอื่นๆ ที่ใช้การทำเหมืองข้อมูล
รูปถ่าย: Moartist / Thinglass
หัวข้อในการทำเหมืองข้อมูล