Definisi Penambangan Data
Bermacam Macam / / July 04, 2021
Oleh Guillem Alsina González, pada November. 2018
Saya telah mendengar pepatah bahwa data adalah minyak baru untuk waktu yang lama, tetapi jika kita harus menilai dengan nama salah satu disiplin ilmu yang berhubungan dengan eksploitasi dan penggunaannya, yang disebut pertambangan dari data, saya lebih suka menyebutnya "batubara baru", dengan analogi bentuk mereka ekstraksi.
Data mining adalah disiplin yang terdiri dari penarikan kesimpulan dari analisis statistik otomatis dari kumpulan data yang besar.
Data ini bisa berasal dari banyak sumber, memiliki struktur yang berbeda, atau bahkan tidak terstruktur. Untuk alasan ini, penambangan data melibatkan sistem kecerdasan buatan dan dari pembelajaran mesin mampu beradaptasi dengan data tidak terstruktur dan melewatkannya melalui filter yang memungkinkan analisisnya.
Pada akhirnya, intinya adalah bahwa kesimpulan berfungsi untuk membantu pengambilan keputusan pada sistem tertentu, yang bisa sangat bervariasi: dari lalu lintas jalan kota atau wilayah, hingga
ketentuan petugas pemadam kebakaran dan layanan publik lainnya untuk menangani kemungkinan keadaan darurat.Ini juga tentang mengungkap pola yang diikuti oleh data dan yang sampai sekarang disembunyikan atau kita tidak bisa melihatnya dengan jelas, di tengah semua rawa, sejumlah besar data yang ada.
Apa yang membedakan penambangan data dari data besar? Nah, menambang hanya berurusan dengan analisis, sementara menambang data besar Ini adalah disiplin yang bertanggung jawab untuk menangkap dan menyimpan data, serta administrasinya.
Untuk menganalisa data dengan benar, pertama-tama kita harus menentukan beberapa tujuan yang kita kejar dengan analisis, serangkaian pertanyaan yang harus kita temukan jawabannya, karena ini akan memandu di mana kita harus mencari.
Berawal dari pertanyaan-pertanyaan yang berbentuk premis tersebut, kita memilih data yang akan diproses (mungkin kita hanya membutuhkan sebagian dari basis data, dan tidak semua).
Fase pemrosesan berbeda dalam setiap kasus, dan menggunakan alat kecerdasan buatan dan pembelajaran mesin, sehingga mereka dapat beradaptasi secara dinamis dengan data yang dimasukkan, memodifikasi operasinya jika perlu.
Produk akhir dari pemrosesan ini harus berupa serangkaian kesimpulan, tetapi jangan bingung dengan kesimpulan yang ditarik oleh mereka yang bertanggung jawab atas sistem atau mereka yang membuat keputusan akhir. Kesimpulan ini adalah tentang volume data yang dianalisis.
Jika kita mengambil contoh lalu lintas jalan di kota lagi, kita dapat memperoleh kesimpulan bahwa jalan tertentu menerima aliran kendaraan yang berlebihan, tetapi sistem tidak akan memberi kita resep ajaib untuk mengatasi kelebihan tersebut.
Meskipun sistem memiliki intelijen buatan yang dapat mengusulkan solusi, itu akan selalu menjadi tugas personel manusia untuk memiliki kata terakhir.
Penambangan data sedang diterapkan dalam praktik di sejumlah besar disiplin ilmu, di antaranya yang menonjol adalah keuangan.
Dengan demikian, kita dapat menemukan aplikasi di bagian seperti pasar saham (untuk memprediksi perilaku saham), tetapi juga di also sektor-sektor yang tidak semata-mata bersifat finansial tetapi memiliki hubungan yang erat dengan sektor tersebut, seperti halnya Pertanggungan.
Pemrosesan bahasa alami, pencarian online, atau mobil pintar adalah disiplin lain di mana penambangan data diterapkan.
Foto fotolia: Moartist / Thinglass
Topik dalam Data Mining Data