Veri Madenciliğinin Tanımı
Çeşitli / / July 04, 2021
Guillem Alsina González, Kasım ayında. 2018
Verinin yeni petrol olduğu düsturunu uzun zamandır duyuyorum, ancak onun sömürülmesi ve kullanımı ile ilgilenen disiplinlerden birinin adıyla yargılamak gerekirse, madencilik veribiçimlerine benzeterek onlara "yeni kömür" demeyi tercih ederim. çıkarma.
Veri madenciliği, geniş bir veri koleksiyonunun otomatik istatistiksel analizinden sonuçlar çıkarmaktan oluşan bir disiplindir.
Bu veriler birçok kaynaktan gelebilir, farklı yapılara sahip olabilir veya yapılandırılmamış bile olabilir. Bu nedenle veri madenciliği, aşağıdaki sistemleri içerir: yapay zeka ve makine öğrenme yapılandırılmamış verilere uyum sağlama ve analizine izin veren filtrelerden geçirme yeteneğine sahiptir.
Sonuç olarak, mesele şu ki, sonuçlar, karar verme çok çeşitli olabilen belirli bir sistemde: bir şehir veya bölgedeki karayolu trafiğinden, önlem Olası acil durumlarla başa çıkmak için itfaiyeciler ve diğer kamu hizmetleri.
Aynı zamanda, verilerin takip ettiği ve şimdiye kadar gizlenmiş olan kalıpları ortaya çıkarmakla da ilgilidir. ya da tüm bataklığın ortasında, büyük miktarda mevcut veriyi net bir şekilde göremedik.
Veri madenciliğini diğerlerinden ayıran nedir? Büyük veri? Madencilik sadece analizle ilgilenir, madencilik ise Büyük veri Verilerin yakalanmasından ve saklanmasından ve yönetiminden sorumlu olan bir disiplindir.
için analiz etmek Verileri doğru bir şekilde elde edebilmek için öncelikle hedeflediğimiz bazı hedefleri belirlemeliyiz. analizi, cevabını bulmamız gereken bir dizi soru, çünkü bunlar nereye gideceğimizi yönlendirecektir. aramalıyız.
Önermeler biçimindeki bu sorulardan başlayarak, işlenecek verileri seçiyoruz (belki de veri tabanı, ve hepsi değil).
İşleme aşaması her durumda farklılık gösterir ve yapay zeka araçlarını kullanır ve makine öğrenme, böylece gerektiğinde işlemlerini değiştirerek girilen verilere dinamik olarak uyum sağlayabilirler.
Bu işlemenin nihai ürünü bir dizi sonuç olmalıdır, ancak bunları sistemden sorumlu olanlar veya nihai kararları verenler tarafından çıkarılacak olanlarla karıştırmayalım. Bu sonuçlar, analiz edilen verilerin hacmi ile ilgilidir.
Yine bir şehirdeki karayolu trafiği örneğini alırsak, sonuç belirli bir caddenin aşırı bir araç akışı aldığını, ancak sistemin söz konusu fazlalığı çözmek için bize sihirli tarifler vermeyeceğini.
Sisteme sahip olmasına rağmen zeka çözümler önerebilen yapay, son sözü söylemek her zaman insan personelin görevi olacaktır.
Veri madenciliği, finansal olanlar başta olmak üzere çok sayıda disiplinde pratikte uygulanmaktadır.
Böylece, borsa (hisse senetlerinin davranışını tahmin etmek için) gibi bölümlerde de uygulamalar bulabiliriz. olduğu gibi, tam anlamıyla finansal olmayan ancak sektörle yakın ilişki içinde olan sektörler sigorta.
Doğal dil işleme, çevrimiçi aramalar veya akıllı arabalar, veri madenciliğinin uygulandığı diğer disiplinlerdir.
Fotolia fotoğrafları: Moartist / Thinglass
Veri Madenciliği Konuları