მონაცემთა მოპოვების განმარტება
Miscellanea / / July 04, 2021
გილემ ალსინა გონსალესის მიერ, ნოემბერში. 2018
მე მესმოდა მაქსიმა, რომ მონაცემები ახალი ზეთია, მაგრამ თუ ჩვენ უნდა ვიმსჯელოთ ერთ-ერთი დისციპლინის სახელით, რომელიც მის ექსპლუატაციასა და გამოყენებას ეხება, ე.წ. სამთო მონაცემთამე მირჩევნია მათ "ახალ ნახშირს" ვუწოდო, მათი ფორმის ანალოგიით მოპოვება.
მონაცემთა მოპოვება არის დისციპლინა, რომელიც მოიცავს მონაცემების დიდი კოლექციის ავტომატიზირებული სტატისტიკური დასკვნების გამოტანას.
ეს მონაცემები შეიძლება მრავალი წყაროდან მომდინარეობდეს, ჰქონდეს სხვადასხვა სტრუქტურა, ან სტრუქტურირებულიც კი არ იყოს. ამ მიზეზით, მონაცემთა მოპოვება მოიცავს სისტემებს ხელოვნური ინტელექტი და მანქანა სწავლა შეუძლია ადაპტირება მოახდინოს არასტრუქტურულ მონაცემებთან და გაატაროს იგი ფილტრების საშუალებით, რაც საშუალებას იძლევა მისი ანალიზი.
საბოლოო ჯამში, საქმე იმაშია, რომ დასკვნები ემსახურება გადაწყვეტილების მიღება გარკვეულ სისტემაზე, რომელიც შეიძლება ძალიან მრავალფეროვანი იყოს: ქალაქის ან რეგიონის საგზაო მოძრაობიდან დაწყებული დებულება მეხანძრეებისა და სხვა საჯარო სამსახურების შესაძლო საგანგებო სიტუაციების მოსაგვარებლად.
ეს ასევე ეხება იმ ნიმუშების გამოვლენას, რომლებსაც მონაცემები მისდევს და რომლებიც აქამდე იმალებოდა ან ჩვენ ვერ დავინახავდით მათ გარკვევით, ყველა მორაში, არსებული მონაცემების დიდი რაოდენობით.
რა განასხვავებს მონაცემების მოპოვებას დიდი მონაცემები? კარგად, სამთო საქმე ეხება მხოლოდ ანალიზს, ხოლო მაინინგი დიდი მონაცემები ეს არის დისციპლინა, რომელიც პასუხისმგებელია მონაცემთა აღებაზე და შენახვაზე, აგრეთვე მის ადმინისტრირებაზე.
რომ გააანალიზოს მონაცემები სწორად, უპირველეს ყოვლისა, უნდა განვსაზღვროთ რამდენიმე მიზანი, რომლებთანაც მივდივართ ანალიზი, კითხვების სერია, რომლებზეც პასუხი უნდა ვიპოვოთ, ვინაიდან ეს სად მივყავართ უნდა ვიძიოთ.
ამ კითხვებიდან დაწყებული, შენობის სახით, ჩვენ ვირჩევთ მონაცემებს დასამუშავებლად (შეიძლება მხოლოდ ჩვენ გვჭირდება მონაცემთა ბაზადა არა ყველა).
დამუშავების ფაზა განსხვავდება თითოეულ შემთხვევაში და ის იყენებს ხელოვნური ინტელექტის ინსტრუმენტებს და მანქანა სწავლა, რათა მათ შეძლონ დინამიურად მოერგონ შეყვანილ მონაცემებს, საჭიროების შემთხვევაში შეცვალონ თავიანთი ოპერაციები.
ამ დამუშავების საბოლოო პროდუქტი უნდა იყოს დასკვნების სერია, მაგრამ მოდით არ ავურიოთ ეს სისტემაში პასუხისმგებელი პირების მიერ ან ვინც საბოლოო გადაწყვეტილებას იღებს. ეს დასკვნები შეეხება გაანალიზებული მონაცემების მოცულობას.
თუ ისევ ავიღებთ ქალაქში საგზაო მოძრაობას, შეგვიძლია მივიღოთ დასკვნა რომ გარკვეული ქუჩა იღებს მანქანების გადაჭარბებულ ნაკადს, მაგრამ სისტემა არ მოგვცემს ჯადოსნურ რეცეპტებს ხსენებული ჭარბი რაოდენობის მოსაგვარებლად.
მიუხედავად იმისა, რომ სისტემა ფლობს ინტელექტი ხელოვნურს, რომელსაც გადაწყვეტილებების შემოთავაზება შეუძლია, ადამიანის პერსონალის ამოცანა იქნება ყოველთვის თქვან ბოლო სიტყვა.
მონაცემთა მოპოვება პრაქტიკაში გამოიყენება დიდი რაოდენობით დისციპლინებში, რომელთა შორისაც გამოირჩევა ფინანსური.
ამრიგად, განაცხადების პოვნა შეგვიძლია ისეთ სექციებში, როგორიცაა საფონდო ბირჟა (აქციების ქცევის პროგნოზირება), აგრეთვე აქ სექტორები, რომლებიც არ არიან მკაცრად ფინანსური, მაგრამ ახლო ურთიერთობა აქვთ სექტორთან, როგორც ეს ხდება დაზღვევა.
ბუნებრივი ენის დამუშავება, ონლაინ ძებნა ან ჭკვიანი მანქანები სხვა დარგებია, სადაც მონაცემთა მოპოვება ხორციელდება.
ფოტოლიას ფოტოები: Moartist / Thinglass
თემები მონაცემთა მოპოვებაში