Labai priklausys nuo ketvirtosios pramonės revoliucijos pamatų Duomenys ir Ryšiai. Analizės paslaugos kuris gali kurti ar kurti duomenų gavybos sprendimus, vaidins pagrindinį vaidmenį šiuo atžvilgiu. Tai galėtų padėti analizuoti ir prognozuoti klientų pirkimo elgseną, taikomą potencialiems pirkėjams. Duomenys taptų nauju gamtos išteklių šaltiniu, o atitinkamos informacijos išgauti iš šių nerūšių duomenų procesas bus nepaprastai svarbus. Tokiu atveju tinkamas termino supratimas - Duomenų gavyba, jo procesai ir taikymas gali mums padėti sukurti holistinį požiūrį į šį žodį.
Duomenų gavybos pagrindai ir metodai
Duomenų gavyba, taip pat žinoma kaip Žinių atradimas duomenimis (KDD) yra ieškoti didelių duomenų saugyklų, norint atskleisti modelius ir tendencijas, kurios apima ne tik paprastą analizę. Tačiau tai nėra vienkartinis sprendimas, tačiau tai yra daugiapakopis procesas ir užbaigtas įvairiais etapais. Jie apima:
1] Duomenų rinkimas ir paruošimas
Tai prasideda nuo duomenų rinkimo ir tinkamo jos organizavimo. Tai padeda gerokai padidinti informacijos, kurią galima rasti per duomenų gavybą, ieškojimo galimybes
2] modelio kūrimas ir vertinimas
Antrasis duomenų gavybos proceso etapas yra įvairių modeliavimo metodų taikymas. Jie naudojami parametrams kalibruoti iki optimalių verčių. Taikomi metodai daugiausia priklauso nuo analitinių pajėgumų, reikalingų organizacinių poreikių diapazonui spręsti ir priimti sprendimą.
Išnagrinėsime kai kuriuos duomenų gavybos būdus. Nustatyta, kad dauguma organizacijų kartu sujungia du ar daugiau duomenų gavybos būdų, kad sudarytų tinkamą procesą, atitinkantį jų verslo poreikius.
Skaitykite: Kas yra dideli duomenys?
Duomenų gavybos metodai
- Asociacija - Asociacija yra viena iš plačiai žinomų duomenų gavybos technologijų. Pagal tai modelis yra iššifruojamas, atsižvelgiant į santykius tarp to paties sandorio elementų. Taigi taip pat žinomas kaip ryšio metodas. Dideli prekių ženklų mažmenininkai remiasi šia technika, norėdami ištirti klientų pirkimo įpročius / pageidavimus. Pvz., Stebėdamas žmonių pirkimo įpročius, mažmenininkai gali nustatyti, kad pirkėjas visada perka šokoladą kremu, todėl siūlo, kad kitą kartą perkant saldainius jie taip pat norėtų pirkti kremą.
- klasifikacija - Ši duomenų gavybos technika skiriasi nuo aukščiau išdėstytų būdų taip, kad jis grindžiamas mašininiu mokymu ir naudoja matematinius metodus, tokius kaip linijinis programavimas, sprendimų medžiai, neuroninis tinklas. Klasifikavime įmonės bando sukurti programinę įrangą, kuri gali išmokti klasifikuoti duomenų elementus į grupes. Pavyzdžiui, įmonė gali apibrėžti paraiškoje pateiktą klasifikaciją, kad "atsižvelgiant į visus darbuotojų, kurie pasiūlė atsistatydinti iš įmonės, įrašus, numatyti asmenų, kurie gali atsistatydinti iš bendrovės ateityje, skaičius". Pagal tokį scenarijų bendrovė gali klasifikuoti darbuotojų įrašus į dvi grupes, ty "palikti" ir "likti". Tada ji gali naudoti savo duomenų gavimo programinę įrangą, kad darbuotojus būtų galima klasifikuoti į atskiras anksčiau sukurtas grupes.
- Klasteriavimas - Įvairūs objektai, pasižymintys panašiomis savybėmis, automatiškai suskaidomi į vieną klasterį. Daug tokių klasterių yra sukurtos klasėms ir objektams (su panašiomis savybėmis). Norėdami tai geriau suprasti, apsvarstykime knygų valdymo pavyzdį bibliotekoje. Bibliotekoje yra didžiulė knygų kolekcija. Vieno tipo daiktai yra išvardyti kartu. Dėl to mums lengviau rasti mūsų interesų knygą. Panašiai, naudojant klasterizavimo techniką, mes galime laikyti knygas, kurios turi tam tikrų panašumų viename klasteryje, ir priskirti jam tinkamą pavadinimą. Taigi, jei skaitytojas nori paimti knygą, susijusią su jo susidomėjimu, jis turi eiti tik į tą lentyną, o ne ieškoti visoje bibliotekoje. Taigi, klasterizavimo technika apibrėžia klases ir pateikia objektus kiekvienoje klasėje, o klasifikavimo metoduose objektai priskiriami į iš anksto apibrėžtas klases.
- Prognozė - Prognozė yra duomenų paieškos metodas, kuris dažnai naudojamas kartu su kitais duomenų gavybos metodais. Tai apima analizuojant tendencijas, klasifikaciją, modelio atitikimą ir santykį. Analizuojant praeities įvykius ar atvejus tinkama seka, galima saugiai numatyti būsimą įvykį. Pavyzdžiui, nuspėjimų analizės metodas gali būti naudojamas parduoti prognozuojant būsimą pelną, jei pardavimas yra pasirinktas kaip nepriklausomas kintamasis ir pelnas yra kintamasis, priklausomas nuo pardavimo. Tada, remiantis istoriniais pardavimo ir pelno duomenimis, galima parengti pritaikytą regresijos kreivę, kuri naudojama prognozuojant pelną.
- Sprendimų medžiai - Sprendimų medyje mes pradedame nuo paprasto klausimo, turinčio keletą atsakymų. Kiekvienam atsakymui atsiranda kitas klausimas, padedantis klasifikuoti ar identifikuoti duomenis, kad jį būtų galima suskirstyti į kategorijas, arba kad būtų galima numatyti pagal kiekvieną atsakymą. Pavyzdžiui, mes naudojame šį sprendimų medį, norėdami nustatyti, ar atsispirti kriketo ODI ar ne. Sprendimų medis duomenų gavybai: pradedant šakniniame mazge, jei orų prognoze prognozuoja lietų, tada turėtume vengti rungtynių už tą dieną. Arba, jei orų prognozė yra aiški, mes turėtume žaisti.
Duomenų gavyba yra analizės pastangų visose pramonės šakose ir disciplinose, tokiose kaip ryšiai, draudimas, švietimas, gamyba, bankininkystė, mažmeninė prekyba ir kt., Pagrindas. Todėl, prieš taikydami skirtingus metodus, svarbu turėti teisingą informaciją apie tai.