Big Data 3 Vs - koncepcijos ir modeliai

Turinys:

Big Data 3 Vs - koncepcijos ir modeliai
Big Data 3 Vs - koncepcijos ir modeliai

Video: Big Data 3 Vs - koncepcijos ir modeliai

Video: Big Data 3 Vs - koncepcijos ir modeliai
Video: 5 SCARY Videos Even Paranormal Experts FEAR - YouTube 2024, Lapkritis
Anonim

Terminas "duomenys" mums nėra naujas. Tai yra vienas iš pagrindinių dalykų, kuriuos mokoma, kai pasirenkate informacines technologijas ir kompiuterius. Jei galite prisiminti, duomenys laikomi žaliavine informacija. Nors jau dešimtmetį šis terminas Dideli duomenys yra "buzz" šiomis dienomis. Kaip matyti iš termino, apkrovos ir apkrovos duomenų yra dideli duomenys, ir juos galima apdoroti įvairiais būdais, naudodamiesi įvairiais metodais ir įrankiais norint gauti reikiamą informaciją. Šiame straipsnyje kalbama apie "Big Data" sąvokas, naudojant "3 V", kurį minėjo Dougas Laney, kuris yra duomenų saugojimo srities pradininkas, kuris, kaip manoma, inicijavo " Informatika (Informacinė ekonomika).

Prieš pradėdami, galbūt norėsite perskaityti mūsų straipsnius apie "Big Data" ir "Big Data" naudojimo pagrindus, kad suvoktumėte esmę. Jie gali prisidėti prie šio įrašo, norėdami išsamiau paaiškinti Big Data koncepcijas.
Prieš pradėdami, galbūt norėsite perskaityti mūsų straipsnius apie "Big Data" ir "Big Data" naudojimo pagrindus, kad suvoktumėte esmę. Jie gali prisidėti prie šio įrašo, norėdami išsamiau paaiškinti Big Data koncepcijas.

Dideli duomenys 3 vs

Duomenys didžiuliu pavidalu, sukauptais per įvairias priemones, buvo tinkamai užregistruoti skirtingose duomenų bazėse anksčiau ir po kurio laiko buvo nukritę. Kai pasirodė koncepcija, kad kuo daugiau duomenų, tuo lengviau išsiaiškinti - skirtingą ir svarbią informaciją - naudojant tinkamus įrankius, įmonės pradėjo saugoti duomenis ilgesniems laikotarpiams. Tai yra kaip naujų saugojimo įrenginių sukūrimas arba debesys, kad galėtumėte saugoti bet kokios formos duomenis, kurie buvo įsigyti: dokumentai, skaičiuoklės, duomenų bazės, HTML ir tt Tada jie yra tinkamai suformatuoti naudojant įrankius, galinčius apdoroti didžiules Duomenys.

PASTABA: "Big Data" apimtis neapsiriboja duomenimis, kuriuos renkate ir laikote patalpose ir debesyje. Tai gali apimti duomenis iš įvairių kitų šaltinių, įskaitant, bet neapsiribojant, viešojo naudojimo objektus.

Didžiųjų duomenų 3D modelis remiasi šiomis V:

  1. Tomas: tai duomenų saugojimo valdymas
  2. Greitis: nurodo duomenų apdorojimo spartą
  3. Veislė: nurodo skirtingų, atrodytų, nesusijusių duomenų rinkinių grupavimo duomenis

Toliau pateiktose pastraipose išsamiai paaiškinamas "Big Data" modeliavimas, kalbant apie kiekvieną dimensiją (kiekvieną V).

A] Didžiųjų duomenų kiekis

Kalbant apie didelius duomenis, garsą galima suvokti kaip didžiulę žalios informacijos rinkinį. Nors tai tiesa, tai taip pat yra duomenų saugojimo išlaidos. Svarbius duomenis galima laikyti patalpose ir debesyje, pastarieji yra lanksti parinktis. Bet ar reikia laikyti kiekvieną ir viską?

Pasak "Meta Group" išleisto pranešimo, kai padidėja duomenų kiekis, duomenų dalys pradeda ieškoti nereikalingų. Be to, jame teigiama, kad turėtų būti išsaugotas tik tas duomenų kiekis, kurį įmonės ketina naudoti. Kiti duomenys gali būti pašalinti arba įmonės nenori atsikratyti "tariamai nesvarbių duomenų", dėl jų gali būti dempingas dėl nepanaudotų kompiuterių įrenginių ir net juostų, kad įmonėms nereikėtų mokėti už tokių duomenų saugojimą.

Aš naudoju "tariamai nesvarbius duomenis", nes aš taip pat tikiu, kad bet kokio tipo duomenys gali būti reikalingi bet kuriai įmonei ateityje - anksčiau ar vėliau - ir todėl jį reikia laikyti pakankamai ilgą laiką, kol jūs žinote, kad duomenys tikrai yra nesvarbus. Aš asmeniškai išmesiu senesnius duomenis į kietąjį diską iš praeities metų ir kartais į DVD. Pagrindiniuose kompiuteriuose ir debesies saugykloje pateikiami duomenys, kuriuos manau svarbu ir kuriuos aš žinosiu. Tarp šių duomenų taip pat yra naudojami tiktai duomenys, kurie po kelių metų gali pasidaryti senojo HDD. Pirmiau pateiktas pavyzdys yra tik jūsų supratimas. Tai netinka "Big Data" aprašymui, nes suma yra gana mažesnė, palyginti su tuo, ką įmonės laiko dideliais duomenimis.

B ] Greitis dideliuose duomenyse

Duomenų apdorojimo greitis yra svarbus veiksnys kalbant apie "Big Data" sąvokas. Yra daug svetainių, ypač elektroninės komercijos. "Google" jau prisipažino, kad greitis, per kurį puslapio apkrova yra būtina siekiant geresnio reitingavimo. Be reitingų, greitis taip pat suteikia komforto vartotojams, kai jie perka. Tas pats pasakytina apie duomenis, kurie yra apdorojami kitai informacijai.

Kalbėdamas apie greitį, svarbu žinoti, kad tai yra tik didesnė pralaidumo riba. Jis sujungia lengvai naudojamus duomenis su skirtingomis analizės priemonėmis. Paprastai naudojami duomenys reiškia kai kuriuos namų darbus, kad būtų sukurtos lengvai apdorojamos duomenų struktūros. Kitas aspektas - įvairovė, toliau plinta apie tai.

C] Didžiųjų duomenų įvairovė

Kai yra apkrovų ir apkrovų duomenų, svarbu juos tvarkyti taip, kad analizės priemonės galėtų lengvai apdoroti duomenis. Taip pat yra ir duomenų tvarkymo įrankiai. Laikant duomenis, duomenys gali būti nestruktūruojami ir bet kokia forma. Jums reikia išsiaiškinti, kokius ryšius jis turi su kitais duomenimis su jumis. Kai išsiaiškinsite ryšį, galėsite surasti tinkamus įrankius ir konvertuoti duomenis į norimą struktūrizuotą ir rūšiuotą saugyklą.

Image
Image

Santrauka

Kitaip tariant, "Big Data" 3D modelis yra pagrįstas trimis aspektais: USBLE duomenimis, kuriuos turite; tinkamas duomenų žymėjimas; ir greitesnis apdorojimas. Jei šie trys rūpinasi, jūsų duomenys gali būti lengvai apdorojami ar analizuojami, kad išsiaiškintumėte, ko norite.

Pirmiau paaiškinamos abi sąvokos ir "Big Data" 3D modelis. Straipsniai, susiję su antrąja para, bus papildoma parama, jei esate naujoji sąvoka.

Jei norite ką nors įtraukti, prašome komentuoti.

Rekomenduojamas: