Kas yra "Data Science" ir kaip tapti "Data Scientist"?

Turinys:

Kas yra "Data Science" ir kaip tapti "Data Scientist"?
Kas yra "Data Science" ir kaip tapti "Data Scientist"?
Anonim

Duomenų mokslas yra ne tik apie duomenis. Bare pagrindai atpažįsta, kokius duomenis reikia saugoti, nurodant, kaip juos apdoroti skirtingiems rezultatams. Tai nesibaigia. Duomenų mokslininkams reikia išsiaiškinti duomenų tuščius duomenis ir užpildyti juos duomenimis, kurie "gali" ateityje. "Duomenų mokslo" iš esmės yra taškų jungimas įmonėje ir esamų ir neegzistuojančių duomenų naudojimas, kad atitiktų kiekvieno verslo poreikius.

Duomenų mokslas yra viena iš karščiausi technologijų sričių, taigi ir duomenų mokslininkų visame pasaulyje poreikis. Iš tiesų paskelbta ir nauja "Microsoft" sertifikavimo programa, vadinama "Microsoft" profesinio mokymo programa.

Kas yra duomenų mokslas

Dauguma mūsų nuomone, duomenų mokslas yra tik statistika. Jei naudojate statistiką, galėsite atstovauti numerius bet kokiu būdu: diagramas, infografacijas ir kt. Ar galėsite identifikuoti skirtingus skirtingų sričių verslo poreikius? Ar galite "numatyti" duomenis? Ar galėsite užpildyti reikalingus duomenis, bet dar negalima? Šie klausimai nepriklauso vien statistikai.
Dauguma mūsų nuomone, duomenų mokslas yra tik statistika. Jei naudojate statistiką, galėsite atstovauti numerius bet kokiu būdu: diagramas, infografacijas ir kt. Ar galėsite identifikuoti skirtingus skirtingų sričių verslo poreikius? Ar galite "numatyti" duomenis? Ar galėsite užpildyti reikalingus duomenis, bet dar negalima? Šie klausimai nepriklauso vien statistikai.

Kas yra duomenų mokslas? Leiskite tai patikrinti, išvardydami kiekvieną žingsnį, kad būtų rodomas bendras vaizdas. Taigi tokį sakinį sunku paaiškinti vienu sakiniu, bet aš pabandysiu. Duomenų mokslas - tai mokslas, leidžiantis identifikuoti duomenis skirtingais tikslais, identifikuoti verslo poreikius informacijos, apdoroti duomenis naudodamasis įrankiais, kad būtų galima pateikti informaciją, reikalingą, kad įmonė galėtų klestėti. Taigi , Duomenų mokslas yra šiek tiek visko. Tai apima ne tik statistinius įgūdžius, bet ir šiek tiek valdymo įgūdžius, kai kurių kalbų apdorojimą, tyrimo įgūdžius, šiek tiek žinias apie mašiną ir išsamų supratimą apie tai, kokie įrankiai reikalingi norint pasiekti norimų rezultatų.

Duomenų mokslas apima visus toliau išvardytus dalykus, nepriklausomai nuo to, kas viskas naudojama įmonėje:

  1. Duomenų poreikio kūrimas
  2. Duomenų rinkinių suskirstymas pagal jų galimą naudojimą
  3. Strateginis duomenų rinkinių saugojimas prielaidoje arba debesyje; abiem atvejais duomenų rinkiniai turėtų būti nedelsiant prieinami pagal pareikalavimą
  4. Supratimas apie verslo procesų srautus ir tai, kaip skirtingi duomenų rinkiniai yra naudingi kiekvienam
  5. Suprasti verslo sprendimus, kad padėtų verslui geriau
  6. Gebėjimas apdoroti duomenis naudojant įvairius įrankius: skaičiuokles, duomenų bazes, programavimo kalbas ir tt, kad atitiktų verslo procesų poreikius.
  7. Gebėjimas numatyti, kokie duomenys bus gauti artimiausiu metu, ir naudoti juos esamiems procesams
  8. Analizuodami proceso rezultatus ir grįžkite prie piešimo lentos, kad padarytumėte geriau

Aukščiau pateiktas sąrašas nėra išsamus, tačiau pabrėžia pagrindinius duomenų mokslo aspektus. Kaip rodo pirmasis teiginys, duomenų mokslininkams reikia sugebėti įtikinti įmones, kad visi duomenys yra naudingi, todėl jie turėtų būti saugomi ilgą laiką. Ar galbūt naudosite senus senus duomenų bazes apie dalijamą debesį 10-15 metų, kad galėtumėte juos pažvelgti ir kurti veiksmingesnes duomenų bazes? Bet koks poreikis gali atsirasti, kai verslo aplinka nuolat keičiasi. Žemės kaita, verslo procesų pokyčiai ir duomenys turi būti pritaikyti. Taigi, kuo daugiau duomenų turite, tuo efektyviau būsite.

Reikalavimai ir reikalavimai tapti duomenų mokslininku

Trečiojoje pastraipoje bandiau apibūdinti duomenų mokslą kaip rinkodaros, vadybos, statistinio, mašinų mokymosi mokslo susivienijimą. Paprasčiausiai statistikos įgūdžių nepakaks. Jums reikės daugiau nei to.

Image
Image

Pirmiausia jums reikės Matematikos įgūdžiai. Be paprastos aritmetos, jie bus skaičiavimai ir algebra. Sužinokite metrinę sistemą skaičiavimams, kaip jie būtų tikslūs. Jūs turite būti geras permutacijas ir derinius. Matematikos sertifikatų kursas gali apimti visus šiuos dalykus. Kurseroje yra ir internetinių kursų.

Tai padės, jei turėsite patirties ar žinių apie komandos valdymą. Panašiai, verslo vadybos diplomai ir diplomai suteiks jums pranašumą.

Turėsite išmokti bent vieną duomenų tvarkymo kalbą. Iš reklamų aš mačiau Python ir R visada yra paklausa. R yra dalis Hadoopas todėl, jei turite "Hadoop" sertifikatą, jūsų galimybės būti įdarbintai padidės.

Reikalavimai tapti duomenų mokslininku nuolat keisis, nes vis daugiau dalykų pridedama prie duomenų mokslo. Pavyzdžiui, mašininio mokymosi treniruotės metu bus daug nuveikti, kad būtų galima atlikti gerą darbą šioje srityje, nes kiekvieną kartą šiomis dienomis daugiausia dėmesio skiriama AI.

"Data Scientist" pareigybių aprašai skiriasi nuo verslo įmonių. Vietoje, jiems tiesiog reikia analizės, o kai kur kitur, jie norės, kad dirbtiniam intelektualumui dirbtų duomenų mokslininkai. Pažiūrėkite sąrašą, kurį parašiau, kad paaiškintų "Data Science". Kuo daugiau taškų galite padengti, tuo geriau jums bus.

Jei vis tiek turite klausimų apie tai, kas yra duomenų mokslas arba kokie reikalavimai tampa "Data Scientist", palikite komentarų. Aš pabandysiu atsakyti už jus.

Susijusios žinutės:

  • Kas yra "mašininis mokymasis" ir kaip jis skiriasi nuo dirbtinio intelekto
  • "Microsoft" mokymosi partneris: reikalavimai, privalumai, kaip tapti viena
  • Skirtumas tarp SQL ir NoSQL: palyginimas
  • Patarimai, kaip tapti "Microsoft MVP" arba MKC
  • "Microsoft" profesinio mokymo programa duomenų mokslo srityje

Rekomenduojamas: