Pașii de top pentru stăpânirea științei datelor, credeți-mă că i-am încercat
Publicat: 2017-10-10Thulasiram a primit Diploma PG în Data Analytics de la UpGrad și IIIT-Bangalore și acum lucrează la UpGrad ca Asociat de Program pentru Analiza Datelor la UpGrad .
Cu ani în urmă, am citit o poveste din cartea Călugărul care și-a vândut Ferrari -ul , o poveste pe care mi-o amintesc până astăzi.
A fost odată un profesor renumit pentru abilitățile sale de tir cu arcul. Se spunea că săgeata profesorului nu va rata niciodată ochiul taurului. Abilitățile sale au atras mulți studenți. Într-o zi, profesorul i-a cerut unuia dintre elevii săi să-l lega la ochi. Apoi, i-a cerut studentului să stabilească o țintă și să-i dea arcul și săgeata. Toți elevii și-au ținut respirația și îl priveau pe profesor. În inimile lor, erau siguri că săgeata profesorului va lovi ținta. În timp ce toată lumea privea cu răsuflarea tăiată, săgeata profesorului a părăsit arcul și a ratat ținta! Elevii au rămas uluiți. Unul dintre elevi i-a scos maestrul legat la ochi și l-a întrebat: „Cum ai putut să ratezi ținta?” Maestrul a raspuns:
„Nu se poate lovi o țintă pe care nu o poate vedea!”

Cu mult timp în urmă, am participat la un eveniment de formare a profesorilor. Într-una dintre prelegeri, ni s-a spus că ar trebui să informăm studenții în prealabil despre ceea ce vor învăța într-o anumită sesiune, deoarece asta îi va ajuta să se pregătească mai bine pentru ceea ce va urma. Învățarea are loc cel mai bine atunci când elevii știu de ce învață ceea ce învață și cum poate fi utilizat. Contextul ajută la facilitarea învățării. În procesul încercării de a rezolva o problemă dificilă în moduri creative, învățarea are loc în mod natural, iar ceea ce învățăm rămâne cu noi.
Cum putem aplica aceste principii generale în știința datelor? Primul pas în stăpânirea științei datelor este de a avea un obiectiv măsurabil. Ar trebui să aveți o pasiune și dragoste pentru date. În Digi-verse de astăzi, este ușor să te pierzi sau să te distragi. Echilibrarea muncii, familiei și învățării face totul cu atât mai complicat. Deci, este esențial să stabiliți un obiectiv de învățare și să-l urmați cu meticulozitate.
Ghid de pornire pentru analiza datelor
În al doilea rând, practica este o necesitate pentru a stăpâni orice abilitate. În cartea Outliers , Malcolm Gladwell susține că este nevoie de 10.000 de ore pentru a stăpâni o abilitate. Există un pic de controversă în jurul acestui număr, dar un lucru este clar: fără practică, măiestria în orice abilitate nu poate fi obținută. Știința datelor nu face excepție. Cea mai bună abordare este să lucrezi la o problemă la care îți pasă, una care te inspiră. Învățarea de dragul învățării nu va dura mult, iar teoria va fi uitată pe parcurs.
Recent, am citit un articol despre un student care a ajutat la rezolvarea problemei depistarii cancerului ocular prin analiza imaginilor disponibile publicului. Ea a învățat tot ce era necesar pentru a rezolva problema pe drum și a realizat ceva grozav. Știința datelor, prin definiție, este un subiect interdisciplinar. Acesta implică algebră liniară, programare, statistică, infrastructură de calculatoare și multe alte domenii. Această listă lungă este intimidantă pentru noi toți care am dori să trecem prin porțile științei datelor.
Prin urmare, vă va face bine să vă concentrați inițial pe doi sau trei algoritmi și să încercați să îi aplicați problemelor pe care le alegeți. În loc să înveți puțin despre toți algoritmii de sub soare, explorați câțiva în profunzime. În prezent, resursele din lumea noastră sunt foarte puține, iar cererea pentru ele este mult prea mare. Folosirea științei datelor în moduri optime ne poate ajuta să găsim modalități de a utiliza cel mai bine aceste resurse limitate.
Mai mult, încercați să experimentați atunci când lucrați la o problemă. Există mai multe moduri în care ai putea proceda și o vei ști pe cea potrivită doar după ce o vei încerca. Experimentele vă vor face gata să îndepliniți sarcini de știință a datelor, cum ar fi îmbunătățirea acurateței algoritmilor, reducerea timpului de execuție, paralelizarea execuției, pregătirea modelului pentru producția etc. În multe dintre interviurile de angajare pe care le-am oferit, un întrebarea era despre seturile de date pe care le-am gestionat sau despre problemele din lumea reală pe care le rezolvasem. Lucrul la o problemă va fi cu siguranță un mare atu și în căutarea de locuri de muncă. 
Comunicarea rezultatelor este la fel de importantă ca și analiza în sine. Știința datelor înseamnă povestea. Într-un alt interviu, am fost întrebat -

„Cum îi vei explica bunicii tale mediana?”
A trebuit să improvizez pentru a explica jargonul complex în cuvinte simplificate. Într-o organizație, conducerea nu va fi adesea conștientă de jargon, iar comunicarea simplă și eficientă va fi cheia. Încercați să explicați copiilor (sau bunicilor!) conceptele științei datelor și vedeți dacă înțeleg.
Salariile cercetătorilor și analiștilor de date
În cele din urmă, totul se rezumă la vizibilitate și prezență. În calitate de cercetător de date aspirant, este esențial să vă îmbunătățiți vizibilitatea digitală. Creați un cont GitHub și încărcați toate proiectele pentru prezentare. Contribuiți la bloguri despre știința datelor. Alăturați-vă grupurilor de știință a datelor și contribuiți la discuțiile în curs. Încercați să răspundeți la întrebările de pe Quora, Reddit și alte forumuri populare.
Acestea sunt câteva dintre meditațiile mele despre mersul pe calea lungă către stăpânirea științei datelor. Cu siguranță veți avea alte idei sau sugestii. Vă rugăm să vă împărtășiți gândurile, articolele, videoclipurile și podcas-urile sau orice altceva despre care simțiți că va fi de ajutor colegilor dvs. în timp ce aceștia parcurg această cale anevoioasă, dar incitantă și extrem de împlinită cu tine!
Care este rolul unui Data Scientist?
Oamenii de știință de date lucrează într-o varietate de industrii, colaborând cu alții pentru a dezvolta algoritmi care pot organiza și recupera cantități mari de date. Aceste date sunt utilizate pentru a examina acțiunile trecute ale companiei, pentru a formula strategii și pentru a face planuri de viitor. În plus, oamenii de știință de date lucrează cu o varietate de părți interesate din cadrul unei organizații sau afaceri pentru a recomanda cel mai bun curs de acțiune pe baza datelor lor. Aceștia sunt responsabili cu explicarea jargonului tehnologic complicat, cum ar fi învățarea automată, big data și modelarea matematică, profesioniștilor non-tech.
Care sunt abilitățile necesare pentru a urma o carieră în știința datelor?
Știința datelor este, fără îndoială, una dintre profesiile cu cea mai rapidă expansiune în ceea ce privește perspectivele de angajare. Știința datelor este utilizată într-o varietate de aplicații, de la simple previziuni de vânzări la automobile cu conducere autonomă și asistenți personali. Nu este surprinzător faptul că un Data Scientist calificat este la mare căutare. Așadar, pentru a stăpâni Data Science trebuie să dobândești niște abilități tehnice și non-tehnice, cum ar fi programarea Python și R, Hadoop, baze de date SQL, învățare automată și AI, vizualizare a datelor, strategii de afaceri, comunicare, povestire, perspicacitate în afaceri etc.
Care este semnificația științei datelor?
În primul rând, companiile și organizațiile pot transforma o cantitate mare de date nestructurate și brute în perspective relevante cu ajutorul tehnologiei științei datelor. În al doilea rând, fie că este o companie uriașă sau un start-up, știința datelor devine din ce în ce mai populară. Pentru o experiență mai bună pentru clienți, companii precum Google, Amazon, Netflix și altele care se ocupă cu o mulțime de date folosesc algoritmi de știință a datelor. În cele din urmă, știința datelor ajută la automatizarea transportului, cum ar fi dezvoltarea unui automobil autonom, care este modul de transport al viitorului. De asemenea, diferite sondaje, alegeri, confirmarea biletelor de avion și alte predicții pot beneficia toate de știința datelor.
