Najważniejsze kroki do opanowania nauki o danych, zaufaj mi, że ich wypróbowałem
Opublikowany: 2017-10-10Thulasiram otrzymał dyplom PG w dziedzinie analizy danych od UpGrad i IIIT-Bangalore, a teraz pracuje w UpGrad jako współpracownik programu ds. analizy danych w UpGrad .
Przed laty przeczytałem historię z książki Mnich, który sprzedał swoje Ferrari , historię, którą pamiętam do dziś.
Był kiedyś nauczyciel znany ze swoich umiejętności łuczniczych. Mówiono, że strzała nauczyciela nigdy nie trafi w dziesiątkę. Jego umiejętności przyciągały wielu uczniów. Pewnego dnia nauczyciel poprosił jednego ze swoich uczniów o zawiązanie mu oczu. Następnie poprosił ucznia o ustawienie tarczy i przekazanie mu łuku i strzały. Wszyscy uczniowie wstrzymali oddech i obserwowali nauczyciela. W głębi serca byli pewni, że strzała nauczyciela trafi w cel. Gdy wszyscy patrzyli z zapartym tchem, strzała nauczyciela opuściła łuk i nie trafiła w cel! Studenci byli oszołomieni. Jeden z uczniów zdjął mistrzowi opaskę z oczu i zapytał go: „Jak mogłeś nie trafić w cel?” Mistrz odpowiedział:
„Nie można trafić w cel, którego się nie widzi!”

Dawno temu uczestniczyłem w szkoleniu nauczycieli. Na jednym z wykładów powiedziano nam, że powinniśmy z wyprzedzeniem informować studentów o tym, czego nauczą się na danej sesji, ponieważ pomoże im to lepiej przygotować się na to, co nadejdzie. Uczenie się odbywa się najlepiej, gdy uczniowie wiedzą, dlaczego uczą się tego, czego się uczą i jak mogą to wykorzystać. Kontekst ułatwia naukę. W procesie twórczego rozwiązywania trudnego problemu uczenie się pojawia się naturalnie, a to, czego się uczymy, zostaje z nami.
Jak możemy zastosować te ogólne zasady do nauki o danych? Pierwszym krokiem w opanowaniu nauki o danych jest wyznaczenie wymiernego celu. Powinieneś mieć pasję i miłość do danych. W dzisiejszym Digi-verse łatwo się zgubić lub rozproszyć. Równoważenie pracy, rodziny i nauki jeszcze bardziej komplikuje sprawę. Dlatego ważne jest, aby wyznaczyć sobie cel uczenia się i skrupulatnie go realizować.
Przewodnik startowy po analizie danych
Po drugie, praktyka jest koniecznością, aby opanować każdą umiejętność. W książce Outliers Malcolm Gladwell twierdzi, że opanowanie umiejętności zajmuje 10 000 godzin. Jest trochę kontrowersji wokół tej liczby, ale jedno jest jasne: bez praktyki nie można osiągnąć mistrzostwa w żadnej umiejętności. Nauka o danych nie jest wyjątkiem. Najlepszym podejściem jest praca nad problemem, na którym Ci zależy, który Cię inspiruje. Nauka dla samego uczenia się nie potrwa długo, a po drodze teoria zostanie zapomniana.
Niedawno przeczytałem artykuł o studentce, która pomogła rozwiązać problem wykrywania raka oka poprzez analizę publicznie dostępnych obrazów. Po drodze nauczyła się wszystkiego, co jest potrzebne do rozwiązania problemu i osiągnęła coś wspaniałego. Nauka o danych z definicji jest przedmiotem interdyscyplinarnym. Obejmuje algebrę liniową, programowanie, statystykę, infrastrukturę komputerową i wiele innych dziedzin. Ta długa lista jest onieśmielająca dla nas wszystkich, którzy chcieliby przejść przez bramy nauki o danych.
Dlatego dobrze będzie początkowo skoncentrować się na dwóch lub trzech algorytmach i spróbować zastosować je do wybranych problemów. Zamiast uczyć się trochę o wszystkich algorytmach pod słońcem, zbadaj kilka dogłębnie. Obecnie zasobów w naszym świecie jest bardzo mało, a zapotrzebowanie na nie jest zbyt duże. Korzystanie z nauki o danych w optymalny sposób może pomóc nam znaleźć sposoby na najlepsze wykorzystanie tych ograniczonych zasobów.
Co więcej, spróbuj poeksperymentować, gdy pracujesz nad problemem. Istnieje kilka sposobów, aby kontynuować, a właściwy poznasz dopiero po wypróbowaniu. Eksperymenty przygotują Cię do wykonywania zadań związanych z analizą danych, takich jak poprawa dokładności algorytmów, skrócenie czasu realizacji, zrównoleglenie wykonania, przygotowanie modelu do produkcji itp. W wielu rozmowach kwalifikacyjnych, które przeprowadziłem, Pytanie dotyczyło zestawów danych, z którymi miałem do czynienia, lub rzeczywistych problemów, które rozwiązałem. Praca nad problemem z pewnością będzie również dużym atutem w poszukiwaniu pracy. 
Przedstawienie wyników jest równie ważne, jak sama analiza. Nauka o danych polega na opowiadaniu historii. W innym wywiadzie poproszono mnie:

„Jak wyjaśnisz swoją babci medianę?”
Musiałem improwizować, aby wyjaśnić skomplikowany żargon w uproszczonych słowach. W organizacji kierownictwo często nie będzie świadome żargonu, a kluczem będzie prosta i skuteczna komunikacja. Spróbuj wyjaśnić dzieciom (lub dziadkom!) pojęcia związane z nauką o danych i sprawdź, czy rozumieją.
Wynagrodzenia naukowców i analityków danych
Wreszcie wszystko sprowadza się do widoczności i obecności. Jako początkujący naukowiec zajmujący się danymi ma kluczowe znaczenie dla poprawy Twojej cyfrowej widoczności. Utwórz konto GitHub i prześlij wszystkie swoje projekty do prezentacji. Współtwórz blogi dotyczące nauki o danych. Dołącz do grup zajmujących się nauką o danych i weź udział w toczących się dyskusjach. Spróbuj odpowiedzieć na pytania na Quora, Reddit i innych popularnych forach.
Oto niektóre z moich medytacji na temat kroczenia długą ścieżką do mistrzostwa w nauce danych. Na pewno będziesz miał inne pomysły lub sugestie. Podziel się swoimi przemyśleniami, artykułami, filmami i podcastami lub cokolwiek innego, co Twoim zdaniem będzie pomocne dla Twoich rówieśników, gdy będą kroczyć z Tobą tą żmudną, ale ekscytującą i niezwykle satysfakcjonującą ścieżką!
Jaka jest rola Data Scientist?
Analitycy danych pracują w różnych branżach, współpracując z innymi w celu opracowania algorytmów, które mogą organizować i pobierać ogromne ilości danych. Dane te są wykorzystywane do badania przeszłych działań firmy, formułowania strategii i tworzenia planów na przyszłość. Ponadto naukowcy zajmujący się danymi współpracują z różnymi interesariuszami w całej organizacji lub firmie, aby na podstawie ich danych zarekomendować najlepszy sposób działania. Zajmują się wyjaśnianiem skomplikowanego żargonu technologicznego, takiego jak uczenie maszynowe, duże zbiory danych i modelowanie matematyczne, specjalistom spoza branży.
Jakie umiejętności są wymagane do kontynuowania kariery w Data Science?
Data Science jest niezaprzeczalnie jednym z najszybciej rozwijających się zawodów pod względem perspektyw zatrudnienia. Data Science jest wykorzystywana w różnych zastosowaniach, od prostego prognozowania sprzedaży po autonomiczne samochody i osobiści asystenci. Nic dziwnego, że istnieje duże zapotrzebowanie na wykwalifikowanego analityka danych. Tak więc, aby opanować Data Science, należy zdobyć pewne techniczne i nietechniczne umiejętności, takie jak programowanie w Pythonie i R, Hadoop, bazy danych SQL, uczenie maszynowe i sztuczna inteligencja, wizualizacja danych, strategie biznesowe, komunikacja, opowiadanie historii, wyczucie biznesowe itp.
Jakie jest znaczenie Data Science?
Po pierwsze, firmy i organizacje mogą przekształcić dużą ilość nieustrukturyzowanych i nieprzetworzonych danych w istotne informacje za pomocą technologii analizy danych. Po drugie, niezależnie od tego, czy jest to ogromna firma, czy start-up, data science staje się coraz bardziej popularna. Aby zapewnić lepszą obsługę klienta, firmy takie jak Google, Amazon, Netflix i inne, które zajmują się dużą ilością danych, korzystają z algorytmów data science. Wreszcie, nauka o danych pomaga w automatyzacji transportu, na przykład w opracowaniu autonomicznego samochodu, który jest środkiem transportu przyszłości. Również różne ankiety, wybory, potwierdzenia biletów lotniczych i inne prognozy mogą odnieść korzyści z analizy danych.
