Najpopularniejsze pytania i metody informacyjne dla nauki o danych [2022]
Opublikowany: 2021-01-06Co to jest Gość?
Guesstimate to metodologiczna metoda teorii i oceny; pomaga pracować wydajniej z większą dokładnością. Jest to badanie danych w celu utrwalenia wyniku. Jest to również niezbędna część analityka biznesowego lub Data Science i Data Architects lub Data Techies.
- Znaczenie: Chodzi o zrozumienie problemu, który chcesz rozwiązać i jaki jest tego cel, dlaczego chcesz go rozwiązać.
- Definicja: Chodzi o konkretny obiekt oraz wejście i wyjście przepływu procesu. Jednym słowem wyjaśnienie.
- Zgadywanie : Chodzi o myśl i wniosek - tworzysz konkretny obiekt w swoim problemie.
- Oszacowanie: chodzi o oszacowanie liczb dotyczących danego problemu.
- Wpadnij na pomysł : Wdróż pomysł w badania i rozwój.
Kiedy pytanie szacunkowe może dotyczyć wielkości rynku, nazywa się je pytaniem „o wielkości rynku”.
Oto podstawowe pytania dotyczące przewidywania:
- Ile osób nosi niebieski w Nowym Jorku w typowy poniedziałek?
- Ile piłek tenisowych zmieścisz w samolocie?
Jak podejść do Guesstimate?
Proces rozwiązywania zgadywanego problemu jest dość łatwy do opanowania:
- Przyjrzyj się możliwym parametrom, które mogą wpłynąć na ostateczną ilość i oszacuj jej liczby.
- Cofnij się i pomyśl.
- Wyjaśnij swoje myśli.
- Wyraź swoje myśli.
- Proste podejście matematyczne-
To podejście jest zwykle stosowane, gdy liczba do oszacowania jest pewnego rodzaju stosunkiem. Zadanie polega na uzyskaniu licznika i mianownika i gotowe!
1. Podejście per capita-
To podejście jest stosowane, gdy liczba do odgadnięcia może być traktowana jako element konsumpcji na poziomie osoby, gospodarstwa domowego lub populacji w obrębie geografii.
2. Podejście podaży i popytu-
Takie podejście wymaga przemyślenia szacunkowej liczby ze strony podaży lub popytu (lub obu) pozycji.
Ogólnie rzecz biorąc, możesz zaproponować przewidywania na jeden z tych dwóch sposobów:
- Metoda odgórna
- Metoda oddolna
Od góry do dołu, zaczynasz od największego możliwego wszechświata, którego częścią jest twój szacunek.
Z najszerszą podstawą u góry. Do tego wszechświata stosujesz następnie zestaw warunków lub filtrów (jakkolwiek chcesz to ująć), które redukują liczbę ze wszechświata do liczby odpowiedniej dla twojego oszacowania.
Kluczem do procesu szacowania odgórnego jest:
- Jest to dokładne określenie początkowego wszechświata.
- Jest to dokładna identyfikacja tylu istotnych warunków/filtrów i segmentów, które mają zastosowanie do Twojego problemu oszacowania.
- Segmenty: często trzeba najpierw podzielić przestrzeń na segmenty i zastosować różne filtry do każdego segmentu.
Wskazówki dotyczące szacunkowych pytań dotyczących Data Science:
- Ćwicz prezentowanie: Musimy wykonać praktykę prezentowania publiczności konkretnego rozwiązania, które udało Ci się zrealizować.
- Ćwicz analizowanie: Analiza odgrywa kluczową rolę w tworzeniu procesów myślowych dotyczących danego problemu.
- Ćwicz z liczbami: Zabawa liczbami lub tworzenie własnej logiki jest zawsze ważne.
Rozwiązując szacunkowe pytania dotyczące Data Science, musisz zrozumieć te punkty:
- Opisujesz to komuś, kogo nie masz w głowie. Rozwiązanie nie jest dla ciebie.
- Jednocześnie pamiętaj, aby nie zamieniać każdego aspektu w zupełnie nową ocenę! Twoja inteligencja i zdolności analityczne łatwo ulegają wpływom.
- Skoncentruj się na pytaniu. Czy słyszałeś o analizie-paraliżu?
Jakie są cele pytań predykcyjnych dla Data Science?
- Aby zrozumieć swoją zdolność rozumienia sytuacji.
- Zrozumienie zakresu Twojej zdolności do łączenia rzeczy, dochodzenia do odpowiedzi.
- Aby poznać swoją siłę do ustalania priorytetów i odrzucania różnych parametrów.
- Aby zrozumieć, jak dobrze pracujesz z nieodpowiednimi informacjami.
Oto kilka szacunkowych pytań do Data Science-
Pytanie:1 Utwórz eksperyment z algorytmem k-średnich na zestawie danych UCI Iris:
W tym eksperymencie wykonaj grupowanie k-średnich przy użyciu wszystkich funkcji w zestawie danych, a następnie porównaj wyniki grupowania z etykietą prawdziwej klasy dla wszystkich próbek.
Użyj modułu wieloklasowej regresji logistycznej, aby przeprowadzić klasyfikację wieloklasową i porównać jej wydajność z klastrowaniem k-średnich.
Pytanie:2 Wyjaśnij w bardzo prostym formacie Precyzja i Recall?
Pytanie:3 Jeśli otrzymałeś zestaw danych, w jaki sposób decydujesz, który algorytm ML ma być dla użytkownika?
Pytanie:4 Czy lepiej mieć zbyt wiele fałszywych alarmów? Lub zbyt wiele fałszywych negatywów?
Pytanie:5 Co to jest dokładność modelu i wydajność modelu? Jaki scenariusz możesz zastosować?
Pytanie:6 W jaki sposób upewniasz się, że nie pasujesz do modelu? Wyjaśnij na przykładzie.

Pytanie:7 Po uruchomieniu algorytmu binarnego drzewa klasyfikacyjnego jest to całkiem proste. W algorytmie binarnym, w jaki sposób drzewo decyduje o tym, którą zmienną podzielić w węźle głównym i kolejnych węzłach podrzędnych?
Pytanie:8 Jak są opisane NumPy i SciPy?
Pytanie:9 Napisz podstawowy program do uczenia maszynowego, aby sprawdzić dokładność zestawu danych, importując dowolny zestaw danych za pomocą dowolnego klasyfikatora?
Pytanie:10 Utwórz algorytm regresji, aby przewidzieć cenę samochodu na podstawie różnych zmiennych.
Pytanie:11 Opracuj model, który wykorzystuje różne funkcje sieciowe do wykrywania, które działania sieciowe są częścią włamania/ataku przy użyciu klasyfikacji binarnych.
Pytanie:12 Jak grupować (klastrowanie), aby razem znaleźć podobne organizacje na podstawie ich opisu w Wikipedii.
Pytanie:13 Jak przewidziałbyś, kto odnowi subskrypcje w przyszłym miesiącu?
- Jakie dane byłyby potrzebne do rozwiązania tego problemu?
- Jaki rodzaj analizy byś zrobił?
- Jakie algorytmy modeli predykcyjnych byłyby potrzebne?
Pytanie:14 Jak zmapowałbyś pseudonimy (Alen, Bob, Alex, Tim, itd.) na prawdziwe imiona?
Pytanie:15 Stwórz prognozę, czy zaplanowany lot pasażerski jest opóźniony, czy nie, używając klasyfikatora binarnego ze skryptem R lub Pythona.
Pytanie:16 Przewiduj ceny samochodów za pomocą regresji liniowej z opcją Przygotuj i wyczyść dane, usuwając kolumnę znormalizowanych strat.
Ponieważ ma wiele brakujących wartości, utwórz eksperyment i model.
Pytanie:17 Na ile sposobów możesz podzielić 14 osób na 4 zespoły po 5?
Pytanie:18 Powierzchnia pod standardową krzywą normalną to?
- Większy niż 1
- Równe 1
- Mniej niż 1
Pytanie:19 Utwórz algorytm regresji, aby przewidzieć cenę samochodu na podstawie różnych zmiennych.
Pytanie:20 Twój przełożony poprosił podczas treningu o zbudowanie losowego modelu lasu z 10000 drzew, a błąd szkolenia wynosił 0.00. Ale podczas testowania błąd walidacji wyniósł 34,23. Na jakiej podstawie założysz, co poszło nie tak? Jak sprawdziłbyś swój model, jeśli nie jest doskonale wyszkolony?
Pytanie:21 „Ludzie, którzy to kupili, kupili również…” Rekomendacje widoczne na Amazonie są oparte na jakim algorytmie?
Pytanie:22 Które algorytmy są połączone w rekomendacjach, które widzisz jako „Dzisiejsze wiadomości i widoki”?
Przeczytaj: Pytania do wywiadu dotyczącego nauki o danych
Wniosek
Mamy nadzieję, że ten artykuł pomógł Ci zrozumieć szacunkowe pytania dotyczące nauki o danych i sposoby ich rozwiązywania. Więcej przydatnych artykułów, takich jak ten, znajdziesz na upGrad; oferujemy szeroką gamę kursów, MBA, Data Science, Machine Learning itp. Zapewniamy mentoring od najlepszych osób w branży!
Jeśli jesteś zainteresowany nauką o Data Science i zdecydujesz się na karierę w tej dziedzinie, sprawdź program Executive PG w dziedzinie Data Science IIIT-B i upGrad, który jest stworzony dla pracujących profesjonalistów i oferuje ponad 10 studiów przypadków i projektów, praktyczne warsztaty , mentoring z ekspertami z branży, indywidualny kontakt z mentorami branżowymi, ponad 400 godzin nauki i pomocy w pracy z najlepszymi firmami.
Jakie są idealne kroki w celu rozwiązania przewidywanego problemu?
Przed udzieleniem odpowiedzi na niepewne pytanie dobrze jest pamiętać o kilku punktach, aby wpaść na lepszy pomysł. Punkty te są następujące: Przed przystąpieniem do odpowiadania należy rozwiać wszystkie wątpliwości dotyczące pytania. Możesz zadać ankieterowi tyle istotnych pytań, ile chcesz, ale staraj się unikać pytań, które prowadzą do jakichkolwiek obliczeń liczbowych. Może to mieć zły wpływ na ankietera. Wskazane jest, aby trzymać się pytań „tak” lub „nie”, aby uniknąć złego wrażenia. Nie próbuj rozwiązywać problemu od razu, zamiast tego rozbijaj go na mniejsze podproblemy, a następnie próbuj rozwiązywać każdy mniejszy problem. Pamiętaj, aby nie dzielić problemu na więcej niż 6 kroków. Ta metoda pomoże Ci dotrzeć do odpowiedzi nawet przy długich obliczeniach.
Co to jest Gość?
Guesstimate polega na zrozumieniu problemu i znalezieniu odpowiedniego podejścia do jego rozwiązania. Jest to metodologiczna metoda teorii i oceny. Najważniejszą rzeczą w takich pytaniach jest to, jak wyjaśnisz rozwiązanie.
Gościnność może wydawać się trudnym zadaniem, zwłaszcza gdy po raz pierwszy przyjrzysz się zadanym pytaniom. Od wielkości rynku dużych konglomeratów po przychody i populacje, obliczenie niektórych z tych wielkości nawet w pobliżu pola golfowego jest realnie niemożliwe.
Jakie są różne podejścia do rozwiązania szacowanego problemu?
Proste podejście matematyczne — to podejście stosuje się głównie w przypadkach, gdy liczba do oszacowania jest rodzajem współczynnika. Podejście per capita — to podejście jest stosowane, gdy liczba do odgadnięcia może być traktowana jako element konsumpcji na poziomie osoby, gospodarstwa domowego lub populacji w obrębie obszaru geograficznego. Podejście podaży i popytu — to podejście wymaga myślenia o liczbie od strony podaży lub popytu.