Cele mai bune întrebări și metode informative pentru știința datelor [2022]
Publicat: 2021-01-06Ce este Guesstimate?
Guesstimate este o metodă metodologică de teorie și evaluare; vă ajută să lucrați eficient cu un grad mai mare de precizie. Este studiul datelor pentru a consolida rezultatul. Este, de asemenea, o parte esențială a Business Analyst sau Data Science and Data Architects sau Data Techies.
- Semnificație: Este vorba despre înțelegerea problemei pe care doriți să o rezolvați și care este scopul acesteia, de ce doriți să o rezolvați.
- Definiție: Este vorba despre obiectul particular și intrarea și ieșirea fluxului unui proces. Pentru a spune într-un cuvânt, explicație.
- Ghicire : Este vorba despre gând și concluzie - creezi un anumit obiect în problema ta.
- Estimare: este vorba despre estimarea numerelor pentru o anumită problemă.
- Veniți cu o idee : implementați ideea prin cercetare și dezvoltare.
Atunci când o întrebare estimată poate cere dimensiunea unei piețe, se numește întrebare de „dimensiunea pieței”.
Iată întrebările de bază despre estimare:
- Câți oameni poartă albastru în New York într-o zi de luni tipică?
- Câte mingi de tenis poți încăpea într-un avion?
Cum să abordezi Guesstimate?
Procesul de rezolvare a unei probleme de estimare este destul de ușor de gestionat:
- Priviți parametrii realizabili care pot afecta cantitatea finală și estimați-i numerele.
- Fă un pas înapoi și gândește-te.
- Clarifică-ți gândurile.
- Exprimați-vă gândurile.
- Abordare matematică simplă-
Această abordare este utilizată de obicei atunci când numărul de estimat este un raport de anumite tipuri. Sarcina este să obținem numărătorul și numitorul atunci am terminat!
1. Abordarea pe cap de locuitor-
Această abordare este utilizată atunci când numărul de ghicit poate fi considerat ca un articol de consum la nivel de persoană, gospodărie sau populație din geografie.
2. Abordarea ofertei și cererii-
Această abordare necesită să ne gândim la numărul estimat din partea ofertei sau a cererii (sau ambele) a articolului.
În general, puteți propune estimări în unul dintre aceste două moduri:
- Metoda de sus în jos
- Metoda de jos în sus
În partea de sus în jos, începi cu cel mai mare univers posibil, din care estimarea ta este o parte.
Cu cea mai lată bază în partea de sus. În acest univers, continuați să aplicați un set de condiții sau filtre (oricum doriți să spuneți) care reduc numărul din univers la un număr care este potrivit pentru estimarea dvs.
Cheia procesului de estimare de sus în jos constă în:
- Este identificarea cu precizie a universului de pornire.
- Identifică cu exactitate cât mai multe dintre condițiile/filtrele și segmentele relevante care se aplică problemei tale estimative.
- Segmente: în mod frecvent, va trebui mai întâi să segmentați universul în găleți și să aplicați filtre diferite fiecărui segment.
Sfaturi pentru întrebări estimative pentru Data Science:
- Practică prezentarea: trebuie să facem practica de a prezenta publicului soluția particulară pe care ați finalizat-o.
- Practicați analiza: analiza joacă un rol vital pentru a face procese de gândire asupra problemei date.
- Exersați cu numerele: este întotdeauna important să vă jucați cu numerele sau să creați o logică personalizată.
În timp ce rezolvați întrebările estimative pentru Data Science, trebuie să înțelegeți aceste puncte:
- Descrii asta cuiva care nu e în capul tău. Soluția nu este pentru tine.
- În același timp, nu uitați să nu transformați fiecare aspect într-o estimare complet nouă! Este ușor să te lași influențat de inteligența și abilitățile tale analitice.
- Concentrați-vă pe întrebare. Ai auzit de analiză-paralizie?
Care sunt scopurile întrebărilor estimative pentru Data Science?
- Pentru a-ți înțelege capacitatea de a înțelege o situație.
- Pentru a înțelege sfera abilității tale de a conecta lucrurile, de a ajunge la un răspuns.
- Să vă cunoașteți puterea de a prioritiza și a respinge diferiți parametri.
- Pentru a înțelege cât de bine lucrați cu informații inadecvate.
Iată câteva întrebări estimative pentru Data Science-
Întrebare: 1 Creați un experiment cu algoritmul k-means pe setul de date UCI Iris:
În acest experiment, Efectuați gruparea k-means folosind toate caracteristicile din setul de date și apoi comparați rezultatele grupării cu eticheta adevărată a clasei pentru toate probele.
Utilizați modulul Regresie logistică multiclasă pentru a efectua clasificarea multiclasă și pentru a compara performanța acesteia cu cea a grupării k-means.
Întrebare: 2 Într-un format foarte simplu, explicați Precizia și retragerea?
Întrebare: 3 Dacă vi s-a oferit un set de date, cum decideți ce algoritm ML pentru utilizator?
Întrebare: 4 Este mai bine să aveți prea multe rezultate false pozitive? Sau prea multe false negative?
Întrebare: 5 Ce este precizia modelului și performanța modelului? Ce scenariu poți aplica?
Întrebare: 6 Cum vă asigurați că nu vă adaptați prea mult la un model? Explicați cu un exemplu.

Întrebare: 7 Când rulați un algoritm de arbore de clasificare binar este destul de ușor. În algoritmul binar, cum decide arborele asupra ce variabilă să împartă la nodul rădăcină și la nodurile sale secundare care urmează?
Întrebare: 8 Cum sunt descrise NumPy și SciPy?
Întrebare: 9 Scrieți un program de bază de învățare automată pentru a verifica acuratețea setului de date importând orice set de date folosind orice clasificator?
Întrebare: 10 Creați un algoritm de regresie pentru a prezice prețul unei mașini pe baza diferitelor variabile.
Întrebare: 11 Dezvoltați un model care utilizează diferite caracteristici de rețea pentru a detecta ce activități de rețea fac parte dintr-o intruziune/atac folosind clasificări binare.
Întrebare: 12 Cum să grupați (grupare) pentru a găsi organizații similare împreună pe baza descrierii lor Wikipedia.
Întrebare:13 Cum ați prezice cine își va reînnoi abonamentele luna viitoare?
- De ce date ai avea nevoie pentru a rezolva asta?
- Ce fel de analiză ai face?
- Ce fel de algoritmi ai modelelor predictive ar fi necesari?
Întrebare: 14 Cum ați mapa poreclele (Alen, Bob, Alex, Tim etc.) cu nume reale?
Întrebare: 15 Creați o predicție dacă zborul programat al pasagerilor este întârziat sau nu folosind un clasificator binar cu script R sau python.
Întrebare: 16 Preziceți prețurile auto utilizând regresia liniară cu Pregătiți și curățați datele prin eliminarea coloanei pierderi normalizate.
Deoarece are multe valori lipsă, creați un experiment și un model.
Întrebare: 17 În câte moduri poți împărți 14 persoane în 4 echipe de 5?
Întrebare: 18 Aria de sub curba normală standard este?
- Mai mare de 1
- Egal cu 1
- Mai puțin de 1
Întrebare: 19 Creați un algoritm de regresie pentru a prezice prețul unei mașini pe baza diferitelor variabile.
Întrebare: 20 Managerul dvs. a cerut să construiască un model de pădure aleatoriu cu 10000 de copaci în timpul antrenamentului și ați primit o eroare de antrenament ca 0,00. Dar, la testare, eroarea de validare a fost 34.23. Pe ce bază veți presupune ce a mers prost? Cum ți-ai verifica modelul dacă nu este antrenat perfect?
Întrebare: 21 Pe ce algoritm se bazează recomandările „Oamenii care au cumpărat asta, au cumpărat și...” văzute pe Amazon?
Întrebare: 22 Ce algoritmi sunt legați în recomandările pe care le vedeți ca „Știri și vizualizări de astăzi”?
Citiți: Întrebări de interviu pentru știința datelor
Concluzie
Sperăm că acest articol v-a ajutat să înțelegeți întrebările estimate pentru știința datelor și cum să le depășiți. Veți găsi mai multe articole utile ca acesta la upGrad; oferim o gamă largă de cursuri, MBA, Data Science, Machine Learning, etc. Oferim mentorat de la cei mai buni indivizi din industrie!
Dacă sunteți interesat să învățați Data Science și optați pentru o carieră în acest domeniu, consultați Programul Executive PG în Data Science al IIIT-B și upGrad, care este creat pentru profesioniști care lucrează și oferă peste 10 studii de caz și proiecte, ateliere practice practice. , mentorat cu experți din industrie, 1-la-1 cu mentori din industrie, peste 400 de ore de învățare și asistență profesională cu firme de top.
Care sunt pașii ideali pentru a rezolva o problemă de estimare?
Înainte de a răspunde la o întrebare estimată, este înțelept să țineți cont de câteva puncte pentru a veni cu o idee mai bună. Aceste puncte sunt următoarele - Înainte de a începe să răspundeți, ar trebui să vă curățați toate îndoielile cu privire la întrebare. Puteți adresa intervievatorului câte întrebări relevante doriți, dar încercați să evitați întrebările care duc la orice calcul numeric. Acest lucru ar putea avea un impact negativ asupra intervievatorului. Este recomandabil să rămâneți la întrebările da sau nu pentru a evita orice impresie proastă. Nu încercați să rezolvați problema dintr-o dată, ci împărțiți-o în subprobleme mai mici și apoi încercați să rezolvați fiecare problemă mai mică. Amintiți-vă că nu vă împărțiți problema în mai mult de 6 pași. Această metodă vă va ajuta să ajungeți la răspuns chiar și prin calcule lungi.
Ce este Guesstimate?
Guesstimate înseamnă înțelegerea problemei și găsirea abordării potrivite pentru a o rezolva. Este o metodă metodologică de teorie și evaluare. Cel mai important lucru în astfel de întrebări este modul în care explicați soluția.
Guestimation poate fi o sarcină descurajantă, mai ales când te uiți pentru prima dată la felul de întrebări adresate. De la dimensiunile pieței conglomeratelor mari până la venituri și populații, calcularea unora dintre aceste cantități chiar și aproape de un stagiu este realist imposibil.
Care sunt abordările diferite pentru a rezolva o problemă de estimare?
Abordare matematică simplă - Această abordare este mai ales în cazurile în care numărul de estimat este un fel de raport. Abordare pe cap de locuitor - această abordare este utilizată atunci când numărul de ghicit poate fi considerat ca un articol de consum la nivel de persoană, gospodărie sau populație din geografie. Abordarea ofertei și cererii - această abordare necesită să vă gândiți la număr, fie din partea ofertei, fie din partea cererii.