Principali domande di stima e metodi informativi per la scienza dei dati [2022]

Pubblicato: 2021-01-06

Cos'è la stima?

Guesstimate è un metodo metodologico di teoria e valutazione; ti aiuta a lavorare in modo efficiente con un più alto grado di precisione. È lo studio dei dati a consolidare il risultato. È anche una parte essenziale del Business Analyst o Data Science e Data Architect o Data Techies.

  1. Significato: si tratta di capire il problema che vuoi risolvere e qual è lo scopo, perché vuoi risolverlo.
  2. Definizione: riguarda l'oggetto particolare e l'input e l'output del flusso di un processo. Per dirla in una parola, spiegazione.
  3. Indovina : riguarda il pensiero e la conclusione: stai creando un oggetto particolare nel tuo problema.
  4. Stima: riguarda la stima dei numeri su un determinato problema.
  5. Vieni con un'idea : implementare l'idea con ricerca e sviluppo.

Quando una domanda stimata può richiedere le dimensioni di un mercato, viene quindi chiamata domanda di "dimensionamento del mercato".

Ecco le domande di base su guesstimate:

  • Quante persone si vestono di blu a New York in un tipico lunedì?
  • Quante palline da tennis puoi mettere in un aeroplano?

Come affrontare la stima?

Il processo di risoluzione di un problema approssimativo è abbastanza gestibile:

  1. Osservare i parametri fattibili che possono influenzare la quantità finale e stimarne i numeri.
  2. Fai un passo indietro e pensa.
  3. Chiarisci i tuoi pensieri.
  4. Dai voce ai tuoi pensieri.
  5. Semplice approccio matematico-

Questo approccio viene in genere utilizzato quando il numero da stimare è un rapporto di qualche tipo. Il compito è ottenere numeratore e denominatore, quindi abbiamo finito!

1. Approccio pro capite-

Questo approccio viene utilizzato quando il numero da indovinare può essere considerato come un elemento di consumo a livello di persona, famiglia o popolazione all'interno dell'area geografica.

2. Approccio della domanda e dell'offerta-

Questo approccio richiede di pensare al numero stimato dal lato dell'offerta o della domanda (o da entrambi) dell'articolo.

In generale, puoi proporre stime in uno di questi due modi:

  • Metodo dall'alto verso il basso
  • Metodo dal basso

Nella parte superiore verso il basso, inizi con l'universo più grande possibile, di cui la tua stima stimata è una parte.

Con la base più ampia in alto. A questo universo, quindi, continui ad applicare una serie di condizioni o filtri (comunque tu voglia metterlo) che riducono il numero dall'universo a un numero appropriato per la tua stima.

La chiave del processo di stima top-down risiede in:

  1. Sta identificando accuratamente l'universo di partenza.
  2. Sta identificando accuratamente il maggior numero di condizioni/filtri e segmenti rilevanti che si applicano al tuo problema di stima.
  3. Segmenti: spesso dovrai prima segmentare l'universo in bucket e applicare filtri diversi a ciascun segmento.

Suggerimenti per domande ipotizzabili per Data Science:

  1. Presentazione pratica: dobbiamo fare pratica di presentare al pubblico la soluzione particolare che hai completato.
  2. Analisi pratica: l'analisi gioca un ruolo vitale per elaborare processi di pensiero sul problema dato.
  3. Esercitati con i numeri: giocare con i numeri o creare una logica personalizzata è sempre importante.

Durante la risoluzione delle domande ipotetiche per Data Science, è necessario comprendere questi punti:

  • Lo stai descrivendo a qualcuno che non è nella tua testa. La soluzione non fa per te.
  • Allo stesso tempo, ricorda di non trasformare ogni aspetto in una stima del tutto nuova! È facile lasciarsi influenzare dalla tua intelligenza e dalle tue capacità analitiche.
  • Concentrati sulla domanda. Hai sentito parlare di analisi-paralisi?

Quali sono gli scopi delle domande stimate per Data Science?

  • Per capire la tua capacità di comprendere una situazione.
  • Per capire la portata della tua capacità di collegare le cose, per raggiungere una risposta.
  • Per conoscere la tua forza per dare priorità e ignorare parametri diversi.
  • Per capire quanto bene lavori con informazioni inadeguate.

Ecco alcune domande ipotizzabili per Data Science-

Domanda: 1 Creare un esperimento con l'algoritmo k-mean sul set di dati UCI Iris:

In questo esperimento, esegui il clustering k-medie utilizzando tutte le funzionalità nel set di dati, quindi confronta i risultati del clustering con l'etichetta di classe vera per tutti i campioni.

Utilizzare il modulo Regressione logistica multiclasse per eseguire la classificazione multiclasse e confrontare le sue prestazioni con quelle del clustering k-mean.

Domanda:2 In un formato molto semplice, spiega Precision & Recall?

Domanda: 3 Se ti è stato fornito un set di dati, come decidi quale algoritmo ML per l'utente?

Domanda:4 È meglio avere troppi falsi positivi? O troppi falsi negativi?

Domanda:5 Che cos'è l'accuratezza del modello e le prestazioni del modello? Quale scenario puoi applicare?

Domanda:6 Come ci si assicura di non adattarsi eccessivamente a un modello? Spiega con un esempio.

Domanda:7 Quando si esegue un algoritmo di albero di classificazione binario è abbastanza facile. Nell'algoritmo Binary, come fa l'albero a decidere quale variabile dividere nel nodo radice e nei nodi figli successivi?

Domanda:8 Come vengono descritti NumPy e SciPy?

Domanda:9 Scrivere un programma di apprendimento automatico di base per verificare l'accuratezza del set di dati importando qualsiasi set di dati utilizzando qualsiasi classificatore?

Domanda: 10 Creare un algoritmo di regressione per prevedere il prezzo di un'auto in base a diverse variabili.

Domanda: 11 Sviluppare un modello che utilizzi diverse funzionalità di rete per rilevare quali attività di rete fanno parte di un'intrusione/attacco utilizzando le classificazioni binarie.

Domanda: 12 Come raggruppare (raggruppamento) per trovare organizzazioni simili insieme in base alla loro descrizione su Wikipedia.

Domanda: 13 Come predire chi rinnoverà i propri abbonamenti il ​​mese prossimo?

  • Quali dati avresti bisogno per risolverlo?
  • Che tipo di analisi faresti?
  • Che tipo di algoritmi dei modelli predittivi sarebbero necessari?

Domanda: 14 Come associare i soprannomi (Alen, Bob, Alex, Tim, ecc.) a nomi reali?

Domanda: 15 Crea una previsione sul fatto che il volo passeggeri di linea sia in ritardo o meno utilizzando un classificatore binario con script R o python.

Domanda: 16 Prevedi i prezzi delle automobili utilizzando la regressione lineare con Prepara e pulisci i dati rimuovendo la colonna delle perdite normalizzate.

Dal momento che ha molti valori mancanti, crea un esperimento e un modello.

Domanda: 17 In quanti modi puoi dividere 14 persone in 4 squadre da 5?

Domanda: 18 L'area sotto la curva normale standard è?

  • Maggiore di 1
  • Uguale a 1
  • Meno di 1

Domanda:19 Creare un algoritmo di regressione per prevedere il prezzo di un'auto in base a diverse variabili.

Domanda:20 Il tuo manager ti ha chiesto di costruire un modello di foresta casuale con 10000 alberi durante il tuo addestramento e hai ricevuto un errore di addestramento come 0.00. Ma, durante il test, l'errore di convalida era 34.23. Su quali basi presumerai cosa è andato storto? Come controlleresti il ​​tuo modello se non è addestrato perfettamente?

Domanda:21 I consigli "Le persone che hanno comprato questo, hanno comprato anche..." visti su Amazon si basano su quale algoritmo?

Domanda:22 Quali algoritmi sono collegati nei consigli che vedi come "Notizie e visualizzazioni di oggi"?

Leggi: Domande sull'intervista sulla scienza dei dati

Conclusione

Ci auguriamo che questo articolo ti abbia aiutato a capire le domande approssimative per la scienza dei dati e come superarle. Troverai articoli più utili come questo su upGrad; offriamo una vasta gamma di corsi, MBA, Data Science, Machine Learning, ecc. Forniamo tutoraggio dai migliori individui del settore!

Se sei interessato all'apprendimento della scienza dei dati e opta per una carriera in questo campo, dai un'occhiata al programma Executive PG in Data Science di IIIT-B e upGrad, creato per i professionisti che lavorano e offre oltre 10 casi di studio e progetti, workshop pratici pratici , tutoraggio con esperti del settore, 1 contro 1 con mentori del settore, oltre 400 ore di apprendimento e assistenza al lavoro con le migliori aziende.

Quali sono i passaggi ideali per risolvere un problema di stima?

Prima di rispondere a una domanda ipotetica, è opportuno tenere a mente alcuni punti per avere un'idea migliore. Questi punti sono i seguenti: prima di iniziare a rispondere, dovresti chiarire tutti i tuoi dubbi sulla domanda. Puoi porre tutte le domande pertinenti che desideri all'intervistatore, ma cerca di evitare domande che portino a calcoli numerici. Questo potrebbe avere un impatto negativo sull'intervistatore. È consigliabile attenersi a domande sì o no per evitare brutte impressioni. Non cercare di risolvere il problema tutto in una volta, ma suddividilo in sottoproblemi più piccoli e poi prova a risolvere ogni problema più piccolo. Ricorda che non suddividere il problema in più di 6 passaggi. Questo metodo ti aiuterà a raggiungere la risposta anche attraverso lunghi calcoli.

Cos'è la stima?

La stima consiste nel comprendere il problema e nel trovare l'approccio giusto per risolverlo. È un metodo metodologico di teoria e valutazione. La cosa più importante in queste domande è come spieghi la soluzione.
L'ospite può sembrare un compito arduo, soprattutto quando guardi per la prima volta al tipo di domande poste. Dalle dimensioni del mercato dei grandi conglomerati alle entrate e alle popolazioni, calcolare alcune di queste quantità anche vicino a un campo da baseball è realisticamente impossibile.

Quali sono i diversi approcci per risolvere un problema di stima?

Approccio matematico semplice: questo approccio è utilizzato principalmente nei casi in cui il numero da stimare è una sorta di rapporto. Approccio pro capite: questo approccio viene utilizzato quando il numero da indovinare può essere considerato come un elemento di consumo a livello di persona, famiglia o popolazione all'interno della geografia. Approccio domanda e offerta: questo approccio richiede che tu pensi al numero dal lato dell'offerta o dal lato della domanda.