Principales questions d'estimation et méthodes informatives pour la science des données [2022]

Publié: 2021-01-06

Qu'est-ce que l'estimation ?

Guesstimate est une méthode méthodologique de théorie et d'évaluation; il vous aide à travailler efficacement avec un degré de précision plus élevé. C'est l'étude des données pour consolider le résultat. C'est également une partie essentielle de l'analyste commercial ou de la science des données et des architectes de données ou des techniciens de données.

  1. Signification : Il s'agit de comprendre le problème que vous voulez résoudre, et quel en est le but, pourquoi vous voulez le résoudre.
  2. Définition : Il s'agit de l'objet particulier et de l'entrée et de la sortie du flux d'un processus. Pour le dire en un mot, explication.
  3. Deviner : Il s'agit de la pensée et de la conclusion - vous créez un objet particulier dans votre problème.
  4. Estimation : Il s'agit de l'estimation des nombres sur un problème donné.
  5. Trouver une idée : mettre en œuvre l'idée avec la recherche et le développement.

Lorsqu'une question d'estimation peut demander la taille d'un marché, on l'appelle alors une question de « dimensionnement du marché ».

Voici les questions de base sur l'estimation approximative :

  • Combien de personnes portent du bleu à New York un lundi typique ?
  • Combien de balles de tennis peut-on mettre dans un avion ?

Comment aborder l'estimation ?

Le processus de résolution d'un problème d'estimation est assez gérable :

  1. Examinez les paramètres possibles qui peuvent affecter la quantité finale et estimez ses nombres.
  2. Prenez du recul et réfléchissez.
  3. Clarifiez vos pensées.
  4. Exprimez vos pensées.
  5. Approche mathématique simple-

Cette approche est généralement utilisée lorsque le nombre à estimer est un rapport de certaines sortes. La tâche est d'obtenir le numérateur et le dénominateur, puis nous avons terminé !

1. Approche par habitant-

Cette approche est utilisée lorsque le nombre à deviner peut être considéré comme un élément de consommation au niveau d'une personne, d'un ménage ou d'une population au sein d'une zone géographique.

2. Approche de l'offre et de la demande-

Cette approche nécessite de penser au nombre approximatif du côté de l'offre ou de la demande (ou des deux) de l'article.

De manière générale, vous pouvez proposer des estimations approximatives de l'une des deux manières suivantes :

  • Méthode descendante
  • Méthode ascendante

Dans le top-down, vous commencez avec le plus grand univers possible, dont votre estimation est une partie.

Avec la base la plus large au sommet. À cet univers, vous continuez ensuite à appliquer un ensemble de conditions ou de filtres (comme vous voulez le dire) qui réduisent le nombre de l'univers à un nombre approprié pour votre estimation approximative.

La clé du processus d'estimation descendante réside dans :

  1. Il identifie avec précision l'univers de départ.
  2. Il identifie avec précision autant de conditions/filtres et segments pertinents qui s'appliquent à votre problème d'estimation approximative.
  3. Segments : fréquemment, vous devrez d'abord segmenter l'univers en compartiments et appliquer différents filtres à chaque segment.

Conseils pour les questions d'estimation pour la science des données :

  1. Pratiquer la présentation : Nous devons faire la pratique de présenter au public la solution particulière que vous avez réalisée.
  2. Entraînez- vous à analyser : l'analyse joue un rôle essentiel dans la réflexion sur le problème donné.
  3. Entraînez-vous avec les nombres : jouer avec les nombres ou créer une logique personnalisée est toujours important.

Lors de la résolution des questions d'estimation pour Data Science, vous devez comprendre ces points :

  • Tu décris ça à quelqu'un qui n'est pas dans ta tête. La solution n'est pas pour vous.
  • En même temps, rappelez-vous de ne pas transformer chaque aspect en une estimation entièrement nouvelle ! Il est facile de se laisser influencer par votre intelligence et vos capacités d'analyse.
  • Concentrez-vous sur la question. Avez-vous entendu parler de la paralysie analytique ?

À quoi servent les questions d'estimation pour la science des données ?

  • Comprendre votre capacité à comprendre une situation.
  • Pour comprendre l'étendue de votre capacité à relier les choses, à parvenir à une réponse.
  • Connaître votre force pour prioriser et écarter différents paramètres.
  • Pour comprendre à quel point vous travaillez avec des informations inadéquates.

Voici quelques questions approximatives pour Data Science-

Question : 1 Créez une expérience avec l'algorithme k-means sur l'ensemble de données UCI Iris :

Dans cette expérience, effectuez un clustering k-means en utilisant toutes les fonctionnalités du jeu de données, puis comparez les résultats du clustering avec la véritable étiquette de classe pour tous les échantillons.

Utilisez le module Multiclass Logistic Regression pour effectuer une classification multiclasse et comparer ses performances avec celles du clustering k-means.

Question : 2 Dans un format très simple, expliquez Precision & Recall ?

Question 3 : Si vous avez reçu un ensemble de données, comment décidez-vous quel algorithme de ML proposer à l'utilisateur ?

Question : 4 Est-il préférable d'avoir trop de faux positifs ? Ou trop de faux négatifs ?

Question : 5 Qu'est-ce que la précision et les performances du modèle ? Quel scénario pouvez-vous appliquer ?

Question : 6 Comment vous assurez-vous de ne pas sur-ajuster un modèle ? Expliquez avec un exemple.

Question : 7 Lorsque vous exécutez un algorithme d'arbre de classification binaire, c'est assez facile. Dans l'algorithme binaire, comment l'arbre décide-t-il de la variable à diviser au niveau du nœud racine et de ses nœuds enfants suivants ?

Question : 8 Comment sont décrits NumPy et SciPy ?

Question : 9 Écrivez un programme d'apprentissage automatique de base pour vérifier l'exactitude de l'ensemble de données en important n'importe quel ensemble de données à l'aide de n'importe quel classificateur ?

Question 10 : Créez un algorithme de régression pour prédire le prix d'une voiture en fonction de différentes variables.

Question 11 : Développez un modèle qui utilise différentes fonctionnalités réseau pour détecter les activités réseau faisant partie d'une intrusion/attaque à l'aide de classifications binaires.

Question : 12 Comment regrouper (Clustering) pour trouver des organisations similaires ensemble en fonction de leur description Wikipedia.

Question 13 : Comment prédisez-vous qui renouvellera ses abonnements le mois prochain ?

  • De quelles données auriez-vous besoin pour résoudre ce problème ?
  • Quel genre d'analyse feriez-vous?
  • Quels types d'algorithmes de modèles prédictifs seraient nécessaires ?

Question 14 : Comment associez-vous les surnoms (Alen, Bob, Alex, Tim, etc.) aux vrais noms ?

Question : 15 Créez une prédiction indiquant si le vol passager prévu est retardé ou non à l'aide d'un classificateur binaire avec un script R ou python.

Question : 16 Prédire les prix des automobiles à l'aide de la régression linéaire avec préparer et nettoyer les données en supprimant la colonne des pertes normalisées.

Puisqu'il a de nombreuses valeurs manquantes, créez une expérience et un modèle.

Question : 17 De combien de manières pouvez-vous diviser 14 personnes en 4 équipes de 5 ?

Question : 18 L'aire sous la courbe normale standard est ?

  • Supérieur à 1
  • Égal à 1
  • Moins que 1

Question 19 : Créez un algorithme de régression pour prédire le prix d'une voiture en fonction de différentes variables.

Question 20 : Votre responsable vous a demandé de créer un modèle de forêt aléatoire avec 10 000 arbres au cours de votre formation, et vous avez obtenu une erreur de formation de 0,00. Mais, lors des tests, l'erreur de validation était de 34,23. Sur quelle base supposerez-vous ce qui s'est mal passé ? Comment vérifieriez-vous votre modèle s'il n'est pas parfaitement entraîné ?

Question : 21 "Les gens qui ont acheté ça, ont aussi acheté…" les recommandations vues sur Amazon sont basées sur quel algorithme ?

Question 22 : Quels algorithmes sont liés dans les recommandations que vous voyez sous la rubrique "Actualités et opinions d'aujourd'hui" ?

Lire : Questions d'entrevue en science des données

Conclusion

Nous espérons que cet article vous a aidé à comprendre les questions d'estimation approximative pour la science des données et comment les surmonter. Vous trouverez des articles plus utiles comme celui-ci sur upGrad ; nous offrons une vaste gamme de cours, MBA, science des données, apprentissage automatique, etc. Nous offrons un mentorat par les meilleurs individus de l'industrie !

Si vous êtes intéressé à apprendre la science des données et optez pour une carrière dans ce domaine, consultez le programme exécutif PG de l'IIIT-B et upGrad en science des données qui est créé pour les professionnels en activité et propose plus de 10 études de cas et projets, des ateliers pratiques pratiques , mentorat avec des experts de l'industrie, 1-on-1 avec des mentors de l'industrie, plus de 400 heures d'apprentissage et d'aide à l'emploi avec les meilleures entreprises.

Quelles sont les étapes idéales pour résoudre un problème d'estimation approximative ?

Avant de répondre à une question approximative, il est sage de garder certains points à l'esprit pour avoir une meilleure idée. Ces points sont les suivants - Avant de commencer à répondre, vous devez dissiper tous vos doutes concernant la question. Vous pouvez poser autant de questions pertinentes que vous le souhaitez à l'intervieweur, mais essayez d'éviter les questions qui conduisent à un calcul numérique. Cela pourrait avoir un impact négatif sur l'intervieweur. Il est conseillé de s'en tenir aux questions oui ou non pour éviter toute mauvaise impression. N'essayez pas de résoudre le problème en une seule fois, décomposez-le plutôt en sous-problèmes plus petits, puis essayez de résoudre chaque problème plus petit. Rappelez-vous que ne divisez pas votre problème en plus de 6 étapes. Cette méthode vous aidera à trouver la réponse même après de longs calculs.

Qu'est-ce que l'estimation ?

Guesstimate consiste à comprendre le problème et à trouver la bonne approche pour le résoudre. C'est une méthode méthodologique de théorie et d'évaluation. La chose la plus importante dans de telles questions est de savoir comment vous expliquez la solution.
L'estimation peut sembler une tâche intimidante, surtout lorsque vous regardez pour la première fois le type de questions posées. De la taille du marché des grands conglomérats aux revenus et aux populations, le calcul de certaines de ces quantités, même proches d'un stade approximatif, est pratiquement impossible.

Quelles sont les différentes approches pour résoudre un problème d'estimation approximative ?

Approche mathématique simple - Cette approche concerne principalement les cas où le nombre à estimer est une sorte de rapport. Approche par habitant - cette approche est utilisée lorsque le nombre à deviner peut être considéré comme un élément de consommation au niveau d'une personne, d'un ménage ou d'une population au sein d'une zone géographique. Approche de l'offre et de la demande - cette approche nécessite que vous réfléchissiez au nombre soit du côté de l'offre, soit du côté de la demande.