Top Schätzfragen & informative Methoden für Data Science [2022]
Veröffentlicht: 2021-01-06Was ist Guesstimate?
Guesstimate ist eine methodologische Theorie- und Bewertungsmethode; Es hilft Ihnen, effizient und mit einem höheren Maß an Genauigkeit zu arbeiten. Es ist das Studium der Daten , um das Ergebnis zu konsolidieren. Es ist auch ein wesentlicher Bestandteil des Business Analyst oder Data Science und Data Architects oder Data Techies.
- Bedeutung: Es geht darum, das Problem zu verstehen, das Sie lösen möchten, und was der Zweck davon ist, warum Sie es lösen möchten.
- Definition: Es geht um das bestimmte Objekt und die Ein- und Ausgabe des Ablaufs eines Prozesses. Um es mit einem Wort zu sagen: Erklärung.
- Raten : Es geht um den Gedanken und die Schlussfolgerung – Sie erstellen ein bestimmtes Objekt in Ihrem Problem.
- Schätzung: Es geht um die Schätzung der Zahlen zu einem gegebenen Problem.
- Kommen Sie auf eine Idee : Setzen Sie die Idee mit Forschung und Entwicklung um.
Wenn eine Schätzfrage nach der Größe eines Marktes fragen kann, wird sie als „Marktgröße“-Frage bezeichnet.
Hier sind die grundlegenden Fragen zum Schätzwert:
- Wie viele Menschen tragen an einem typischen Montag in New York Blau?
- Wie viele Tennisbälle passen in ein Flugzeug?
Wie nähert man sich der Schätzung?
Der Prozess der Lösung eines Schätzproblems ist ziemlich überschaubar:
- Sehen Sie sich die möglichen Parameter an, die die endgültige Menge beeinflussen können, und schätzen Sie deren Anzahl.
- Treten Sie einen Schritt zurück und denken Sie nach.
- Klären Sie Ihre Gedanken.
- Sprechen Sie Ihre Gedanken aus.
- Einfacher mathematischer Ansatz-
Dieser Ansatz wird normalerweise verwendet, wenn die zu schätzende Zahl eine Art Verhältnis ist. Die Aufgabe besteht darin, Zähler und Nenner zu erhalten, dann sind wir fertig!
1. Pro-Kopf-Ansatz-
Dieser Ansatz wird verwendet, wenn die zu erratende Zahl als Verbrauchselement auf Personen-, Haushalts- oder Bevölkerungsebene innerhalb der Geographie angesehen werden kann.
2. Angebot & Nachfrage-Ansatz-
Bei diesem Ansatz muss an die geschätzte Zahl entweder von der Angebots- oder der Nachfrageseite (oder beiden) des Artikels gedacht werden.
Im Allgemeinen können Sie Schätzwerte auf eine der folgenden beiden Arten vorschlagen:
- Top-down-Methode
- Bottom-up-Methode
In der Top-Down-Ansicht beginnen Sie mit dem größtmöglichen Universum, von dem Ihre Schätzung ein Teil ist.
Mit der breitesten Basis oben. Auf dieses Universum wenden Sie dann weiterhin eine Reihe von Bedingungen oder Filtern an (wie Sie es auch ausdrücken möchten), die die Zahl aus dem Universum auf eine Zahl reduzieren, die für Ihre Schätzung geeignet ist.
Der Schlüssel zum Top-down-Schätzungsprozess liegt in:
- Es identifiziert genau das Startuniversum.
- Es identifiziert genau so viele der relevanten Bedingungen/Filter und Segmente, die auf Ihr geschätztes Problem zutreffen.
- Segmente: Häufig müssen Sie das Universum zunächst in Buckets unterteilen und auf jedes Segment unterschiedliche Filter anwenden.
Tipps für Schätzfragen für Data Science:
- Präsentieren üben: Wir müssen üben, dem Publikum die jeweilige Lösung zu präsentieren, die Sie abgeschlossen haben.
- Analysieren üben: Das Analysieren spielt eine entscheidende Rolle, um Denkprozesse zu einem gegebenen Problem anzuregen.
- Üben Sie mit Zahlen: Das Spielen mit den Zahlen oder das Erstellen benutzerdefinierter Logik ist immer wichtig.
Beim Lösen der Schätzfragen für Data Science müssen Sie diese Punkte verstehen:
- Du beschreibst das jemandem, der nicht in deinem Kopf ist. Die Lösung ist nichts für dich.
- Denken Sie gleichzeitig daran, nicht jeden Aspekt in eine völlig neue Schätzung selbst zu verwandeln! Es ist leicht, sich von Ihrer Intelligenz und Ihren analytischen Fähigkeiten beeinflussen zu lassen.
- Konzentrieren Sie sich auf die Frage. Haben Sie schon einmal von Analyseparalyse gehört?
Welchen Zweck haben Schätzfragen für Data Science?
- Um Ihre Fähigkeit zu verstehen, eine Situation zu verstehen.
- Den Umfang Ihrer Fähigkeit zu verstehen, Dinge zu verbinden, eine Antwort zu finden.
- Ihre Stärke zu kennen, um verschiedene Parameter zu priorisieren und zu verwerfen.
- Um zu verstehen, wie gut Sie mit unzureichenden Informationen arbeiten.
Hier sind einige Schätzfragen für Data Science-
Frage:1 Erstellen Sie ein Experiment mit dem k-Means-Algorithmus auf dem UCI-Iris-Datensatz:
Führen Sie in diesem Experiment k-Means-Clustering mit allen Features im Dataset durch und vergleichen Sie dann die Clustering-Ergebnisse mit der wahren Klassenbezeichnung für alle Stichproben.
Verwenden Sie das Modul Multiclass Logistic Regression, um eine Multiclass-Klassifizierung durchzuführen und seine Leistung mit der von k-Means-Clustering zu vergleichen.
Frage:2 Erklären Sie in einem sehr einfachen Format Precision & Recall?
Frage:3 Wenn Sie einen Datensatz erhalten haben, wie entscheiden Sie, welcher ML-Algorithmus dem Benutzer angezeigt wird?
Frage:4 Ist es besser, zu viele Fehlalarme zu haben? Oder zu viele falsche Negative?
Frage:5 Was ist Modellgenauigkeit und Modellleistung? Welches Szenario können Sie anwenden?
Frage: 6 Wie stellen Sie sicher, dass Sie mit einem Modell nicht überanpassen? Erklären Sie mit einem Beispiel.

Frage: 7 Wenn Sie einen binären Klassifikationsbaum ausführen, ist der Algorithmus ziemlich einfach. Wie entscheidet der Baum im binären Algorithmus, welche Variable am Wurzelknoten und seinen nachfolgenden untergeordneten Knoten geteilt werden soll?
Frage:8 Wie werden NumPy und SciPy beschrieben?
Frage: 9. Schreiben Sie ein einfaches maschinelles Lernprogramm, um die Genauigkeit des Datensatzes zu überprüfen, indem Sie einen beliebigen Datensatz mit einem beliebigen Klassifikator importieren?
Frage: 10 Erstellen Sie einen Regressionsalgorithmus, um den Preis eines Autos basierend auf verschiedenen Variablen vorherzusagen.
Frage:11 Entwickeln Sie ein Modell, das verschiedene Netzwerkfunktionen verwendet, um zu erkennen, welche Netzwerkaktivitäten Teil eines Eindringens/Angriffs sind, indem Binärklassifikationen verwendet werden.
Frage:12 Gruppierung (Clustering), um ähnliche Organisationen basierend auf ihrer Wikipedia-Beschreibung zusammenzufinden.
Frage:13 Wie würden Sie vorhersagen, wer seine Abonnements im nächsten Monat verlängern wird?
- Welche Daten benötigen Sie, um dies zu lösen?
- Welche Art von Analyse würden Sie machen?
- Welche Art von Algorithmen für Vorhersagemodelle wären erforderlich?
Frage:14 Wie würden Sie Spitznamen (Alen, Bob, Alex, Tim usw.) echten Namen zuordnen?
Frage:15 Erstellen Sie eine Vorhersage darüber, ob ein geplanter Passagierflug verspätet ist oder nicht, indem Sie einen binären Klassifikator mit R oder Python-Skript verwenden.
Frage:16 Prognostizieren Sie Autopreise mithilfe der linearen Regression mit Vorbereiten und Bereinigen der Daten durch Entfernen der normalisierten Verluste-Spalte.
Da viele Werte fehlen, erstellen Sie ein Experiment und ein Modell.
Frage:17 Auf wie viele Arten können Sie 14 Personen in 4 Teams zu je 5 Personen aufteilen?
Frage:18 Fläche unter der Standard-Normalkurve ist?
- Größer als 1
- Gleich 1
- Weniger als 1
Frage:19 Erstellen Sie einen Regressionsalgorithmus, um den Preis eines Autos basierend auf verschiedenen Variablen vorherzusagen.
Frage:20 Ihr Manager hat Sie gebeten, während Ihres Trainings ein zufälliges Waldmodell mit 10000 Bäumen zu erstellen, und Sie haben einen Trainingsfehler von 0,00 erhalten. Aber beim Testen war der Validierungsfehler 34.23. Auf welcher Grundlage werden Sie annehmen, was schief gelaufen ist? Wie würden Sie Ihr Modell überprüfen, wenn es nicht perfekt trainiert ist?
Frage:21 „Leute, die das gekauft haben, kauften auch…“-Empfehlungen auf Amazon basieren auf welchem Algorithmus?
Frage:22 Welche Algorithmen sind in Empfehlungen verlinkt, die Sie als „Nachrichten und Aufrufe von heute“ sehen?
Lesen Sie: Interviewfragen für Data Science
Fazit
Wir hoffen, dass dieser Artikel Ihnen dabei geholfen hat, Schätzfragen für Data Science zu verstehen und zu lösen. Weitere nützliche Artikel wie diesen finden Sie bei upGrad; Wir bieten ein umfangreiches Angebot an Kursen, MBA, Data Science, Machine Learning usw. Wir bieten Mentoring von den besten Köpfen der Branche!
Wenn Sie daran interessiert sind, Data Science zu lernen und sich für eine Karriere in diesem Bereich entscheiden, sehen Sie sich das Executive PG Program in Data Science von IIIT-B & upGrad an, das für Berufstätige entwickelt wurde und mehr als 10 Fallstudien und Projekte sowie praktische Workshops bietet , Mentoring mit Branchenexperten, 1-on-1 mit Branchenmentoren, mehr als 400 Stunden Lern- und Jobunterstützung bei Top-Unternehmen.
Was sind die idealen Schritte, um ein Schätzproblem zu lösen?
Bevor Sie eine Schätzfrage beantworten, ist es ratsam, einige Punkte im Hinterkopf zu behalten, um eine bessere Vorstellung zu bekommen. Diese Punkte sind wie folgt: Bevor Sie mit der Beantwortung beginnen, sollten Sie alle Ihre Zweifel bezüglich der Frage ausräumen. Sie können dem Interviewer so viele relevante Fragen stellen, wie Sie möchten, aber versuchen Sie, Fragen zu vermeiden, die zu einer numerischen Berechnung führen. Dies könnte negative Auswirkungen auf den Interviewer haben. Es ist ratsam, sich an Ja- oder Nein-Fragen zu halten, um keinen schlechten Eindruck zu hinterlassen. Versuchen Sie nicht, das Problem auf einmal zu lösen, sondern zerlegen Sie es in kleinere Teilprobleme und versuchen Sie dann, jedes kleinere Problem zu lösen. Denken Sie daran, dass Sie Ihr Problem nicht in mehr als 6 Schritte aufteilen. Diese Methode hilft Ihnen, die Antwort auch durch langwierige Berechnungen zu erreichen.
Was ist Guesstimate?
Bei Guesstimate geht es darum, das Problem zu verstehen und den richtigen Lösungsansatz zu finden. Es ist eine methodische Theorie- und Evaluationsmethode. Das Wichtigste bei solchen Fragen ist, wie Sie die Lösung erklären.
Gastimulationen können sich wie eine entmutigende Aufgabe anfühlen, besonders wenn man sich zum ersten Mal die Art der gestellten Fragen ansieht. Von der Marktgröße großer Konglomerate bis hin zu Einnahmen und Bevölkerungszahlen ist es realistisch unmöglich, einige dieser Mengen auch nur annähernd zu berechnen.
Welche unterschiedlichen Ansätze gibt es, um ein Schätzproblem zu lösen?
Einfacher mathematischer Ansatz - Dieser Ansatz wird hauptsächlich in Fällen verwendet, in denen die zu schätzende Zahl eine Art Verhältnis ist. Pro-Kopf-Ansatz – Dieser Ansatz wird verwendet, wenn die zu erratende Zahl als Verbrauchsposten auf Personen-, Haushalts- oder Bevölkerungsebene innerhalb der Geographie angesehen werden kann. Angebots- und Nachfrageansatz – Bei diesem Ansatz müssen Sie entweder von der Angebotsseite oder von der Nachfrageseite über die Zahl nachdenken.