Principais perguntas de estimativa e métodos informativos para ciência de dados [2022]
Publicados: 2021-01-06O que é estimativa?
Guestimate é um método metodológico de teoria e avaliação; ele ajuda você a trabalhar de forma eficiente com um grau mais alto de precisão. É o estudo dos dados para consolidar o resultado. Também é uma parte essencial do Analista de Negócios ou Data Science e Data Architects ou Data Techies.
- Significado: Trata-se de entender o problema que você quer resolver, e qual é o propósito disso, por que você quer resolvê-lo.
- Definição: É sobre o objeto particular e entrada e saída do fluxo de um processo. Para colocar em uma palavra, explicação.
- Adivinhando : É sobre o pensamento e a conclusão - você está criando um objeto específico em seu problema.
- Estimativa: Trata-se da estimativa dos números de um determinado problema.
- Tenha uma ideia : Implemente a ideia com pesquisa e desenvolvimento.
Quando uma pergunta de estimativa pode perguntar o tamanho de um mercado, ela é chamada de pergunta de “dimensionamento de mercado”.
Aqui estão as perguntas básicas sobre estimativa de estimativa:
- Quantas pessoas vestem azul em Nova York em uma segunda-feira típica?
- Quantas bolas de tênis cabem em um avião?
Como abordar a estimativa?
O processo de resolver um problema de estimativa é bastante gerenciável:
- Observe os parâmetros viáveis que podem afetar a quantidade final e estime seus números.
- Dê um passo para trás e pense.
- Esclareça seus pensamentos.
- Dê voz aos seus pensamentos.
- Abordagem matemática simples -
Essa abordagem é normalmente usada quando o número a ser estimado é uma proporção de alguns tipos. A tarefa é obter o numerador e o denominador e pronto!
1. Abordagem per capita-
Essa abordagem é usada quando o número a ser adivinhado pode ser pensado como um item de consumo em nível de pessoa, família ou população dentro da geografia.
2. Abordagem de oferta e demanda-
Essa abordagem precisa pensar no número estimado do lado da oferta ou da demanda (ou ambos) do item.
De um modo geral, você pode propor estimativas de estimativas de uma destas duas maneiras:
- Método de cima para baixo
- Método de baixo para cima
No top-down, você começa com o maior universo possível, do qual sua estimativa é uma parte.
Com a base mais larga no topo. A esse universo, você continua aplicando um conjunto de condições ou filtros (como quiser colocá-lo) que reduzem o número do universo para um número apropriado para sua estimativa.
A chave para o processo de estimativa de cima para baixo está em:
- É identificar com precisão o universo inicial.
- Ele está identificando com precisão o maior número de condições/filtros e segmentos relevantes que se aplicam ao seu problema estimado.
- Segmentos: Frequentemente, você terá primeiro que segmentar o universo em buckets e aplicar filtros diferentes a cada segmento.
Dicas para perguntas de estimativa para Data Science:
- Praticar a apresentação: Temos que praticar a apresentação com o público da solução específica que você concluiu.
- Pratique a análise: A análise desempenha um papel vital para criar processos de pensamento sobre um determinado problema.
- Pratique com Números: Brincar com os números ou criar uma lógica personalizada é sempre importante.
Ao resolver as questões de estimativa para Data Science, você precisa entender estes pontos:
- Você está descrevendo isso para alguém que não está na sua cabeça. A solução não é para você.
- Ao mesmo tempo, lembre-se de não transformar cada aspecto em uma estimativa inteiramente nova! É fácil ser influenciado por sua inteligência e habilidades analíticas.
- Concentre-se na pergunta. Você já ouviu falar em análise-paralisia?
Quais são os propósitos das perguntas de estimativa para Data Science?
- Para entender sua capacidade de entender uma situação.
- Para entender o alcance de sua capacidade de conectar as coisas, para chegar a uma resposta.
- Conhecer sua força para priorizar e descartar diferentes parâmetros.
- Para entender o quão bem você trabalha com informações inadequadas.
Aqui estão algumas perguntas de estimativa para Data Science-
Pergunta:1 Crie um experimento com o algoritmo k-means no conjunto de dados UCI Iris:
Neste experimento, execute o agrupamento k-means usando todos os recursos do conjunto de dados e, em seguida, compare os resultados do agrupamento com o rótulo de classe verdadeiro para todas as amostras.
Use o módulo Multiclass Logistic Regression para realizar a classificação multiclasse e comparar seu desempenho com o do clustering k-means.
Pergunta:2 Em um formato muito simples, explique Precision & Recall?
Pergunta: 3 Se você recebeu um conjunto de dados, como você decide qual algoritmo de ML para o usuário?
Pergunta:4 É melhor ter muitos falsos positivos? Ou muitos falsos negativos?
Pergunta: 5 O que é precisão do modelo e desempenho do modelo? Que cenário você pode aplicar?
Pergunta: 6 Como você garante que não está se adaptando demais a um modelo? Explique com um exemplo.

Pergunta:7 Quando você executa um algoritmo de árvore de classificação binária é bastante fácil. No algoritmo Binário, como a árvore decide qual variável dividir no nó raiz e seus nós filhos sucessivos?
Pergunta: 8 Como o NumPy e o SciPy são descritos?
Pergunta:9 Escreva um programa básico de aprendizado de máquina para verificar a precisão do conjunto de dados importando qualquer conjunto de dados usando qualquer classificador?
Pergunta:10 Crie um algoritmo de Regressão para prever o preço de um carro com base em diferentes variáveis.
Questão:11 Desenvolva um modelo que use diferentes recursos de rede para detectar quais atividades de rede fazem parte de uma intrusão/ataque usando classificações binárias.
Pergunta:12 Como agrupar (clustering) para encontrar organizações semelhantes com base na descrição da Wikipedia.
Pergunta:13 Como você prevê quem renovará suas assinaturas no próximo mês?
- Quais dados você precisaria para resolver isso?
- Que tipo de análise você faria?
- Que tipo de algoritmos de modelos preditivos seriam necessários?
Pergunta:14 Como você mapearia apelidos (Alen, Bob, Alex, Tim, etc.) para nomes reais?
Pergunta:15 Crie uma previsão sobre se o voo programado de passageiros está atrasado ou não usando um classificador binário com script R ou python.
Pergunta:16 Preveja preços de automóveis usando Regressão Linear com Prepare e Limpe os dados removendo a coluna de perdas normalizadas.
Como há muitos valores ausentes, crie um experimento e um modelo.
Pergunta:17 De quantas maneiras você pode dividir 14 pessoas em 4 equipes de 5?
Pergunta:18 A área sob a curva normal padrão é?
- Maior que 1
- igual a 1
- Menos de 1
Question:19 Crie um algoritmo de Regressão para prever o preço de um carro com base em diferentes variáveis.
Pergunta:20 Seu gerente pediu para construir um modelo aleatório de floresta com 10.000 árvores durante seu treinamento e você obteve um erro de treinamento de 0,00. Mas, nos testes, o erro de validação foi 34,23. Com que base você vai supor o que deu errado? Como você verificaria seu modelo se ele não estivesse perfeitamente treinado?
Pergunta:21 As recomendações do tipo 'Pessoas que compraram isso, também compraram...' vistas na Amazon são baseadas em qual algoritmo?
Pergunta:22 Quais algoritmos estão vinculados nas recomendações que você vê como 'Notícias e visualizações de hoje'?
Leia: Perguntas da entrevista sobre ciência de dados
Conclusão
Esperamos que este artigo tenha ajudado você a entender as questões de estimativa para ciência de dados e como superá-las. Você encontrará mais artigos úteis como este no upGrad; oferecemos uma ampla variedade de cursos, MBA, Ciência de Dados, Aprendizado de Máquina, etc. Oferecemos orientação dos melhores profissionais do setor!
Se você estiver interessado em aprender Ciência de Dados e optar por uma carreira neste campo, confira o Programa PG Executivo em Ciência de Dados do IIIT-B & upGrad, criado para profissionais que trabalham e oferece mais de 10 estudos de caso e projetos, workshops práticos práticos , orientação com especialistas do setor, 1 a 1 com mentores do setor, mais de 400 horas de aprendizado e assistência de trabalho com as principais empresas.
Quais são as etapas ideais para resolver um problema de estimativa?
Antes de responder a uma pergunta de estimativa, é aconselhável manter alguns pontos em mente para ter uma ideia melhor. Esses pontos são os seguintes - Antes de começar a responder, você deve tirar todas as suas dúvidas sobre a pergunta. Você pode fazer quantas perguntas relevantes quiser ao entrevistador, mas tente evitar perguntas que levem a qualquer cálculo numérico. Isso pode ter um impacto negativo sobre o entrevistador. É aconselhável manter as perguntas de sim ou não para evitar qualquer má impressão. Não tente resolver o problema de uma só vez, em vez disso, divida-o em subproblemas menores e tente resolver cada problema menor. Lembre-se que não divida seu problema em mais de 6 etapas. Este método irá ajudá-lo a chegar à resposta mesmo através de cálculos demorados.
O que é estimativa?
A Guestimate tem tudo a ver com entender o problema e encontrar a abordagem certa para resolvê-lo. É um método metodológico de teoria e avaliação. A coisa mais importante em tais perguntas é como você explica a solução.
A Guesttimation pode parecer uma tarefa assustadora, especialmente quando você olha pela primeira vez para o tipo de perguntas feitas. Dos tamanhos de mercado de grandes conglomerados a receitas e populações, calcular algumas dessas quantidades mesmo perto de um estádio é realisticamente impossível.
Quais são as diferentes abordagens para resolver um problema de estimativa?
Abordagem matemática simples - Esta abordagem é principalmente nos casos em que o número a ser estimado é algum tipo de proporção. Abordagem per capita - essa abordagem é usada quando o número a ser adivinhado pode ser pensado como um item de consumo em uma pessoa, família ou população dentro da geografia. Abordagem de oferta e demanda - essa abordagem exige que você pense no número do lado da oferta ou da demanda.