Principales preguntas de cálculo aproximado y métodos informativos para la ciencia de datos [2022]

Publicado: 2021-01-06

¿Qué es Guesstimate?

Guesstimate es un método metodológico de teoría y evaluación; le ayuda a trabajar de manera eficiente con un mayor grado de precisión. Es el estudio de los datos para consolidar el resultado. También es una parte esencial de Business Analyst o Data Science y Data Architects o Data Techies.

  1. Significado: se trata de comprender el problema que desea resolver y cuál es el propósito de eso, por qué desea resolverlo.
  2. Definición: Se trata del objeto particular y de la entrada y salida del flujo de un proceso. Para decirlo en una palabra, explicación.
  3. Adivinanzas : se trata del pensamiento y la conclusión: está creando un objeto particular en su problema.
  4. Estimación: Se trata de la estimación de los números en un problema dado.
  5. Piense en una idea : Implemente la idea con investigación y desarrollo.

Cuando una pregunta de cálculo aproximado puede solicitar el tamaño de un mercado, se denomina pregunta de "dimensión del mercado".

Estas son las preguntas básicas sobre la estimación aproximada:

  • ¿Cuántas personas visten de azul en Nueva York en un lunes típico?
  • ¿Cuántas pelotas de tenis puedes meter en un avión?

¿Cómo acercarse a Guesstimate?

El proceso de resolver un problema de cálculo aproximado es bastante manejable:

  1. Mire los parámetros factibles que pueden afectar la cantidad final y estime sus números.
  2. Da un paso atrás y piensa.
  3. Aclara tus pensamientos.
  4. Exprese sus pensamientos.
  5. Enfoque matemático simple-

Este enfoque se usa típicamente cuando el número a estimar es una proporción de algún tipo. La tarea es obtener el numerador y el denominador, ¡entonces hemos terminado!

1. Enfoque per cápita-

Este enfoque se utiliza cuando el número a adivinar se puede considerar como un artículo de consumo a nivel de persona, hogar o población dentro de la geografía.

2. Enfoque de oferta y demanda-

Este enfoque necesita pensar en el número aproximado del lado de la oferta o de la demanda (o ambos) del artículo.

En términos generales, puede proponer estimaciones aproximadas de una de estas dos maneras:

  • método de arriba hacia abajo
  • Método de abajo hacia arriba

En el de arriba hacia abajo, comienzas con el universo más grande posible, del cual tu cálculo aproximado es una porción.

Con la base más ancha en la parte superior. A este universo, sigues aplicando un conjunto de condiciones o filtros (como quieras ponerlo) que reducen el número del universo a un número que sea apropiado para tu cálculo aproximado.

La clave del proceso de estimación top-down radica en:

  1. Es identificar con precisión el universo de partida.
  2. Es identificar con precisión la mayor cantidad de condiciones/filtros y segmentos relevantes que se aplican a su problema de cálculo aproximado.
  3. Segmentos: con frecuencia, primero deberá segmentar el universo en cubos y aplicar diferentes filtros a cada segmento.

Sugerencias para preguntas de estimación aproximada para la ciencia de datos:

  1. Práctica de presentación: tenemos que hacer la práctica de presentar con la audiencia la solución particular que ha completado.
  2. Practicar el análisis: el análisis juega un papel vital para hacer procesos de pensamiento sobre el problema dado.
  3. Practicar con números: Siempre es importante jugar con los números o crear una lógica personalizada.

Mientras resuelve las preguntas de cálculo aproximado para Data Science, debe comprender estos puntos:

  • Le estás describiendo esto a alguien que no está en tu cabeza. La solución no es para ti.
  • Al mismo tiempo, ¡recuerde no convertir cada aspecto en una estimación completamente nueva! Es fácil dejarse llevar por su inteligencia y habilidades analíticas.
  • Concéntrese en la pregunta. ¿Has oído hablar del análisis-parálisis?

¿Cuáles son los propósitos de las preguntas de estimación aproximada para la ciencia de datos?

  • Comprender tu capacidad para comprender una situación.
  • Para entender el alcance de tu capacidad de conectar cosas, de llegar a una respuesta.
  • Conocer tu fuerza para priorizar y descartar distintos parámetros.
  • Para entender qué tan bien se trabaja con información inadecuada.

Aquí hay algunas preguntas aproximadas para Data Science-

Pregunta: 1 Cree un experimento con el algoritmo k-means en el conjunto de datos UCI Iris:

En este experimento, realice el agrupamiento de k-medias utilizando todas las características del conjunto de datos y luego compare los resultados del agrupamiento con la etiqueta de clase real para todas las muestras.

Utilice el módulo Regresión logística multiclase para realizar una clasificación multiclase y comparar su rendimiento con el de la agrupación en clústeres de k-medias.

Pregunta:2 En un formato muy simple, explique Precision & Recall?

Pregunta: 3 Si se le ha dado un conjunto de datos, ¿cómo decide qué algoritmo ML para el usuario?

Pregunta:4 ¿Es mejor tener demasiados falsos positivos? ¿O demasiados falsos negativos?

Pregunta:5 ¿Qué es la precisión del modelo y el rendimiento del modelo? ¿Qué escenario se puede aplicar?

Pregunta: 6 ¿Cómo se asegura de no ajustarse demasiado a un modelo? Explique con un ejemplo.

Pregunta:7 Cuando ejecuta un algoritmo de árbol de clasificación binario es bastante fácil. En el algoritmo binario, ¿cómo decide el árbol qué variable dividir en el nodo raíz y sus nodos secundarios posteriores?

Pregunta:8 ¿Cómo se describen NumPy y SciPy?

Pregunta: 9 ¿Escribir un programa básico de aprendizaje automático para verificar la precisión del conjunto de datos importando cualquier conjunto de datos usando cualquier clasificador?

Pregunta:10 Cree un algoritmo de regresión para predecir el precio de un automóvil en función de diferentes variables.

Pregunta: 11 Desarrolle un modelo que use diferentes funciones de red para detectar qué actividades de red son parte de una intrusión/ataque usando clasificaciones binarias.

Pregunta: 12 Cómo agrupar (agrupar) para encontrar organizaciones similares juntas en función de su descripción de Wikipedia.

Pregunta:13 ¿Cómo predeciría quién renovará sus suscripciones el próximo mes?

  • ¿Qué datos necesitarías para resolver esto?
  • ¿Qué tipo de análisis harías?
  • ¿Qué tipo de algoritmos de modelos predictivos se necesitarían?

Pregunta:14 ¿Cómo asignaría apodos (Alen, Bob, Alex, Tim, etc.) a nombres reales?

Pregunta: 15 Cree una predicción sobre si el vuelo de pasajeros programado se retrasa o no utilizando un clasificador binario con R o script de Python.

Pregunta:16 Prediga los precios de los automóviles utilizando la regresión lineal con preparación y limpieza de los datos eliminando la columna de pérdidas normalizadas.

Dado que tiene muchos valores faltantes, crea un experimento y un modelo.

Pregunta: 17 ¿De cuántas maneras puedes dividir a 14 personas en 4 equipos de 5?

Pregunta: 18 ¿El área bajo la curva normal estándar es?

  • mayor que 1
  • igual a 1
  • Menos que 1

Pregunta:19 Cree un algoritmo de regresión para predecir el precio de un automóvil en función de diferentes variables.

Pregunta: 20 Su gerente le pidió que construyera un modelo de bosque aleatorio con 10000 árboles durante su entrenamiento, y obtuvo un error de entrenamiento de 0.00. Pero, en las pruebas, el error de validación fue 34.23. ¿Con qué base asumirá lo que salió mal? ¿Cómo revisaría su modelo si no está perfectamente entrenado?

Pregunta:21 ¿En qué algoritmo se basan las recomendaciones "Las personas que compraron esto, también compraron..." que se ven en Amazon?

Pregunta:22 ¿Qué algoritmos están vinculados en las recomendaciones que ve como "Noticias y opiniones de hoy"?

Leer: Preguntas de la entrevista de ciencia de datos

Conclusión

Esperamos que este artículo lo haya ayudado a comprender las preguntas de cálculo aproximado para la ciencia de datos y cómo superarlas. Encontrarás más artículos útiles como este en upGrad; ofrecemos una amplia gama de cursos, MBA, ciencia de datos, aprendizaje automático, etc. ¡Brindamos tutoría de las mejores personas de la industria!

Si está interesado en aprender Data Science y optar por una carrera en este campo, consulte el Programa Executive PG de IIIT-B & upGrad en Data Science, creado para profesionales que trabajan y ofrece más de 10 estudios de casos y proyectos, talleres prácticos prácticos. , tutoría con expertos de la industria, 1 a 1 con mentores de la industria, más de 400 horas de aprendizaje y asistencia laboral con las mejores empresas.

¿Cuáles son los pasos ideales para resolver un problema de cálculo aproximado?

Antes de responder una pregunta de estimación aproximada, es aconsejable tener en cuenta algunos puntos para tener una mejor idea. Estos puntos son los siguientes: Antes de comenzar a responder, debe despejar todas sus dudas con respecto a la pregunta. Puede hacer tantas preguntas relevantes como desee al entrevistador, pero trate de evitar preguntas que conduzcan a cualquier cálculo numérico. Esto podría tener un impacto negativo en el entrevistador. Es recomendable ceñirse a las preguntas de sí o no para evitar una mala impresión. No intente resolver el problema de una vez, sino divídalo en subproblemas más pequeños y luego intente resolver cada problema más pequeño. Recuerde que no divida su problema en más de 6 pasos. Este método te ayudará a llegar a la respuesta incluso a través de largos cálculos.

¿Qué es Guesstimate?

Guesstimate se trata de comprender el problema y encontrar el enfoque correcto para resolverlo. Es un método metodológico de teoría y evaluación. Lo más importante en tales preguntas es cómo explicas la solución.
Guestimation puede parecer una tarea desalentadora, especialmente cuando miras por primera vez el tipo de preguntas que se hacen. Desde los tamaños de mercado de los grandes conglomerados hasta los ingresos y las poblaciones, calcular algunas de estas cantidades, incluso cerca de un estadio de béisbol, es realmente imposible.

¿Cuáles son los diferentes enfoques para resolver un problema de estimación aproximada?

Enfoque matemático simple: este enfoque es principalmente en los casos en que el número a estimar es algún tipo de proporción. Enfoque per cápita: este enfoque se utiliza cuando el número a adivinar se puede considerar como un artículo de consumo a nivel de persona, hogar o población dentro de la geografía. Enfoque de oferta y demanda: este enfoque requiere que piense en el número desde el lado de la oferta o desde el lado de la demanda.