Лучшие вопросы для предположений и информационные методы для науки о данных [2022]

Опубликовано: 2021-01-06

Что такое догадка?

Догадка — это методологический метод теории и оценки; это помогает вам работать эффективно с более высокой степенью точности. Это изучение данных для закрепления результата. Это также неотъемлемая часть бизнес-аналитика, науки о данных, архитекторов данных или специалистов по данным.

  1. Значение: речь идет о понимании проблемы, которую вы хотите решить, и какова цель этого, почему вы хотите ее решить.
  2. Определение: речь идет о конкретном объекте, а также о входе и выходе потока процесса. Одним словом, объяснение.
  3. Угадывание : речь идет о мысли и выводе — вы создаете конкретный объект в своей задаче.
  4. Оценка: речь идет об оценке чисел по данной проблеме.
  5. Придумайте идею : Реализуйте идею с помощью исследований и разработок.

Когда в вопросе-предположении можно задать вопрос о размере рынка, его называют вопросом «размера рынка».

Вот основные вопросы о предположениях:

  • Сколько людей носят синее в Нью-Йорке в обычный понедельник?
  • Сколько теннисных мячей можно поместить в самолет?

Как подойти к догадке?

Процесс решения примерной задачи вполне управляем:

  1. Посмотрите на допустимые параметры, которые могут повлиять на конечное количество, и оцените его цифры.
  2. Сделайте шаг назад и подумайте.
  3. Проясните свои мысли.
  4. Озвучивайте свои мысли.
  5. Простой математический подход-

Этот подход обычно используется, когда число, которое нужно угадать, является своего рода отношением. Задача состоит в том, чтобы получить числитель и знаменатель, тогда мы сделали!

1. Подход на душу населения-

Этот подход используется, когда число, которое нужно угадать, можно рассматривать как предмет потребления на уровне человека, домохозяйства или населения в пределах географии.

2. Подход спроса и предложения .

Этот подход требует обдумывания приблизительного числа либо со стороны предложения, либо со стороны спроса (или с обеих сторон) товара.

Вообще говоря, вы можете предлагать предположения одним из следующих двух способов:

  • Нисходящий метод
  • Восходящий метод

В нисходящем порядке вы начинаете с максимально возможной вселенной, частью которой является ваша догадка.

С самым широким основанием вверху. Затем к этой вселенной вы продолжаете применять набор условий или фильтров (как бы вы это ни называли), которые уменьшают число из вселенной до числа, подходящего для вашего предположения.

Ключ к процессу оценки сверху вниз заключается в следующем:

  1. Он точно определяет начальную вселенную.
  2. Он точно определяет как можно больше релевантных условий/фильтров и сегментов, применимых к вашей предполагаемой проблеме.
  3. Сегменты: часто вам придется сначала разбить вселенную на сегменты и применить различные фильтры к каждому сегменту.

Советы по оценочным вопросам для науки о данных:

  1. Практика презентации: мы должны попрактиковаться в представлении аудитории конкретного решения, которое вы завершили.
  2. Практикуйте анализ: анализ играет жизненно важную роль в мыслительных процессах по данной проблеме.
  3. Практика с числами: игра с числами или создание пользовательской логики всегда важны.

При решении предположительных вопросов для науки о данных вам необходимо понимать следующие моменты:

  • Вы описываете это кому-то, кто не в вашей голове. Решение не для вас.
  • В то же время помните, что нельзя превращать каждый аспект в совершенно новую оценку! Легко поддаться влиянию вашего интеллекта и аналитических способностей.
  • Сосредоточьтесь на вопросе. Вы слышали об анализе-параличе?

Каковы цели предположительных вопросов для науки о данных?

  • Чтобы понять вашу способность понимать ситуацию.
  • Чтобы понять масштаб вашей способности соединять вещи, чтобы найти ответ.
  • Чтобы знать свою силу, чтобы расставлять приоритеты и отбрасывать различные параметры.
  • Чтобы понять, насколько хорошо вы работаете с неадекватной информацией.

Вот несколько предположительных вопросов для науки о данных:

Вопрос: 1 Создайте эксперимент с алгоритмом k-средних на наборе данных UCI Iris:

В этом эксперименте выполните кластеризацию k-средних, используя все функции в наборе данных, а затем сравните результаты кластеризации с меткой истинного класса для всех выборок.

Используйте модуль Multiclass Logistic Regression, чтобы выполнить мультиклассовую классификацию и сравнить ее производительность с эффективностью кластеризации k-средних.

Вопрос: 2 В очень простом формате объясните Precision & Recall?

Вопрос: 3. Если вам дали набор данных, как вы решаете, какой алгоритм машинного обучения выбрать для пользователя?

Вопрос:4 Лучше ли иметь слишком много ложных срабатываний? Или слишком много ложных срабатываний?

Вопрос:5 Что такое точность модели и производительность модели? Какой сценарий вы можете применить?

Вопрос: 6. Как убедиться, что вы не слишком подходите к модели? Объясните на примере.

Вопрос:7 Когда вы запускаете алгоритм дерева бинарной классификации, это довольно просто. Как в двоичном алгоритме дерево решает, какую переменную разделить в корневом узле и его последующих дочерних узлах?

Вопрос:8 Как описываются NumPy и SciPy?

Вопрос:9 Написать базовую программу машинного обучения для проверки точности набора данных, импортирующего любой набор данных с использованием любого классификатора?

Вопрос: 10 Создайте алгоритм регрессии для прогнозирования цены автомобиля на основе различных переменных.

Вопрос:11. Разработайте модель, в которой используются различные сетевые функции для определения того, какие сетевые действия являются частью вторжения/атаки с использованием бинарных классификаций.

Вопрос: 12. Как сгруппировать (группировать), чтобы найти похожие организации вместе на основе их описания в Википедии.

Вопрос: 13 Как бы вы предсказали, кто продлит подписку в следующем месяце?

  • Какие данные вам понадобятся, чтобы решить эту проблему?
  • Какой анализ вы бы сделали?
  • Какие алгоритмы прогностических моделей потребуются?

Вопрос: 14 Как бы вы сопоставили прозвища (Ален, Боб, Алекс, Тим и т. д.) с настоящими именами?

Вопрос: 15 Создайте прогноз о том, задерживается ли запланированный пассажирский рейс или нет, используя двоичный классификатор со скриптом R или Python.

Вопрос: 16 Прогноз цен на автомобили с помощью линейной регрессии с подготовкой и очисткой данных путем удаления столбца нормализованных потерь.

Поскольку в нем много пропущенных значений, создайте эксперимент и модель.

Вопрос: 17 Сколькими способами можно разделить 14 человек на 4 команды по 5 человек?

Вопрос:18 Площадь под стандартной нормальной кривой равна?

  • Больше 1
  • Равно 1
  • Меньше 1

Вопрос: 19 Создайте алгоритм регрессии для прогнозирования цены автомобиля на основе различных переменных.

Вопрос: 20 Ваш менеджер попросил построить случайную модель леса с 10 000 деревьев во время обучения, и вы получили ошибку обучения 0,00. Но при тестировании ошибка проверки была 34,23. На каком основании вы предполагаете, что пошло не так? Как бы вы проверили свою модель, если она не обучена идеально?

Вопрос: 21 На каком алгоритме основаны рекомендации «Люди, которые купили это, также купили…» на Amazon?

Вопрос: 22 Какие алгоритмы связаны в рекомендациях, которые вы видите как «Сегодняшние новости и просмотры»?

Читайте: вопросы интервью по науке о данных

Заключение

Мы надеемся, что эта статья помогла вам понять вопросы, связанные с предположениями в науке о данных, и способы их преодоления. Вы найдете больше полезных статей, подобных этой, на upGrad; мы предлагаем широкий спектр курсов, MBA, науку о данных, машинное обучение и т. д. Мы обеспечиваем наставничество от лучших специалистов отрасли!

Если вы заинтересованы в изучении науки о данных и выбираете карьеру в этой области, ознакомьтесь с программой Executive PG IIIT-B & upGrad в области науки о данных, которая создана для работающих профессионалов и предлагает более 10 тематических исследований и проектов, практические практические семинары. , наставничество с отраслевыми экспертами, индивидуальные встречи с отраслевыми наставниками, более 400 часов обучения и помощь в трудоустройстве в ведущих фирмах.

Каковы идеальные шаги для решения предполагаемой проблемы?

Прежде чем ответить на предполагаемый вопрос, разумно помнить о некоторых моментах, чтобы прийти к лучшей идее. Эти пункты заключаются в следующем. Прежде чем начать отвечать, вы должны развеять все свои сомнения относительно вопроса. Вы можете задать интервьюеру столько соответствующих вопросов, сколько захотите, но старайтесь избегать вопросов, ведущих к каким-либо числовым подсчетам. Это может плохо повлиять на интервьюера. Желательно придерживаться вопросов «да» или «нет», чтобы избежать плохого впечатления. Не пытайтесь решить проблему сразу, вместо этого разбейте ее на более мелкие подзадачи, а затем попытайтесь решить каждую меньшую проблему. Помните, что не разбивайте свою проблему более чем на 6 шагов. Этот метод поможет вам найти ответ даже путем длительных вычислений.

Что такое догадка?

Guesstimate — это понимание проблемы и поиск правильного подхода к ее решению. Это методологический метод теории и оценки. Самое главное в таких вопросах, как вы объясните решение.
Гестимация может показаться сложной задачей, особенно когда вы сначала смотрите на тип задаваемых вопросов. От размеров рынка крупных конгломератов до доходов и населения, подсчитать некоторые из этих величин даже приблизительно невозможно.

Какие существуют подходы к решению задачи с предположениями?

Простой математический подход. Этот подход в основном используется в тех случаях, когда число для оценки является своего рода отношением. Подход на душу населения - этот подход используется, когда число, которое нужно угадать, можно рассматривать как предмет потребления на уровне человека, домохозяйства или населения в пределах географии. Подход спроса и предложения — этот подход требует, чтобы вы думали о числе либо со стороны предложения, либо со стороны спроса.