데이터 과학을 위한 최고의 추측 질문 및 유익한 방법 [2022]

게시 됨: 2021-01-06

추측이란 무엇입니까?

추측은 이론 및 평가의 방법론적 방법입니다. 더 높은 정확도로 효율적으로 작업하는 데 도움이 됩니다. 결과를 통합하기 위해 데이터연구 하는 것입니다. 또한 비즈니스 분석가 또는 데이터 과학 및 데이터 설계자 또는 데이터 기술자의 필수 부분입니다.

  1. 의미: 해결하려는 문제와 그 목적이 무엇인지, 왜 해결하려는지 이해하는 것입니다.
  2. 정의: 특정 개체와 프로세스 흐름의 입력 및 출력에 관한 것입니다. 한마디로 설명하자면.
  3. 추측 : 생각과 결론에 관한 것입니다. 문제에서 특정 대상을 만들고 있습니다.
  4. Estimate: 주어진 문제에 대한 숫자의 추정치에 관한 것입니다.
  5. 아이디어 도출 : 연구 개발을 통해 아이디어를 구현합니다.

추정적인 질문이 시장의 규모를 물을 수 있을 때, 그것을 "시장 규모" 질문이라고 합니다.

추측에 대한 기본 질문은 다음과 같습니다.

  • 일반적인 월요일에 뉴욕에서 파란색 옷을 입는 사람은 몇 명입니까?
  • 비행기에 몇 개의 테니스 공을 넣을 수 있습니까?

추측에 접근하는 방법?

추측 문제를 해결하는 프로세스는 매우 관리하기 쉽습니다.

  1. 최종 수량에 영향을 미칠 수 있는 실행 가능한 매개변수를 살펴보고 그 수를 추정하십시오.
  2. 한발 물러서서 생각해보세요.
  3. 생각을 명확히 하세요.
  4. 당신의 생각을 말하세요.
  5. 간단한 수학 접근-

이 접근 방식은 일반적으로 추정할 숫자가 일종의 비율일 때 사용됩니다. 작업은 분자와 분모를 구하는 것입니다. 그러면 완료됩니다!

1. 1인당 접근-

이 접근 방식은 추측할 숫자를 지리 내에서 사람, 가구 또는 인구 수준의 소비 항목으로 생각할 수 있을 때 사용됩니다.

2. 수급 접근-

이 접근 방식은 품목의 공급 또는 수요(또는 둘 다) 측면에서 추정된 수치를 생각해야 합니다.

일반적으로 다음 두 가지 방법 중 하나로 추정치를 제안할 수 있습니다.

  • 하향식 방식
  • 상향식 방식

하향식에서는 추측이 일부인 가능한 가장 큰 우주부터 시작합니다.

가장 넓은 베이스가 상단에 있습니다. 그런 다음 이 유니버스에 유니버스의 수를 추정에 적합한 수로 줄이는 일련의 조건 또는 필터(원하는 대로)를 계속 적용합니다.

하향식 추정 프로세스의 핵심은 다음과 같습니다.

  1. 그것은 시작 우주를 정확하게 식별하고 있습니다.
  2. 추측 문제에 적용되는 관련 조건/필터 및 세그먼트를 최대한 정확하게 식별합니다.
  3. 세그먼트: 먼저 유니버스를 버킷으로 분할하고 각 세그먼트에 다른 필터를 적용해야 하는 경우가 많습니다.

데이터 과학에 대한 추측 질문에 대한 팁:

  1. 발표 연습: 완성한 특정 솔루션을 청중과 함께 발표하는 연습을 해야 합니다.
  2. 분석 연습: 분석은 주어진 문제에 대한 사고 과정을 만드는 데 중요한 역할을 합니다.
  3. 숫자로 연습하기: 숫자를 가지고 놀 거나 맞춤 논리를 만드는 것은 항상 중요합니다.

데이터 과학에 대한 추측 문제를 푸는 동안 다음 사항을 이해해야 합니다.

  • 당신은 당신의 머리에없는 사람에게 이것을 설명하고 있습니다. 솔루션은 당신을 위한 것이 아닙니다.
  • 동시에, 각 측면을 완전히 새로운 추측으로 바꾸지 않도록 하십시오! 당신의 지능과 분석 능력에 휘둘리기 쉽습니다.
  • 질문에 집중하세요. 분석-마비라고 들어보셨나요?

데이터 과학에 대한 추측 질문의 목적은 무엇입니까?

  • 상황을 이해하는 능력을 이해합니다.
  • 사물을 연결하고 답에 도달하는 능력의 범위를 이해합니다.
  • 다른 매개변수의 우선 순위를 지정하고 무시할 수 있는 자신의 강점을 알기 위해.
  • 불충분한 정보로 얼마나 잘 작업하는지 이해합니다.

다음은 데이터 과학에 대한 몇 가지 추측 질문입니다.

질문:1 UCI Iris 데이터 세트에 대한 k-평균 알고리즘으로 실험을 생성합니다.

이 실험에서는 데이터 세트의 모든 기능을 사용하여 k-means 클러스터링을 수행한 다음 클러스터링 결과를 모든 샘플에 대한 실제 클래스 레이블과 비교합니다.

다중 클래스 로지스틱 회귀 모듈을 사용하여 다중 클래스 분류를 수행하고 그 성능을 k-평균 클러스터링의 성능과 비교합니다.

질문:2 매우 간단한 형식으로 Precision & Recall을 설명하십시오.

질문:3 데이터 세트가 제공된 경우 사용자에게 어떤 ML 알고리즘을 제공할지 어떻게 결정합니까?

질문:4 오탐지가 너무 많은 것이 더 나은가요? 아니면 거짓 부정이 너무 많습니까?

질문:5 모델 정확도와 모델 성능은 무엇입니까? 어떤 시나리오를 적용할 수 있습니까?

질문:6 모델에 과적합되지 않도록 하려면 어떻게 해야 합니까? 예를 들어 설명하십시오.

질문:7 이진 분류 트리 알고리즘을 실행하면 매우 쉽습니다. 이진 알고리즘에서 트리는 루트 노드와 후속 자식 노드에서 분할할 변수를 어떻게 결정합니까?

질문:8 NumPy와 SciPy는 어떻게 설명됩니까?

질문:9 분류기를 사용하여 데이터 세트를 가져오는 데이터 세트의 정확성을 확인하는 기본 머신 러닝 프로그램을 작성하시겠습니까?

질문:10 다양한 변수를 기반으로 자동차 가격을 예측하는 회귀 알고리즘을 만듭니다.

질문:11 이진 분류를 사용하여 침입/공격의 일부인 네트워크 활동을 탐지하기 위해 다양한 네트워크 기능을 사용하는 모델을 개발하십시오.

질문:12 Wikipedia 설명을 기반으로 유사한 조직을 함께 찾기 위해 그룹화(클러스터링)하는 방법.

질문:13 다음 달에 누가 구독을 갱신할지 어떻게 예상하십니까?

  • 이 문제를 해결하려면 어떤 데이터가 필요할까요?
  • 어떤 분석을 하시겠습니까?
  • 어떤 종류의 예측 모델 알고리즘이 필요할까요?

질문:14 닉네임(Alen, Bob, Alex, Tim 등)을 실명에 매핑하려면 어떻게 하시겠습니까?

질문:15 R 또는 python 스크립트와 함께 이진 분류기를 사용하여 예정된 여객 비행이 지연되는지 여부에 대한 예측을 생성합니다.

질문:16 정규화된 손실 열을 제거하여 데이터 준비 및 정리와 함께 선형 회귀를 사용하여 자동차 가격을 예측합니다.

결측값이 많기 때문에 실험과 모델을 생성합니다.

질문:17 14명을 5명씩 4팀으로 나누는 방법은 몇 가지입니까?

질문:18 표준정규곡선 아래의 넓이는?

  • 1보다 큼
  • 1과 같음
  • 1 미만

질문:19 다양한 변수를 기반으로 자동차 가격을 예측하는 회귀 알고리즘을 만듭니다.

질문:20 당신의 상사는 당신의 훈련 중에 10000그루의 나무로 랜덤 포레스트 모델을 만들 것을 요청했고 당신은 0.00의 훈련 오류를 얻었습니다. 그러나 테스트에서 유효성 검사 오류는 34.23이었습니다. 무엇이 잘못되었다고 가정할 것인가? 모델이 완벽하게 훈련되지 않은 경우 어떻게 확인하시겠습니까?

질문:21 아마존에서 본 '이걸 구매한 사람들도 구매했습니다...' 추천은 어떤 알고리즘을 기반으로 합니까?

질문:22 '오늘의 뉴스 및 보기'로 표시되는 추천에 어떤 알고리즘이 연결되어 있습니까?

읽기: 데이터 과학 인터뷰 질문

결론

이 기사가 데이터 과학에 대한 추측적인 질문과 이를 극복하는 방법을 이해하는 데 도움이 되었기를 바랍니다. upGrad에서 이와 같은 더 유용한 기사를 찾을 수 있습니다. MBA, 데이터 과학, 기계 학습 등 다양한 과정을 제공합니다. 업계 최고의 개인으로부터 멘토링을 제공합니다!

데이터 과학 학습에 관심이 있고 이 분야의 직업을 선택하는 경우 작업 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크샵을 제공하는 IIIT-B & upGrad의 데이터 과학 경영자 PG 프로그램을 확인하십시오. , 업계 전문가와의 멘토링, 업계 멘토와의 1:1 학습, 최고의 기업과의 400시간 이상의 학습 및 취업 지원.

추측 문제를 해결하기 위한 이상적인 단계는 무엇입니까?

추측한 질문에 답하기 전에 더 나은 아이디어를 얻기 위해 몇 가지 사항을 염두에 두는 것이 좋습니다. 요점은 다음과 같습니다. - 답변을 시작하기 전에 질문에 대한 모든 궁금증을 해소해야 합니다. 면접관에게 원하는 만큼 관련 질문을 할 수 있지만 수치 계산으로 이어지는 질문은 피하십시오. 이는 면접관에게 좋지 않은 영향을 미칠 수 있습니다. 나쁜 인상을 받지 않도록 예 또는 아니오 질문에 충실하는 것이 좋습니다. 한 번에 문제를 해결하려고 하지 말고, 대신 더 작은 하위 문제로 나눈 다음 각각의 더 작은 문제를 해결하려고 합니다. 문제를 6단계 이상으로 나누지 마십시오. 이 방법은 긴 계산을 통해서도 답을 찾는 데 도움이 됩니다.

추측이란 무엇입니까?

추측은 문제를 이해하고 문제를 해결하기 위한 올바른 접근 방식을 찾는 것입니다. 이론과 평가의 방법론적 방법이다. 그러한 질문에서 가장 중요한 것은 솔루션을 설명하는 방법입니다.
Guestimation은 특히 질문의 종류를 처음 볼 때 어려운 작업처럼 느껴질 수 있습니다. 대기업의 시장 규모부터 매출 및 인구에 이르기까지 야구장 근처에서도 이러한 수량 중 일부를 계산하는 것은 현실적으로 불가능합니다.

추측 문제를 해결하기 위한 다양한 접근 방식은 무엇입니까?

단순 수학 접근 방식 - 이 접근 방식은 추정할 숫자가 일종의 비율인 경우에 주로 사용됩니다. 1인당 접근 방식 - 이 접근 방식은 추측할 숫자를 지역 내 사람, 가구 또는 인구 수준의 소비 항목으로 생각할 수 있을 때 사용됩니다. 공급 및 수요 접근 방식 - 이 접근 방식을 사용하려면 공급 측면이나 수요 측면에서 숫자에 대해 생각해야 합니다.