2022년 상위 30개 데이터 웨어하우스 인터뷰 질문 및 답변 [신입생 및 경험자용]

게시 됨: 2021-01-06

이 기사에 나열된 데이터 웨어하우스 인터뷰 질문 은 데이터 웨어하우스 및 비즈니스 인텔리전스 경력에 있는 사람들에게 도움이 될 것입니다. 머신 러닝의 도래와 함께 인사이트를 얻고 결과를 더 빠르게 구현하려면 대량의 데이터를 분석해야 합니다. 데이터 처리 단계가 데이터 저장, 동화, 가져오기 및 처리였던 시대는 지났습니다. 그러나 데이터의 양이 증가함에 따라 이러한 데이터를 처리하고 즉각적인 결과를 보여줘야 합니다.

의료, BFSI, 유틸리티 및 많은 정부 기관과 같은 모든 비즈니스는 데이터 과학의 데이터 웨어하우스로 변화하고 있습니다. 이에 따라 데이터 웨어하우스에 대한 전문 지식을 갖춘 전문가를 더 많이 고용하여 대용량 데이터를 분석하고 관련 인사이트를 제공할 수 있습니다. 따라서 데이터 웨어하우스 인터뷰 질문 은 인터뷰를 쉽게 해독하고 중요한 지식을 얻는 데 적합합니다.

방대한 데이터를 처리하고 데이터베이스를 관리하는 데 열정이 있다면 데이터 웨어하우스는 훌륭한 직업 옵션입니다. 이 기사에서는 다음 면접 준비에 도움이 될 수 있는 데이터 웨어하우스 면접 질문 을 받습니다. 질문은 기본 수준에서 전문가 수준까지이므로 더 신선하고 숙련된 전문가 모두 이러한 데이터 웨어하우스 인터뷰 질문 의 이점을 얻을 수 있습니다.

목차

데이터 웨어하우스 인터뷰 질문

Q1: 데이터 웨어하우스 측면에서 데이터 분석이란 무엇입니까?

데이터 분석은 원시 데이터를 확인하여 데이터의 비즈니스 중심 결론을 도출하는 과학입니다. 데이터 웨어하우스는 데이터 분석을 가능하게 합니다.

Q2: 주제 지향 데이터 웨어하우스를 정의합니까?

주제 지향 데이터 웨어하우스는 판매, 클라이언트 및 제품과 같은 특정 지점에 대한 데이터를 저장합니다.

Q3: OLAP는 무엇을 의미하며 그 유형은 무엇입니까?

OLAP은 관리를 위해 다차원 데이터를 처리, 관리 및 수집하는 시스템입니다. 온라인 분석 처리의 약자입니다.

다음과 같은 네 가지 유형의 OLAP 서버가 있습니다.

  • 하이브리드 OLAP
  • 관계형 OLAP
  • 전문화된 SQL 서버
  • 다차원 OLAP

Q4: OLAP와 OLTP의 차이점은 무엇입니까?

OLAP는 비즈니스 의사 결정에 도움이 되는 데이터 분석에 사용되는 소프트웨어 도구이며 OLTP는 3계층 아키텍처에서 사용되는 트랜잭션 지향 응용 프로그램입니다. 다음은 OLAP과 OLTP의 몇 가지 차이점입니다.

OLAP(온라인 분석 처리) OLTP(온라인 거래 처리)
여기에는 다른 데이터베이스에서 수집된 기록 데이터가 포함됩니다. 운영 데이터가 포함되어 있습니다.
데이터 분석, 데이터 마이닝 및 의사 결정에 사용됩니다. 응용 지향적이며 다양한 비즈니스 관련 작업에 사용됩니다.
그것은 엄청난 양의 데이터를 저장하고 TB에 있습니다. 소량의 데이터를 저장하며 MB, GB 등으로 저장됩니다.
데이터의 크기가 크기 때문에 느리게 작동합니다. 매우 빠르게 작동하며 쿼리는 저장된 데이터의 5%에서 발생합니다.
때때로 데이터 백업만 필요합니다. 데이터의 백업 및 복구는 정기적으로 발생합니다.
쓰기 작업이 거의 발생하지 않는 읽기 작업에 주로 사용됩니다. 읽기 및 쓰기 작업 모두에 사용됩니다.

Q5: OLAP는 어떤 기능을 수행합니까?

OLAP에서 수행하는 몇 가지 주요 기능은 피벗, 드릴다운, 롤업, 슬라이스 및 주사위입니다.

Q6: ER 다이어그램이란 무엇입니까?

ER Diagram은 Entity-Relationship Diagram의 약자로 데이터베이스의 엔터티 간의 상호 관계를 보여줍니다.

질문 7: SCD가 무엇입니까?

SCD는 천천히 변화하는 차원을 의미하며 시간이 지남에 따라 기록이 변하는 경우에 적용됩니다.

Q8: SCD의 유형을 정의하십시오.

SCD에는 다음과 같이 3가지 유형이 있습니다.

SCD 1: 새 레코드가 원래 레코드를 대체합니다.

SCD 2: 새 레코드가 기존 클라이언트 테이블에 추가됩니다.

SCD 3: 원본 데이터가 변경되어 새 데이터를 입력합니다.

Q9: Snowflake 스키마란 무엇입니까?

Snowflake 스키마는 기본 차원 테이블이 있는 스키마입니다. 기본 차원 테이블에서 하나 이상의 차원을 조인할 수 있습니다. 팩트 테이블과 조인할 수 있는 유일한 테이블입니다.

Q 10: 스타 스키마를 정의하십시오.

스타 스키마는 데이터 웨어하우스 환경에서 결과를 쉽게 복구할 수 있는 방식으로 테이블을 관리하는 것을 말합니다.

Q11: BUS 스키마를 정의하십시오.

BUS 스키마에는 팩트 테이블이 있는 경우 표준화된 정의 및 확인된 차원이 포함됩니다.

질문 12: 메타데이터를 정의하십시오.

데이터에 대한 데이터를 말합니다. 메타데이터는 필드 순서, 사용된 여러 열, 필드의 데이터 유형, 제한된 너비 및 고정 너비와 같은 세부 정보로 구성됩니다.

Q13: 핵심 차원을 정의하십시오.

Core Dimension은 주로 데이터 마트 또는 단일 팩트 테이블에 사용되는 Dimension Table입니다.

Q14: 데이터 웨어하우스에서 루프를 정의하십시오.

이러한 루프는 데이터 웨어하우스의 테이블 사이에 존재합니다. 테이블 사이에 루프가 있으면 쿼리 생성에 더 많은 시간이 걸리고 수수께끼가 생성됩니다. 따라서 항상 테이블 사이의 루프를 피하는 것이 좋습니다.

Q15: XMLA를 설명하십시오.

XMLA는 XML for Analysis라고 하며 OLAP, 데이터 마이닝 및 인터넷을 통해 사용할 수 있는 기타 데이터 소스의 데이터에 액세스하는 표준 방법을 제공합니다. 검색 및 실행 메서드를 사용하는 간단한 개체 액세스 프로토콜입니다. 검색 방법은 인터넷에서 데이터를 검색하고 실행 방법은 다른 데이터 소스에 대해 응용 프로그램을 실행하는 데 사용됩니다.

읽기: 데이터 과학 인터뷰 질문

Q16: 데이터베이스와 데이터 웨어하우스의 차이점을 설명하십시오.

데이터베이스는 데이터 저장을 위해 관계형 모델을 사용하기 때문에 데이터베이스는 데이터 웨어하우스와 다릅니다. 이에 반해 데이터 웨어하우스는 다른 스키마를 사용하며 시작 스키마도 그 중 하나입니다. 다음은 데이터베이스와 데이터 웨어하우스의 몇 가지 차이점입니다.

특징 데이터 베이스 데이터웨어 하우스
데이터 형식 관계형 데이터 또는 객체 지향 데이터 대용량 데이터
운영 거래 처리 데이터 모델링 및 데이터 분석
치수 2차원 데이터 다차원 데이터
데이터 디자인 응급실 기반 별과 눈송이 스키마
데이터 크기 작은 크기가 큰
기능 고성능 및 가용성 높은 유연성

Q17: 데이터 웨어하우스에서 큐브를 정의하십시오.

데이터 웨어하우스의 큐브는 다차원 데이터를 나타냅니다. 큐브의 본문은 데이터 값으로 구성되고 큐브의 가장자리에는 차원 구성원이 포함됩니다.

Q18. 데이터 웨어하우스의 유형을 설명합니까?

데이터 웨어하우스는 다음 3가지 유형이 있습니다.

  1. 엔터프라이즈 데이터 웨어하우스: 엔터프라이즈 데이터 웨어하우스에서는 다양한 기능 영역의 조직 데이터가 중앙 집중식으로 병합됩니다. 이는 데이터 모델의 모든 개체에 대한 자세한 개요를 제공하는 데이터 추출 및 변환에 도움이 됩니다.
  2. 운영 데이터 저장소: 이 데이터 웨어하우스는 데이터베이스에서 직접 데이터에 액세스하는 데 도움이 되며 트랜잭션 처리도 지원합니다. 다양한 소스의 대비 데이터를 통합하여 나중에 다양한 비즈니스 운영을 지원합니다.
  3. 데이터 마트: 이 데이터 웨어하우스는 특정 기능 영역에 대한 데이터를 저장합니다. 또한 데이터 웨어하우스에 저장되는 하위 집합 형태의 데이터를 포함합니다. 사용자가 효율적으로 분석하고 통찰력을 얻을 수 있도록 대용량 데이터를 줄입니다.

Q19: 다차원 OLAP과 관계형 OLAP 중 어느 것이 더 빨리 작동합니까?

다차원 OLAP은 관계형 OLAP보다 빠르게 작동합니다.

  1. 다차원 OLAP: MOLAP에서 데이터는 다차원 큐브에 저장됩니다. 데이터 저장은 PowerOLAP.olp 파일과 같은 독점 형식으로 발생합니다. 이러한 제품은 Excel과 호환되며 데이터 상호 작용을 쉽게 만듭니다.
  2. 관계형 OLAP: 관계형 OLAP 제품에서 관계형 데이터베이스는 RDBMS에서 데이터를 조작하는 데 사용되는 표준 언어인 SQL로 액세스할 수 있습니다. 처리를 수행하는 동안 클라이언트 요청을 수락한 다음 SQL 쿼리로 변환된 다음 RDBMS로 전달됩니다.

Q20: 분할 계층적 클러스터링과 응집적 클러스터링의 차이점을 설명하십시오.

집합적 계층적 클러스터링 방법에서 클러스터는 아래에서 위로 읽습니다. 즉, 프로그램이 먼저 하위 구성요소를 읽은 다음 상위 구성요소를 읽습니다. 반면에 분할 계층적 클러스터링은 상위 수준에서 데이터를 먼저 읽은 다음 하위 수준에서 데이터를 읽는 하향식 접근 방식을 사용합니다.

Agglomerative 계층적 방법에서는 객체가 존재하고 각 객체가 클러스터를 구축하고 이러한 클러스터가 모두 함께 큰 클러스터를 만듭니다. 이 방법은 주로 하나의 큰 클러스터가 생성될 때까지 발생하는 연속적인 병합으로 구성되는 반면, 분할 클러스터링 방법은 클러스터의 분할이 발생합니다. 상위 클러스터는 더 작은 클러스터로 나뉩니다. 이러한 클러스터 분할은 각 클러스터가 단일 개체로 구성될 때까지 계속됩니다.

자세히 알아보기: 데이터 과학 대 데이터 마이닝: 데이터 과학과 데이터 마이닝의 차이점

Q21: 데이터 웨어하우스에서 카멜레온 방식이란 무엇입니까?

카멜레온은 데이터 웨어하우스의 계층적 클러스터링 방법입니다. 이 방법은 노드와 간선으로 구성된 희소 그래프에서 작동합니다. 이 노드는 데이터 항목을 나타내고 간선은 가중치를 나타냅니다. 이 표현을 사용하면 기존 방법의 단점을 쉽게 극복하고 데이터 세트를 생성하고 액세스할 수 있습니다. 이 방법은 두 단계로 작동합니다.

  • 첫 번째 단계에서 그래프는 데이터 항목이 많은 하위 클러스터로 분할되는 일부로 분할됩니다.
  • 두 번째 단계에서는 첫 번째 단계에서 생성된 다른 하위 클러스터와 결합할 수 있는 정품 클러스터를 검색합니다.

Q22: 실행 계획은 무엇이며 실행 계획 중에 옵티마이저는 어떤 접근 방식을 사용합니까?

실행 계획은 옵티마이저가 SQL 쿼리 실행을 위한 단계 조합을 선택하는 데 사용하는 계획입니다. 옵티마이저는 SQL 쿼리를 실행하기 위한 가장 효율적인 단계 조합을 선택합니다. 옵티마이저는 실행 계획에서 규칙 기반 및 비용 기반의 두 가지 접근 방식을 사용합니다.

Q23: ETL(추출, 변환 및 로드)에서 사용되는 다양한 도구는 무엇입니까?

다음은 ETL 도구 목록입니다.

  • 인포매티카
  • 신탁
  • 데이터 단계
  • 데이터 접합
  • 압 이니티오
  • 창고 건축업자

Q24: 메타데이터와 데이터 사전은 어떻게 다릅니까?

메타데이터는 데이터를 설명합니다. 여기에는 데이터 소스, 데이터를 수집한 사람 및 데이터 형식과 같은 데이터에 대한 모든 정보가 포함됩니다. 데이터 웨어하우스에 저장된 데이터에 대한 정보를 이해하는 것이 중요합니다. 반면에 데이터 사전은 데이터베이스의 기본 정의입니다. 데이터 사전은 데이터베이스에 존재하는 파일, 각 파일에 존재하는 레코드 수, 데이터베이스의 필드에 대한 모든 정보로 구성됩니다.

Q25: 가상 데이터 웨어하우스를 정의하십시오.

가상 데이터 웨어하우스는 전체 데이터에 대한 종합적인 보기를 제공합니다. 메타데이터의 논리적 데이터 모델과 같으며 과거 데이터가 없습니다. 가상 데이터 웨어하우스는 원시 데이터를 번역하고 의사 결정자가 사용할 수 있는 형태로 제공하는 가장 좋은 방법입니다. 데이터는 최종 사용자가 데이터를 가상화된 형태로 볼 수 있도록 하는 시맨틱 맵으로 표시됩니다.

읽어보기: 데이터 분석가 인터뷰 질문 및 답변

Q26: 데이터 웨어하우스를 설계하는 데 사용되는 접근 방식은 무엇입니까?

데이터 웨어하우스 설계에는 주로 두 가지 접근 방식이 사용됩니다.

  1. Inmon 방식: 먼저 데이터 웨어하우스를 생성한 다음 데이터 마트를 구축하는 하향식 접근 방식입니다. 이 접근 방식에서 데이터 웨어하우스는 Corporate Information Factory의 중심 역할을 하고 데이터 웨어하우스는 논리적 프레임워크 역할을 합니다.
  2. Kimball 접근법: 데이터 마트가 먼저 생성되는 상향식 접근법입니다. 그런 다음 데이터 마트가 통합되어 완전한 데이터 웨어하우스를 형성합니다. 서로 다른 데이터 마트의 통합을 데이터 웨어하우스 버스 아키텍처라고 합니다.

Q27: 실시간 데이터 웨어하우스란 무엇이며 이점은 무엇입니까?

실시간 데이터 웨어하우스는 실시간 데이터가 발생하는 즉시 캡처하여 데이터 웨어하우스에서 사용할 수 있도록 하는 데이터 웨어하우스 개념입니다.

실시간 데이터 웨어하우스의 이점:

  • 쉬운 의사결정에 도움이 됩니다.
  • 배치 창을 제거합니다.
  • 이상적인 데이터 로드와 관련된 문제를 해결합니다.
  • 데이터베이스에서 변환을 실행하는 최적화된 방법을 제공합니다.
  • 그것은 데이터의 빠른 복구를 제공합니다.

Q28: ETL 주기의 3계층 아키텍처를 설명하십시오.

ETL 주기는 아래 3개의 레이어로 구성됩니다.

  1. 스테이징 레이어: 이 레이어는 여러 데이터 구조에서 추출한 데이터를 저장합니다.
  2. 데이터 통합 ​​계층: 스테이징 계층의 데이터는 통합 계층의 도움으로 데이터베이스로 전송됩니다. 그런 다음 이 데이터는 차원, 집계 및 팩트라고도 하는 계층적 그룹으로 구성됩니다. 차원과 사실이 함께 스키마를 형성합니다.
  3. 액세스 계층: 최종 사용자는 액세스 계층을 통해 데이터에 액세스하고 데이터 분석을 수행합니다.

Q29: 데이터 삭제란 무엇입니까?

데이터 제거는 데이터 저장소에서 데이터를 영구적으로 제거하는 방법입니다. 데이터 삭제는 데이터를 일시적으로만 제거하는 반면 데이터 삭제는 데이터를 영구적으로 제거하고 여유 공간을 다른 용도로 사용한다는 점에서 데이터 삭제와 다릅니다. 데이터 제거는 다른 방법을 사용합니다. 필요한 경우 제거된 데이터를 보관할 수 있습니다.

Q30: 프로젝트의 테스트 단계를 정의합니다.

ETL 테스트는 다음과 같이 5단계로 구성됩니다.

  1. 요구 사항 및 데이터 소스 식별
  2. 데이터 취득
  3. 비즈니스 로직 구현
  4. 데이터 구축 및 게시
  5. 보고

또한 확인하십시오: 데이터 과학 대 빅 데이터: 데이터 과학과 빅 데이터의 차이점

합산

다음 인터뷰 준비에 확실히 도움이 될 가장 자주 묻는 데이터 웨어하우스 인터뷰 질문 이었습니다. 데이터 웨어하우스에 대해 더 알고 싶다면 upGrad 를 방문 하여 더 많은 지식을 얻을 수 있습니다. 데이터 웨어하우스 인터뷰 질문을 올바르게 이해하는 데 도움이 되는 관련 정보를 찾을 수 있습니다 .

데이터 과학에 대해 자세히 알아보려면 작업 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크숍, 업계 전문가와의 멘토링, 1 - 업계 멘토와 일대일, 400시간 이상의 학습 및 최고의 기업과의 취업 지원.

데이터 웨어하우징에서 경력을 시작하려면 어떻게 해야 합니까?

데이터 웨어하우징은 모든 조직의 데이터 수집 및 사용이 증가함에 따라 수요가 많은 직위임이 밝혀졌습니다. 모든 조직은 데이터를 처리하고 데이터에서 통찰력을 얻기 위해 실행 가능한 통찰력으로 변환할 수 있는 전문가를 찾고 있습니다.

데이터 웨어하우징에 입문하는 데 필요한 기술은 다음과 같습니다.

1. 최고 수준의 연구, 문제 해결 및 분석 능력.
2. 컴퓨터 과학 또는 IT와 같은 기타 관련 분야의 학사 학위.
3. 관계형 데이터베이스 이론에 대한 올바른 지식
4. 3-5년 동안 데이터베이스 시스템 작업 경험
5. 데이터 모델링 및 아키텍처 작업 경험
6. 구두 및 서면 의사 소통에 대한 명령.
7. 기술회원 및 비기술회원이 제공하는 정보를 잘 듣고 이해하는 자

이들은 데이터 웨어하우징 분야에서 경력을 쌓기 위해 시작해야 하는 기술 중 일부입니다.

데이터 웨어하우징에서 경력을 시작하려면 어떻게 해야 합니까?

데이터 웨어하우징 분야에서 경력을 쌓기 위해 충족해야 하는 특정 요구 사항이 있습니다.

1. 첫째, 모든 개인은 컴퓨터 과학 또는 관련 분야의 학사 학위를 소지해야 합니다.
2. 최소 2년의 SQL 서버 코딩 및 관리 경험이 중요합니다.
3. 서버 통합에 대한 이해 및 ETL 도구 사용
4. 데이터 웨어하우징 및 데이터 모델링 기술에 대한 적절한 지식
5. 기본 MS 오피스 스킬

과정을 수강하면 전체 과정을 매우 간단하게 만들 수 있습니다. 데이터베이스 관리 및 데이터베이스 관리를 위해 다양한 대학 및 플랫폼에서 제공하는 많은 교육 프로그램이 있습니다. 나중에 경험을 쌓고 현장의 모든 것을 이해하기 위해 초급 직업을 가질 수 있습니다.

회사에서 데이터 웨어하우징의 다양한 단계는 무엇입니까?

기업 규모, 연령, 업종에 따라 데이터 웨어하우징의 단계는 아래 4단계 이내가 됩니다.

1. 오프라인 데이터베이스
2. 오프라인 데이터 웨어하우스
3. 실시간 데이터 웨어하우스
4. 통합 데이터 웨어하우스

모든 회사는 1단계에서 시작하여 4단계에 도달하여 비즈니스 시스템의 모든 것을 통합하려고 합니다. 데이터 웨어하우스의 적절한 기능은 데이터 웨어하우스 관리자가 데이터를 분석하고 실행 가능한 통찰력을 생성하는 것을 더 쉽게 만들 수 있습니다.