2022年のデータウェアハウスインタビューの質問と回答のトップ30[新入生と経験者向け]

公開: 2021-01-06

この記事に記載されているデータウェアハウスの面接の質問は、データウェアハウスとビジネスインテリジェンスのキャリアを持っている人に役立ちます。 機械学習の出現により、洞察を得て結果をより迅速に実装するために、大量のデータを分析する必要があります。データ処理のステップがデータの保存、同化、フェッチ、および処理であった時代は過ぎ去りました。しかし、データの量が増えるにつれて、そのようなデータを処理して即座に結果を表示する必要があります。

ヘルスケア、BFSI、公益事業、および多くの政府機関などのすべてのビジネスは、データサイエンスのデータウェアハウスに移行しています。この結果、データウェアハウスの専門知識を持つより多くの専門家が採用され、大量のデータを分析して関連する洞察を提供できるようになります。したがって、データウェアハウスの面接の質問は、面接を簡単にクラックし、重要な知識を得るのに適切になります。

大量のデータの処理とデータベースの管理に情熱を注いでいる場合は、データウェアハウスが最適なキャリアオプションです。この記事では、次の面接の準備に役立つデータウェアハウスの面接の質問を取得します。 質問は基本レベルから専門家レベルまでであるため、初心者と経験豊富な専門家の両方が、これらのデータウェアハウスインタビューの質問から恩恵を受けることができます。

データウェアハウスのインタビューの質問

Q1：データウェアハウスの観点からのデータ分析とは何ですか？

データ分析は、生データをチェックして、データのビジネス主導の結論を引き出す科学です。データウェアハウスはデータ分析を可能にします。

Q2：サブジェクト指向のデータウェアハウスを定義しますか？

サブジェクト指向のデータウェアハウスは、販売、クライアント、製品などの特定のポイントに関するデータを格納します。

Q3：OLAPとはどういう意味ですか、またそのタイプは何ですか？

OLAPは、管理のために多次元データを処理、管理、および収集するシステムです。これは、OnlineAnalyticalProcessingの略です。

以下に示す4つのタイプのOLAPサーバーがあります。

ハイブリッドOLAP
リレーショナルOLAP
専用SQLServer
多次元OLAP

Q4：OLAPとOLTPの違いは何ですか？

OLAPはデータ分析に使用されるソフトウェアツールであり、ビジネス上の意思決定に役立ちます。OLTPは、3層アーキテクチャで使用されるトランザクション指向のアプリケーションです。以下は、OLAPとOLTPの違いの一部です。

OLAP（オンライン分析処理）	OLTP（オンライントランザクション処理）
さまざまなデータベースから収集された履歴データが含まれています。	運用データが含まれています。
これは、データ分析、データマイニング、および意思決定で使用されます。	これはアプリケーション指向であり、さまざまなビジネス関連のタスクに使用されます。
大量のデータを保存し、TB単位で表示されます。	少量のデータを保存し、MB、GBなどで保存されます。
データのサイズが大きいため、動作が遅くなります。	これは非常に高速に動作し、保存されたデータの5％でクエリが実行されます。
時々のみデータのバックアップが必要です。	データのバックアップとリカバリは定期的に行われます。
主に読み取り操作に使用され、書き込み操作はほとんど発生しません。	読み取り操作と書き込み操作の両方に使用されます。

Q5：OLAPはどのような機能を実行しますか？

OLAPによって実行される主な機能のいくつかは、ピボット、ドリルダウン、ロールアップ、スライス、およびダイスです。

Q6：ER図とは何ですか？

ERダイアグラムは、データベース内のエンティティ間の相互関係を示すエンティティ関係図の略です。

Q7：SCDとは何ですか？

SCDはゆっくりと変化するディメンションの略で、レコードが時間の経過とともに変化するような場合に適用されます。

Q8：SCDの種類を定義してください。

SCDには以下の3種類があります。

SCD 1：新しいレコードが元のレコードを置き換えます。

SCD 2：新しいレコードが既存のクライアントテーブルに追加されます

SCD 3：元のデータは、新しいデータを入力するために変更されます。

Q9：スノーフレークスキーマとは何ですか？

Snowflake Schemaは、プライマリディメンションテーブルを持つスキーマです。 1つ以上のディメンションをプライマリディメンションテーブルに結合できます。これは、ファクトテーブルと結合できる唯一のテーブルです。

Q 10：スタースキーマを定義します。

スタースキーマとは、データウェアハウス環境で結果を簡単に復元できる方法でテーブルを管理することを指します。

Q11：BUSスキーマを定義します。

BUSスキーマには、ファクトテーブルが存在する場合、標準化された定義と確認済みのディメンションのスイートが含まれています。

Q 12：メタデータを定義します。

データに関するデータを指します。メタデータは、フィールドの順序、使用されるいくつかの列、フィールドのデータ型、制限された幅、固定された幅などの詳細で構成されます。

Q13：コア寸法を定義します。

コアディメンションは、主にデータマートまたは単一のファクトテーブルに使用されるディメンションテーブルです。

Q14：データウェアハウスでループを定義します。

これらのループは、データウェアハウスのテーブル間に存在します。テーブル間にループがある場合、クエリの生成に時間がかかり、謎が作成されます。したがって、テーブル間のループを回避することを常にお勧めします。

Q15：XMLAについて説明してください。

XMLAはXMLforAnalysisと呼ばれ、OLAP、データマイニング、およびインターネット上で利用可能なその他のデータソースからのデータにアクセスするための標準的な方法を提供します。これは、discoverメソッドとexecuteメソッドを使用する単純なオブジェクトアクセスプロトコルです。検出メソッドはインターネットからデータを取得し、実行メソッドはさまざまなデータソースに対してアプリケーションを実行するために使用されます。

読む：データサイエンスのインタビューの質問

Q16：データベースとデータウェアハウスの違いを説明してください。

データベースはデータストレージにリレーショナルモデルを使用するため、データベースはデータウェアハウスとは異なります。対照的に、データウェアハウスは他のスキーマを使用し、開始スキーマはその1つです。以下は、データベースとデータウェアハウスの違いの一部です。

特徴	データベース	データウェアハウス
データ・タイプ	リレーショナルデータまたはオブジェクト指向データ	大量のデータ
操作	トランザクション処理	データモデリングとデータ分析
寸法	二次元データ	多次元データ
データ設計	ERベース	スターとスノーフレークスキーマ
データのサイズ	小さい	大きい
機能性	高性能と可用性	高い柔軟性

Q17：データウェアハウスでキューブを定義します。

データウェアハウス内のキューブは、多次元データの表現です。キューブの本体はデータ値で構成され、キューブのエッジにはディメンションメンバーが含まれます。

Q18。 データウェアハウスの種類を説明しますか？

データウェアハウスには、次の3つのタイプがあります。

エンタープライズデータウェアハウス：エンタープライズデータウェアハウスでは、さまざまな機能領域からの組織データが一元化された方法でマージされます。これは、データの抽出と変換に役立ち、データモデル内のオブジェクトの詳細な概要を提供します。
オペレーショナルデータストア：このデータウェアハウスは、データベースから直接データにアクセスするのに役立ち、トランザクション処理もサポートします。さまざまなソースからのコントラストデータを統合し、後でさまざまなビジネスオペレーションをサポートします。
データマート：このデータウェアハウスは、特定の機能領域のデータを格納します。 また、サブセットの形式でデータが含まれ、データウェアハウスに保存されます。これにより、ユーザーがデータを効率的に分析して洞察を得るための大量のデータが削減されます。

Q19：多次元OLAPとリレーショナルOLAPの間で、どちらがより高速に動作しますか？

多次元OLAPは、リレーショナルOLAPよりも高速に動作します。

多次元OLAP： MOLAPでは、データは多次元キューブに格納されます。 データの保存は、PowerOLAP.olpファイルなどの独自の形式で行われます。これらの製品はExcelと互換性があり、データのやり取りを簡単にします。
リレーショナルOLAP：リレーショナルOLAP製品では、RDBMSのデータを操作するために使用される標準言語であるSQLを使用してリレーショナルデータベースにアクセスできます。処理の実行中に、クライアント要求を受け入れます。クライアント要求はSQLクエリに変換され、RDBMSに渡されます。

Q20：分割型階層的クラスタリングと凝集型クラスタリングの違いを説明してください。

凝集型階層的クラスタリング手法では、クラスターは下から上に読み取られます。つまり、プログラムは最初にサブコンポーネントを読み取り、次に親を読み取ります。一方、分割型階層的クラスタリングでは、親レベルのデータが最初に読み取られ、次に子レベルで読み取られる、上から下へのアプローチが使用されます。

Agglomerative階層的方法では、オブジェクトが存在し、各オブジェクトがそのクラスターを構築し、これらすべてのクラスターが一緒になって大きなクラスターを形成します。この方法は主に、単一の大きなクラスターが作成されるまで発生する連続的なマージで構成されますが、分割クラスタリング方式では、クラスターの分割が発生します。親クラスターは、より小さなクラスターに分割されます。このクラスターの分割は、各クラスターが単一のオブジェクトで構成されるまで続きます。

詳細：データサイエンスとデータマイニング：データサイエンスとデータマイニングの違い

Q21：データウェアハウスのカメレオン方式とは何ですか？

カメレオンは、データウェアハウスの階層的クラスタリング手法です。この方法は、ノードとエッジで構成されるスパースグラフで機能します。これらのノードはデータ項目を表し、エッジは重みを表します。この表現を使用すると、既存のメソッドの欠点を簡単に克服して、データセットを作成およびアクセスできます。この方法は2つのフェーズで機能します。

最初のフェーズでは、グラフが分割され、その一部としてデータ項目が多くのサブクラスターに分割されます。
第2フェーズでは、本物のクラスターが検索され、第1フェーズで作成された他のサブクラスターと組み合わせることができます。

Q22：実行プランとは何ですか？オプティマイザーは実行プラン中にどのようなアプローチを使用しますか？

実行プランは、SQLクエリを実行するためのステップの組み合わせを選択するためにオプティマイザーが使用するプランです。オプティマイザは、SQLクエリを実行するための最も効率的なステップの組み合わせを選択します。オプティマイザは、実行プランで2つのアプローチ、つまりルールベースとコストベースを使用します。

Q23：ETL（抽出、変換、読み込み）で使用されるさまざまなツールは何ですか？

以下はETLツールのリストです。

Informatica
オラクル
データステージ
データジャンクション
Ab Initio
倉庫ビルダー

Q24：メタデータとデータディクショナリはどのように異なりますか？

メタデータはデータを記述します。これには、データのソース、データの収集者、データ形式など、データに関するすべての情報が含まれています。データウェアハウスに保存されているデータに関する情報を理解することが重要です。一方、データディクショナリはデータベースの基本的な定義です。データディクショナリは、データベースに存在するファイル、各ファイルに存在するレコードの数、およびデータベースのフィールドに関するすべての情報で構成されます。

Q25：仮想データウェアハウスを定義します。

仮想データウェアハウスは、完全なデータの集合的なビューを提供します。これはメタデータの論理データモデルのようなものであり、履歴データはありません。仮想データウェアハウスは、生データを変換し、意思決定者が使用できるような形式で表示するための最良の方法です。データは、エンドユーザーが仮想化された形式でデータを表示できるようにするセマンティックマップとして表されます。

また読む：データアナリストインタビューの質問と回答

Q26：データウェアハウスの設計にはどのようなアプローチが使用されますか？

データウェアハウスの設計に使用されるアプローチは主に2つあります。

インモンアプローチ：これはトップダウンアプローチであり、最初にデータウェアハウスが作成され、次にデータマートが構築されます。 このアプローチでは、データウェアハウスは企業情報ファクトリの中心として機能し、データウェアハウスは論理フレームワークとして機能します。
キンボールアプローチ：データマートが最初に作成されるボトムアップアプローチです。 次に、データマートが統合されて完全なデータウェアハウスが形成されます。異なるデータマートの統合は、データウェアハウスバスアーキテクチャと呼ばれます。

Q27：リアルタイムデータウェアハウスとは何ですか？その利点は何ですか？

リアルタイムデータウェアハウスは、リアルタイムデータが発生するとすぐにキャプチャし、データウェアハウスで利用できるようにするデータウェアハウスの概念です。

リアルタイムデータウェアハウスの利点：

簡単な意思決定に役立ちます。
バッチウィンドウを削除します。
理想的なデータロードに関連する問題を解決します。
これは、データベースで変換を実行するための最適化された方法を提供します。
それはデータの迅速な回復を提供します。

Q28：ETLサイクルの3層アーキテクチャについて説明してください。

ETLサイクルは、以下の3つのレイヤーで構成されます。

ステージングレイヤー：このレイヤーは、複数のデータ構造から抽出されたデータを格納します。
データ統合レイヤー：ステージングレイヤーからのデータは、統合レイヤーの助けを借りてデータベースに転送されます。 次に、このデータは、ディメンション、集計、ファクトとも呼ばれる階層グループに編成されます。ディメンションとファクトが一緒になってスキーマを形成します。
アクセスレイヤー：エンドユーザーは、アクセスレイヤーを介してデータにアクセスし、データ分析を実行します。

Q29：データパージとは何ですか？

データパージは、データストレージからデータを完全に削除する方法です。データの削除とは異なり、データの削除ではデータが一時的に削除され、データの削除ではデータが完全に削除され、空き領域は他の目的に使用されます。データのパージにはさまざまな方法があります。パージされたデータは、必要に応じてアーカイブできます。

Q30：プロジェクトのテストフェーズを定義します。

ETLテストは、以下に示す5つの段階で構成されています。

要件とデータソースの識別
データ収集
ビジネスロジックの実装
データの構築と公開
報告

また、チェックしてください：データサイエンスとビッグデータ：データサイエンスとビッグデータの違い

まとめ

これらは、データウェアハウスの面接で最もよく聞かれる質問であり、次の面接の準備に確実に役立ちます。 データウェアハウスについて詳しく知りたい場合は、 upGradにアクセスして、より詳細な知識を得ることができます。 データウェアハウスの面接の質問を正しく理解するのに役立つ関連情報を見つけることができます。

データサイエンスについて知りたい場合は、IIIT-B＆upGradのデータサイエンスのエグゼクティブPGプログラムをチェックしてください。これは、働く専門家向けに作成され、10以上のケーススタディとプロジェクト、実践的なハンズオンワークショップ、業界の専門家とのメンターシップを提供します。1業界のメンターとの1対1、400時間以上の学習、トップ企業との仕事の支援。

データウェアハウジングでのキャリアを開始するにはどうすればよいですか？

データウェアハウスは、すべての組織でデータの収集と使用が増加しているため、需要の高い職種であることが判明しています。すべての組織は、データを処理し、データから洞察を得るための実用的な洞察に変換できる専門家を探しています。

データウェアハウジングに入るのに必要なスキルのいくつかは次のとおりです。

1.一流の調査、問題解決、分析のスキル。
2.コンピュータサイエンスまたはITなどの他の関連分野の学士号。
3.リレーショナルデータベース理論に関する適切な知識
4. 3〜5年間のデータベースシステムの使用経験
5.データモデリングとアーキテクチャの使用経験
6.口頭および書面によるコミュニケーションを指揮する。
7.技術的および非技術的メンバーによって提供される情報を理解するために聞くのが得意

これらは、データウェアハウジングの分野でキャリアを築くために取り組む必要のあるスキルの一部です。

データウェアハウジングでのキャリアを開始するにはどうすればよいですか？

データウェアハウジングの分野でキャリアを築くために満たす必要のある特定の要件があります。

1.まず、個人はコンピュータサイエンスまたは関連分野で学士号を取得している必要があります。
2.SQLサーバーのコーディングと管理の経験が2年以上あることが重要です。
3.サーバー統合の理解とETLツールの操作
4.データウェアハウジングおよびデータモデリング技術に関する適切な知識
5.基本的なMSオフィススキル

コースを受講すると、プロセス全体が非常に簡単になります。データベース管理とデータベース管理のために、さまざまな大学やプラットフォームが提供するトレーニングプログラムはたくさんあります。後で、経験を積み、フィールドの内外を理解するために、エントリーレベルの仕事に就くことができます。

どの企業でも、データウェアハウジングのさまざまな段階は何ですか？

会社の規模、年齢、業界に基づいて、データウェアハウジングの段階は以下の4つの範囲内になります。

1.オフラインデータベース
2.オフラインデータウェアハウス
3.連時データウェアハウス
4.統合データウェアハウス

すべての企業は、第1段階から開始し、第4段階に到達して、すべてをビジネスシステムに統合しようとします。データウェアハウスが適切に機能することで、データウェアハウスマネージャーはデータを分析し、そこから実用的な洞察を簡単に生成できます。