データ ウェアハウスのインタビューに関するトップ 50 の質問と回答

ここでは、夢の仕事に就くための、新人および経験豊富な候補者向けの Data Warehouse 面接の質問と回答を紹介します。

1) データ ウェアハウスとは何ですか?

データ ウェアハウジング (DW) はデータのリポジトリであり、経営意思決定支援システムに使用されます。 データ ウェアハウスは、単一時点での高レベルのビジネス条件を備えた多種多様なデータで構成されています。

一言で言えば、これはクエリと分析に利用できる統合された情報のリポジトリです。


2)とは ビジネス・インテリジェンス?

ビジネス インテリジェンスは、DSS (意思決定支援システム) としても知られており、ビジネス関連の情報やデータの収集、統合、分析のためのテクノロジ、アプリケーション、および実践を指します。 さらに、情報自体のデータを確認することも役立ちます。

無料 PDF ダウンロード: データ ウェアハウスのインタビューの質問と回答


3) 寸法表とは何ですか?

ディメンション テーブルは、ファクト テーブルに格納されている測定値の属性を含むテーブルです。 このテーブルは、ノード内を移動するために使用できる階層、カテゴリ、ロジックで構成されています。


4) ファクトテーブルとは何ですか?

ファクト テーブルにはビジネス プロセスの測定値が含まれており、ディメンション テーブルの外部キーが含まれています。

例 – ビジネスプロセスがレンガの製造である場合

XNUMX 人/機械で生産されるレンガの平均数 - ビジネス プロセスの尺度


5) データウェアハウジングの段階は何ですか?

データウェアハウジングには XNUMX つの段階があります。

データウェアハウス
データウェアハウス
  • オフライン運用データベース
  • オフライン データ ウェアハウス
  • リアルタイム データウェアハウス
  • 統合データウェアハウス

6) データマイニングとは何ですか?

データマイニングは、さまざまな次元または視点でデータを分析し、有用な情報に要約するプロセスとして設定されています。 データベースから独自の形式でデータをクエリおよび取得できます。


7) OLTPとは何ですか?

OLTPはOn-Line Transaction Processingの略で、データを受信するたびに変更を加え、同時ユーザー数が多いアプリケーションです。

データ ウェアハウス インタビューの質問
データ ウェアハウス インタビューの質問

8) OLAP とは何ですか?

OLAPとは、Online Analytical Processingの略で、分析・管理を目的とした多次元データを収集・管理・加工するシステムのことを指します。


9) OLTP と OLAP の違いは何ですか?

OLTP と OLAP の違いは次のとおりです。

OLTP OLAP
データは元のデータソースからのものです データはさまざまなデータソースから取得されます
ユーザーによる簡単なクエリ システムごとの複雑なクエリ
正規化された小規模データベース 非正規化された大規模データベース
基本的なビジネスタスク 多次元のビジネスタスク

10) ODSとは何ですか?

ODS は Operational Data Store の略で、長期的な傾向データではなく、リアルタイムの運用データのリポジトリです。


11) ビューとマテリアライズド ビューの違いは何ですか?

ビューはクエリの出力を取得する仮想テーブルに他ならず、テーブルの代わりに使用できます。

マテリアライズド ビューは、クエリの結果を別のスキーマに保存することによってテーブル データに間接的にアクセスすることに他なりません。


12) ETLとは何ですか?

ETL は、Extract、Transform、Load の略称です。 ETL は、指定されたデータ ソースからデータを読み取り、データの必要なサブセットを抽出するために使用されるソフトウェアです。 次に、ルールとルックアップ テーブルを使用してデータを変換し、目的の状態に変換します。

次に、load 関数を使用して、結果のデータをターゲット データベースにロードします。


13) VLDB とは何ですか?

VLDB は Very Large Database の略で、そのサイズは XNUMX テラバイト以上のデータベースに設定されています。 これらは、多数のユーザーにサービスを提供するために使用される意思決定支援システムです。


14) リアルタイム データウェアハウスとは何ですか?

リアルタイム データウェアハウジングは、ビジネス データが発生するたびにそれをキャプチャします。 ビジネス活動が完了すると、そのデータはフロー内で利用可能になり、すぐに使用できるようになります。


15) 集計テーブルとは何ですか?

集計テーブルは、特定のレベルのディメンションにグループ化された既存のウェアハウス データを含むテーブルです。 集計されたテーブルは、レコード数が多い元のテーブルよりも簡単にデータを取得できます。

このテーブルにより、データベース サーバーの負荷が軽減され、クエリのパフォーマンスが向上します。


16) ファクトレスファクトテーブルとは何ですか?

ファクトレス ファクト テーブルは、ファクト テーブルに数値ファクト列を含まないファクト テーブルです。


17) 時間ディメンションをロードするにはどうすればよいですか?

時間ディメンションは通常、100 年のすべての可能な日付を通じてロードされ、プログラムを通じて実行できます。 ここでは、XNUMX 年を XNUMX 日あたり XNUMX 行で表すことができます。


18) 非添加事実とは何ですか?

非依存性ファクトとは、ファクト テーブルに存在するどの次元についても合計できないファクトであると言われます。 寸法に変更がある場合でも、同じ事実が役立つことがあります。


19) 適合事実とは何ですか?

適合ファクトは、複数のファクト テーブルと組み合わせて、複数のデータ マート全体で使用できるテーブルです。


20) データマートとは何ですか?

データマートはデータウェアハウジングの特殊バージョンであり、ビジネス担当者が過去の傾向や経験を分析して意思決定を行うのに役立つ運用データのスナップショットが含まれています。 データ マートは、関連情報への簡単なアクセスを重視するのに役立ちます。


21) アクティブ データウェアハウジングとは何ですか?

アクティブ データウェアハウスは、企業または組織内の意思決定者が顧客関係を効果的かつ効率的に管理できるようにするデータウェアハウスです。


22) データウェアハウスと OLAP の違いは何ですか?

データウェアハウスは分析のためにデータ全体を保存する場所ですが、OLAP はデータの分析、集計の管理、マイナーレベルの情報への情報の分割に使用されます。


23) ER図とは何ですか?

ER 図はエンティティ関係図と略され、データベース内のエンティティ間の相互関係を示します。 この図は、各テーブルの構造とテーブル間のリンクを示しています。

ER図

24) ファクト テーブルとディメンション テーブルのキー列は何ですか?

ディメンション テーブルの外部キーは、エンティティ テーブルの主キーです。 ファクト テーブルの外部キーは、ディメンション テーブルの主キーです。


25) SCDとは何ですか?

SCD はゆっくりと変化する次元として定義され、時間の経過とともに記録が変化する場合に適用されます。


26) SCD にはどのような種類がありますか?

SCD には次の XNUMX つのタイプがあります。

SCD 1 – 新しいレコードが元のレコードを置き換えます

SCD 2 – 新しいレコードが既存の顧客ディメンション テーブルに追加されます

SCD 3 – 元のデータが変更されて新しいデータが含まれる


27) BUS スキーマとは何ですか?

BUS スキーマは、ファクト テーブルがある場合、確認済みのディメンションと標準化された定義のスイートで構成されます。


28) スタースキーマとは何ですか?

スター スキーマは、データ ウェアハウス環境でデータベースから結果を迅速に取得できるようにテーブルを編成する一種にすぎません。

スタースキーマ

29) スノーフレーク スキーマとは何ですか?

XNUMX つ以上のディメンションを結合できるプライマリ ディメンション テーブルを持つスノーフレーク スキーマ。 プライマリ ディメンション テーブルは、ファクト テーブルと結合できる唯一のテーブルです。

スノーフレークスキーマ

30) コアディメンションとは何ですか?

コア ディメンションは、単一のファクト テーブルまたはデータマート専用として使用されるディメンション テーブルに他なりません。


31) データクリーニングとは何ですか?

名前自体が、それが自明の用語であることを意味します。 孤立したレコードのクリーニング、ビジネス ルールに違反したデータ、データベース内の矛盾したデータと欠落した情報。


32) メタデータとは何ですか?

メタデータは、データに関するデータとして定義されます。 メタデータには、使用される列の数、固定幅と制限された幅、フィールドの順序、フィールドのデータ型などの情報が含まれています。


33) データウェアハウジングのループとは何ですか?

データウェアハウジングでは、テーブル間にループが存在します。 テーブル間にループがある場合、クエリの生成に時間がかかり、曖昧さが生じます。 テーブル間のループを避けることをお勧めします。


34) ディメンションテーブルに数値を含めることができますか?

はい、ディメンション テーブルはビジネスを説明する要素であるため、数値を含めることができます。


35) データウェアハウジングにおけるキューブの定義は何ですか?

キューブは多次元データの論理表現です。 キューブのエッジにはディメンション メンバーがあり、キューブの本体にはデータ値が含まれます。


36) 次元モデリングとは何ですか?

ディメンション モデリングは、データウェア ハウス設計者が独自のデータウェアハウスを構築するために使用できる概念です。 このモデルは、ファクト テーブルとディメンション テーブルの XNUMX 種類のテーブルに保存できます。

ファクト テーブルにはビジネスの事実と測定値が含まれ、ディメンション テーブルには測定値のコンテキストが含まれます。


37) ディメンションモデリングにはどのような種類がありますか?

以下は データ ウェアハウスのディメンションの種類:

  • 適合寸法
  • アウトリガー寸法
  • 縮んだ寸法
  • ロールプレイングの次元
  • ディメンション対ディメンションテーブル
  • ジャンクディメンション
  • 次元の縮退
  • 交換可能な次元
  • ステップ寸法

38) 代理キーとは何ですか?

代理キーは、自然主キーの代替にすぎません。 これは、テーブルの主キーとして使用できる各行の一意の識別子として設定されます。


39) ER モデリングと次元モデリングの違いは何ですか?

ER モデリングには論理モデルと物理モデルがありますが、次元モデリングには物理モデルのみが含まれます。

ER モデリングは OLTP データベース設計の正規化に使用され、ディメンション モデリングは ROLAP および MOLAP 設計の非正規化に使用されます。


40) データウェアハウスを構築する手順は何ですか?

データウェアハウスを構築するには次の手順に従います。

  • ビジネス要件の収集
  • 必要な情報源を特定する
  • 事実の特定
  • 寸法の定義
  • 属性の定義
  • 必要に応じてディメンションと属性を再定義します
  • 属性階層を整理する
  • 関係を定義する
  • 一意の識別子の割り当て

41) データウェアハウジングにはどのような種類がありますか?

データウェアハウジングのさまざまなタイプを次に示します。

  • エンタープライズ データウェアハウジング
  • 運用データストア
  • データ市場

42) データベースの起動中に何をする必要がありますか?

データベースを開始するには、次のことを行う必要があります。

  1. インスタンスを開始する
  2. データベースをマウントする
  3. データベースを開く

43) データベースがシャットダウンされたら何をする必要がありますか?

データベースがシャットダウンされている場合は、次のことを行う必要があります。

  1. データベースを閉じる
  2. データベースをマウント解除します
  3. インスタンスをシャットダウンする

44) データベースを開いたときにバックアップを取得できますか?

はい、データベースを開いたときに完全バックアップを取得できます。


45) 部分バックアップとは何ですか?

の部分バックアップ オペレーティングシステム 完全バックアップに達しないバックアップであり、データベースを開いているときもシャットダウンしているときにも実行できます。


46) オプティマイザーの目標は何ですか?

オプティマイザーの目標は、最も効率的な実行方法を見つけることです。 SQL ステートメント。


47) 実行計画とは何ですか?

実行計画は、オプティマイザがステップの組み合わせを選択するために使用される計画です。


48) 実行計画中にオプティマイザーによって使用されるアプローチは何ですか?

2つのアプローチがあります。

  1. ルールベース
  2. コストベース

49) ETL に利用できるツールは何ですか?

利用可能な ETL ツールは次のとおりです。

情報
データステージ
オラクル
倉庫ビルダー
アブ・イニシオ
データジャンクション


50) メタデータとデータ辞書の違いは何ですか?

メタデータは、データに関するデータとして定義されます。 ただし、データ ディクショナリには、プロジェクト情報、グラフ、abinito コマンド、サーバー情報に関する情報が含まれています。

これらの面接の質問は、あなたの活力(口頭)にも役立ちます

シェアする

21のコメント

  1. アバター メイダン・シュワルツ 言います:

    情報ありがとうございました :)

    1. アバター アルジュン 言います:

      Windows10にdatastage etlツールソフトウェアをインストールする方法

  2. シブゴータム 言います:

    情報を共有してくれてありがとう

    1. アバター サイ・スリニバス 言います:

      HII
      plsは
      データウェアハウスの説明と理論

  3. アバター エクタ ソーニ 言います:

    非常に役立つ情報..ありがとう:)

  4. アバター ミル・ビラル 言います:

    ありがとう! 非常に役立ちます。

  5. アバター グラヒ・パルマル 言います:

    SCD タイプの順序が正しくありません。
    タイプ 0 – 固定次元
    変更は許可されず、寸法は決して変更されません
    タイプ 1 – 履歴なし
    レコードを直接更新します。過去の値のレコードはなく、唯一の現在の状態です。
    タイプ 2 – 行のバージョン管理
    現在のフラグ、アクティブな日付、その他のメタデータを含むバージョン レコードとして変更を追跡する
    タイプ 3 – [前の値] 列
    特定の属性への変更を追跡し、以前の値を表示する列を追加します。この値は、さらなる変更が発生すると更新されます。
    タイプ 4 – 履歴テーブル
    現在の値をディメンション テーブルに表示しますが、すべての変更は別のテーブルで追跡します
    タイプ 6 – ハイブリッド SCD
    SCD タイプ 1、2、および 3 の手法を利用して変更を追跡する

    1. シュリヴィディヤ・クリシュナモーシー 言います:

      ありがとう..これは役に立ちます

  6. アバター アルピト・ジャイナ教 言います:

    見直しに役立ちます:)

    1. シュリヴィディヤ・クリシュナモーシー 言います:

      感謝

  7. アバター アニル 言います:

    良いものを人々に共有するのにとても役に立ちます。

  8. アバター ムハンマド・アブバカール 言います:

    この質問について話し合うには助けが必要です。
    Q: あなたはメガストアにデータウェアハウスエンジニアとして採用されました。 データマイニングの相関ルールをどのように利用してメガストアの売上を増やすことができるでしょうか?

  9. アバター ダルコ・ペトルシッチ博士 言います:

    44. データベースを開いたときにバックアップを取得できますか?

    はい、データベースを開いたときに完全バックアップを取得できます。 ホットバックアップといいますが…

  10. ラナ 言います:

    Q37は間違いです

    1. アレックス・シルバーマン アレックス・シルバーマン 言います:

      こんにちは、ご意見をお聞かせいただきありがとうございます。 更新されています。

  11. アバター 安吉 言います:

    とても良いですね。
    貴重な質問とわかりやすい回答をありがとうございました

  12. アバター ケンタロス 言います:

    ありがとう、とても助かりました

  13. アバター プリティ 言います:

    本当にいいですね、ありがとう、とても助かります。

  14. アバター Payal 言います:

    わかりやすいですありがとうございます

  15. アバター サティシュ 言います:

    ありがとう、助かりました。

  16. アバター アスラル アラム 言います:

    全体的に非常に有益な情報です、ありがとう

コメントを残す

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *