Hive インタビューの質問と回答トップ 30 (2025)

新人および経験者向けの Hive 面接の質問

ここでは、新人だけでなく経験豊富な候補者も夢の仕事に就くための、Hive の面接の質問と回答を紹介します。

無料の PDF ダウンロード: Hive のインタビューの質問


1) Hive とは何ですか?

Hive は、Hadoop 分散ファイル システム (HDFS) 上に開発された ETL およびデータ ウェアハウジング ツールです。 これは、HDFS に保存されているデータのクエリと分析を行うためのデータ ウェアハウス フレームワークです。 Hive は、プログラマーが大規模なデータ セットを分析できるようにするオープンソース ソフトウェアです。 Hadoopの.


2) Hive をいつ使用するか?

  • 作るときにハイブが便利 データウェアハウス
  • 動的データではなく静的データを扱う場合
  • アプリケーションの遅延が長い (応答時間が長い) 場合
  • 大規模なデータセットが維持される場合
  • スクリプトの代わりにクエリを使用している場合

3) Hive のさまざまなモードについて説明しますか?

Hadoop のデータ ノードのサイズに応じて、Hive は XNUMX つのモードで動作できます。 これらのモードは、

  • ローカルモード
  • マップリデュースモード

4) マップ リデュース モードをいつ使用するかについて言及しますか?

マップ リデュース モードは次の場合に使用されます。

  • 大量のデータセットに対して実行され、クエリは並列で実行されます。
  • Hadoop には複数のデータ ノードがあり、データはこのモードで Hive を使用するさまざまなノードに分散されます。
  • 大規模なデータセットをより高いパフォーマンスで処理する必要がある

5) Hive アーキテクチャの主要コンポーネントについて言及しますか?

Hive アーキテクチャの主要コンポーネントには次のものがあります。

  • ユーザーインターフェース
  • コンパイラ
  • メタストア
  • ドライバ
  • 実行エンジン
ハイブの面接の質問
ハイブの面接の質問

6) Hive で使用できるさまざまなタイプのテーブルについて説明してください。

Hive では XNUMX 種類のテーブルが使用できます。

  • 管理対象テーブル: マネージド テーブルでは、データとスキーマの両方が Hive の制御下にあります。
  • 外部テーブル: 外部テーブルでは、スキーマのみが Hive の制御下にあります。

7) Hive の Metastore とは何ですか?

Metastore は、Hive の中央リポジトリです。 スキーマ情報またはメタデータを外部データベースに保存するために使用されます。


8) Hive が何で構成されているかについて言及してください。

Hive は 3 つの主要な部分で構成されます。

  1. ハイブクライアント
  2. ハイブ サービス
  3. ハイブ ストレージとコンピューティング

9) Hive がサポートするデータベースの種類について言及してください。

シングルユーザーのメタデータストレージの場合、Hive は derby データベースを使用し、複数のユーザーのメタデータまたは共有メタデータの場合、Hive は使用します。 MYSQL.


10) Hive のデフォルトの読み取りおよび書き込みクラスについて言及しますか?

Hive のデフォルトの読み取りおよび書き込みクラスは次のとおりです。

  1. TextInputFormat/HiveIgnoreKeyTextOutputFormat
  2. シーケンスファイル入力フォーマット/シーケンスファイル出力フォーマット

11) Hive のインデックス作成とは何ですか?

Hive インデックス作成は、テーブルの特定の列に対するクエリ検索の速度を向上させるクエリ最適化手法です。


12) Hive が OLTP システムに適していないのはなぜですか?

Hive は行レベルでの挿入および更新機能を提供しないため、OLTP システムには適していません。


13) Hbase と Hive の違いについて言及してください。

Hbase と Hive の違いは、

  • Hive は、ほとんどの機能を有効にします。 SQL クエリは可能ですが、HBase では SQL クエリが許可されていません
  • Hive は、テーブルに対するレコード レベルの挿入、更新、削除操作をサポートしていません。
  • Hive はデータ ウェアハウス フレームワークであるのに対し、HBase は NoSQL データベースです
  • Hive は MapReduce の最上位で実行され、HBase は HDFS の最上位で実行されます。

14) Hive 変数とは何ですか? 何のために使うのでしょうか?

Hive 変数は、Hive スクリプトから参照できる Hive 環境に作成されます。 これは、クエリの実行開始時にハイブ クエリにいくつかの値を渡すために使用されます。


15) Hive の ObjectInspector 機能とは何ですか?

Hive の ObjectInspector 機能は、列、行、および複雑なオブジェクトの内部構造を分析するために使用されます。 これにより、オブジェクト内の内部フィールドにアクセスできるようになります。


16) (HS2) HiveServer2 とは何ですか?

以下の機能を実行するサーバーインターフェースです。

  • これにより、リモート クライアントが Hive に対してクエリを実行できるようになります。
  • 言及されたクエリの結果を取得する

最新バージョンの Thrift RPC に基づくいくつかの高度な機能には、次のものがあります。

  • マルチクライアントの同時実行性
  • 認証

17) Hive クエリ プロセッサが何を行うかについて言及しますか?

Hive クエリ プロセッサは、実行時間フレームワークを使用した MapReduce ジョブのグラフを変換します。 依存関係の順序でジョブを実行できるようにします。


18) Hive クエリ プロセッサのコンポーネントについて言及してください。

Hive クエリ プロセッサのコンポーネントには次のものがあります。

  • 論理計画の生成
  • 物理計画の生成
  • 実行エンジン
  • オペレーター
  • UDF と UDAF
  • オプティマイザ
  • パーサ
  • セマンティックアナライザー
  • タイプチェック

19) Hive のパーティションとは何ですか?

Hive はテーブルをパーティションに編成します。

  • これは、パーティション キーに基づいてテーブルをさまざまな部分に分割する方法の XNUMX つです。
  • パーティションは、テーブルに XNUMX つ以上のパーティション キーがある場合に役立ちます。
  • パーティション キーは、データをテーブルに格納する方法を決定するための基本要素です。

20) Hive で「内部テーブル」と「外部テーブル」をいつ選択するかについて言及しますか?

Hive では内部テーブルを選択できます。

  • 処理データがローカル ファイル システムで利用可能な場合
  • Hive に削除を含むデータのライフサイクル全体を管理させたい場合

外部テーブルを選択できます。

  • HDFS で利用可能なデータを処理する場合
  • ファイルが Hive の外部で使用されている場合に便利です

21) ビューに Hive テーブルの名前と同じ名前を付けることができるかどうかについて言及しますか?

いいえ。ビューの名前は、他のすべてのテーブルと比較して、また同じデータベース内に存在するビューとして一意である必要があります。


22) Hive のビューとは何ですか?

Hive では、ビューはテーブルに似ています。 これらは要件に基づいて生成されます。

  • 結果セットのデータを Hive のビューとして保存できます。
  • 使用法は SQL で使用されるビューと同様です
  • あらゆる種類の DML 操作をビューで実行できます

23) Hive がデータをどのようにデシリアライズおよびシリアル化するかを説明しますか?

通常、データの読み取り/書き込み中に、ユーザーは最初に inputformat と通信します。 次に、レコードリーダーに接続してレコードの読み取り/書き込みを行います。 データをシリアル化するには、データは行に移動します。 ここでは、逆シリアル化されたカスタム serde は、オブジェクト インスペクターを使用してフィールド内のデータを逆シリアル化します。


24) Hive のバケットとは何ですか?

  • パーティション内に存在するデータはさらにバケットに分割できます。
  • 除算は、テーブル内で選択された特定の列のハッシュに基づいて実行されます。

25) Hive では、どのようにしてバケットを有効にできますか?

Hive では、次のコマンドを使用してバケットを有効にできます。

set.hive.enforce.bucketing=true;

26) Hive では、Hive の Hadoop MapReduce 構成を上書きできますか?

はい、Hive の Hadoop MapReduce 構成を上書きできます。


27) Hive で列のデータ型を変更する方法を説明しますか?

コマンドを使用して、Hive の列のデータ型を変更できます。

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Hive における order by と sort by の違いについて言及してください。

  • SORT BY は、各リデューサー内でデータをソートします。 SORT BY 操作には任意の数のリデューサーを使用できます。
  • ORDER BY はすべてのデータをまとめて並べ替えるため、XNUMX つの Reducer を通過する必要があります。 したがって、ハイブの ORDER BY は単一の

29) Hive で爆発をいつ使用するかを説明しますか?

Hadoop 開発者は時々、 配列 を入力として使用し、別のテーブル行に変換します。 複雑なデータ型を目的のテーブル形式に変換するには、Hive でexplodeを使用します。


30) パーティション フォームのクエリを停止するにはどうすればよいかについて述べてください。

ALTER TABLE ステートメントで ENABLE OFFLINE 句を使用すると、パーティション フォームのクエリを停止できます。

これらの面接の質問は、あなたのビバ(口頭)にも役立ちます。 私たちを参照してください ハイブのチュートリアル 面接でさらに優位性を高めるために。

シェアする

3のコメント

  1. アバター サティヤランジャン・シン 言います:

    とても役に立ちます……..役に立つ…….. 面接の準備にも自己準備にも役立ちます。

  2. アバター bk 言います:

    ありがとう! とても助かります!

    「データの偏り」に関するいくつかの質問を追加してもよいと思います。なぜなら、私は面接官だったときに通常、これらの質問に答えるように求められていたからです。

    1. アバター ミーナクシ 言います:

      あなたが尋ねた面接の質問を追加してください

コメントを残す

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *