Hive インタビューの質問と回答トップ 30 (2025)

新人および経験者向けの Hive 面接の質問

ここでは、新人だけでなく経験豊富な候補者も夢の仕事に就くための、Hive の面接の質問と回答を紹介します。

1) Hive とは何ですか?

Hive は、Hadoop 分散ファイルシステム (HDFS) 上に開発された ETL およびデータウェアハウジングツールです。これは、HDFS に保存されているデータのクエリと分析を行うためのデータウェアハウスフレームワークです。 Hive は、プログラマーが大規模なデータセットを分析できるようにするオープンソースソフトウェアです。 Hadoopの.

2) Hive をいつ使用するか?

作るときにハイブが便利データウェアハウス
動的データではなく静的データを扱う場合
アプリケーションの遅延が長い (応答時間が長い) 場合
大規模なデータセットが維持される場合
スクリプトの代わりにクエリを使用している場合

3) Hive のさまざまなモードについて説明しますか?

Hadoop のデータノードのサイズに応じて、Hive は XNUMX つのモードで動作できます。 これらのモードは、

ローカルモード
マップリデュースモード

4) マップリデュースモードをいつ使用するかについて言及しますか?

マップリデュースモードは次の場合に使用されます。

大量のデータセットに対して実行され、クエリは並列で実行されます。
Hadoop には複数のデータノードがあり、データはこのモードで Hive を使用するさまざまなノードに分散されます。
大規模なデータセットをより高いパフォーマンスで処理する必要がある

5) Hive アーキテクチャの主要コンポーネントについて言及しますか?

Hive アーキテクチャの主要コンポーネントには次のものがあります。

ユーザーインターフェース
コンパイラ
メタストア
ドライバ
実行エンジン

6) Hive で使用できるさまざまなタイプのテーブルについて説明してください。

Hive では XNUMX 種類のテーブルが使用できます。

管理対象テーブル: マネージドテーブルでは、データとスキーマの両方が Hive の制御下にあります。
外部テーブル: 外部テーブルでは、スキーマのみが Hive の制御下にあります。

7) Hive の Metastore とは何ですか?

Metastore は、Hive の中央リポジトリです。スキーマ情報またはメタデータを外部データベースに保存するために使用されます。

8) Hive が何で構成されているかについて言及してください。

Hive は 3 つの主要な部分で構成されます。

ハイブクライアント
ハイブサービス
ハイブストレージとコンピューティング

9) Hive がサポートするデータベースの種類について言及してください。

シングルユーザーのメタデータストレージの場合、Hive は derby データベースを使用し、複数のユーザーのメタデータまたは共有メタデータの場合、Hive は使用します。 MYSQL.

10) Hive のデフォルトの読み取りおよび書き込みクラスについて言及しますか?

Hive のデフォルトの読み取りおよび書き込みクラスは次のとおりです。

TextInputFormat/HiveIgnoreKeyTextOutputFormat
シーケンスファイル入力フォーマット/シーケンスファイル出力フォーマット

11) Hive のインデックス作成とは何ですか?

Hive インデックス作成は、テーブルの特定の列に対するクエリ検索の速度を向上させるクエリ最適化手法です。

12) Hive が OLTP システムに適していないのはなぜですか?

Hive は行レベルでの挿入および更新機能を提供しないため、OLTP システムには適していません。

13) Hbase と Hive の違いについて言及してください。

Hbase と Hive の違いは、

Hive は、ほとんどの機能を有効にします。 SQL クエリは可能ですが、HBase では SQL クエリが許可されていません
Hive は、テーブルに対するレコードレベルの挿入、更新、削除操作をサポートしていません。
Hive はデータウェアハウスフレームワークであるのに対し、HBase は NoSQL データベースです
Hive は MapReduce の最上位で実行され、HBase は HDFS の最上位で実行されます。

14) Hive 変数とは何ですか? 何のために使うのでしょうか？

Hive 変数は、Hive スクリプトから参照できる Hive 環境に作成されます。これは、クエリの実行開始時にハイブクエリにいくつかの値を渡すために使用されます。

15) Hive の ObjectInspector 機能とは何ですか?

Hive の ObjectInspector 機能は、列、行、および複雑なオブジェクトの内部構造を分析するために使用されます。これにより、オブジェクト内の内部フィールドにアクセスできるようになります。

16) (HS2) HiveServer2 とは何ですか?

以下の機能を実行するサーバーインターフェースです。

これにより、リモートクライアントが Hive に対してクエリを実行できるようになります。
言及されたクエリの結果を取得する

最新バージョンの Thrift RPC に基づくいくつかの高度な機能には、次のものがあります。

マルチクライアントの同時実行性
認証

17) Hive クエリプロセッサが何を行うかについて言及しますか?

Hive クエリプロセッサは、実行時間フレームワークを使用した MapReduce ジョブのグラフを変換します。依存関係の順序でジョブを実行できるようにします。

18) Hive クエリプロセッサのコンポーネントについて言及してください。

Hive クエリプロセッサのコンポーネントには次のものがあります。

論理計画の生成
物理計画の生成
実行エンジン
オペレーター
UDF と UDAF
オプティマイザ
パーサ
セマンティックアナライザー
タイプチェック

19) Hive のパーティションとは何ですか?

Hive はテーブルをパーティションに編成します。

これは、パーティションキーに基づいてテーブルをさまざまな部分に分割する方法の XNUMX つです。
パーティションは、テーブルに XNUMX つ以上のパーティションキーがある場合に役立ちます。
パーティションキーは、データをテーブルに格納する方法を決定するための基本要素です。

20) Hive で「内部テーブル」と「外部テーブル」をいつ選択するかについて言及しますか?

Hive では内部テーブルを選択できます。

処理データがローカルファイルシステムで利用可能な場合
Hive に削除を含むデータのライフサイクル全体を管理させたい場合

外部テーブルを選択できます。

HDFS で利用可能なデータを処理する場合
ファイルが Hive の外部で使用されている場合に便利です

21) ビューに Hive テーブルの名前と同じ名前を付けることができるかどうかについて言及しますか?

いいえ。ビューの名前は、他のすべてのテーブルと比較して、また同じデータベース内に存在するビューとして一意である必要があります。

22) Hive のビューとは何ですか?

Hive では、ビューはテーブルに似ています。これらは要件に基づいて生成されます。

結果セットのデータを Hive のビューとして保存できます。
使用法は SQL で使用されるビューと同様です
あらゆる種類の DML 操作をビューで実行できます

23) Hive がデータをどのようにデシリアライズおよびシリアル化するかを説明しますか?

通常、データの読み取り/書き込み中に、ユーザーは最初に inputformat と通信します。次に、レコードリーダーに接続してレコードの読み取り/書き込みを行います。データをシリアル化するには、データは行に移動します。ここでは、逆シリアル化されたカスタム serde は、オブジェクトインスペクターを使用してフィールド内のデータを逆シリアル化します。

24) Hive のバケットとは何ですか?

パーティション内に存在するデータはさらにバケットに分割できます。
除算は、テーブル内で選択された特定の列のハッシュに基づいて実行されます。

25) Hive では、どのようにしてバケットを有効にできますか?

Hive では、次のコマンドを使用してバケットを有効にできます。

set.hive.enforce.bucketing=true;

26) Hive では、Hive の Hadoop MapReduce 構成を上書きできますか?

はい、Hive の Hadoop MapReduce 構成を上書きできます。

27) Hive で列のデータ型を変更する方法を説明しますか?

コマンドを使用して、Hive の列のデータ型を変更できます。

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Hive における order by と sort by の違いについて言及してください。

SORT BY は、各リデューサー内でデータをソートします。 SORT BY 操作には任意の数のリデューサーを使用できます。
ORDER BY はすべてのデータをまとめて並べ替えるため、XNUMX つの Reducer を通過する必要があります。したがって、ハイブの ORDER BY は単一の

29) Hive で爆発をいつ使用するかを説明しますか?

Hadoop 開発者は時々、配列を入力として使用し、別のテーブル行に変換します。複雑なデータ型を目的のテーブル形式に変換するには、Hive でexplodeを使用します。

30) パーティションフォームのクエリを停止するにはどうすればよいかについて述べてください。

ALTER TABLE ステートメントで ENABLE OFFLINE 句を使用すると、パーティションフォームのクエリを停止できます。

これらの面接の質問は、あなたのビバ（口頭）にも役立ちます。 私たちを参照してくださいハイブのチュートリアル面接でさらに優位性を高めるために。

よろしければ：

Hive インタビューの質問と回答トップ 30 (2025)

新人および経験者向けの Hive 面接の質問

1) Hive とは何ですか?

2) Hive をいつ使用するか?

3) Hive のさまざまなモードについて説明しますか?

4) マップリデュースモードをいつ使用するかについて言及しますか?

5) Hive アーキテクチャの主要コンポーネントについて言及しますか?

6) Hive で使用できるさまざまなタイプのテーブルについて説明してください。

7) Hive の Metastore とは何ですか?

8) Hive が何で構成されているかについて言及してください。

9) Hive がサポートするデータベースの種類について言及してください。

10) Hive のデフォルトの読み取りおよび書き込みクラスについて言及しますか?

11) Hive のインデックス作成とは何ですか?

12) Hive が OLTP システムに適していないのはなぜですか?

13) Hbase と Hive の違いについて言及してください。

14) Hive 変数とは何ですか? 何のために使うのでしょうか？

15) Hive の ObjectInspector 機能とは何ですか?

16) (HS2) HiveServer2 とは何ですか?

17) Hive クエリプロセッサが何を行うかについて言及しますか?

18) Hive クエリプロセッサのコンポーネントについて言及してください。

19) Hive のパーティションとは何ですか?

20) Hive で「内部テーブル」と「外部テーブル」をいつ選択するかについて言及しますか?

21) ビューに Hive テーブルの名前と同じ名前を付けることができるかどうかについて言及しますか?

22) Hive のビューとは何ですか?

23) Hive がデータをどのようにデシリアライズおよびシリアル化するかを説明しますか?

24) Hive のバケットとは何ですか?

25) Hive では、どのようにしてバケットを有効にできますか?

26) Hive では、Hive の Hadoop MapReduce 構成を上書きできますか?

27) Hive で列のデータ型を変更する方法を説明しますか?

28) Hive における order by と sort by の違いについて言及してください。

29) Hive で爆発をいつ使用するかを説明しますか?

30) パーティションフォームのクエリを停止するにはどうすればよいかについて述べてください。

3のコメント

コメント送信返信をキャンセル

新人および経験者向けの Hive 面接の質問

1) Hive とは何ですか?

2) Hive をいつ使用するか?

3) Hive のさまざまなモードについて説明しますか?

4) マップ リデュース モードをいつ使用するかについて言及しますか?

5) Hive アーキテクチャの主要コンポーネントについて言及しますか?

6) Hive で使用できるさまざまなタイプのテーブルについて説明してください。

7) Hive の Metastore とは何ですか?

8) Hive が何で構成されているかについて言及してください。

9) Hive がサポートするデータベースの種類について言及してください。

10) Hive のデフォルトの読み取りおよび書き込みクラスについて言及しますか?

11) Hive のインデックス作成とは何ですか?

12) Hive が OLTP システムに適していないのはなぜですか?

13) Hbase と Hive の違いについて言及してください。

14) Hive 変数とは何ですか? 何のために使うのでしょうか？

15) Hive の ObjectInspector 機能とは何ですか?

16) (HS2) HiveServer2 とは何ですか?

17) Hive クエリ プロセッサが何を行うかについて言及しますか?

18) Hive クエリ プロセッサのコンポーネントについて言及してください。

19) Hive のパーティションとは何ですか?

20) Hive で「内部テーブル」と「外部テーブル」をいつ選択するかについて言及しますか?

21) ビューに Hive テーブルの名前と同じ名前を付けることができるかどうかについて言及しますか?

22) Hive のビューとは何ですか?

23) Hive がデータをどのようにデシリアライズおよびシリアル化するかを説明しますか?

24) Hive のバケットとは何ですか?

25) Hive では、どのようにしてバケットを有効にできますか?

26) Hive では、Hive の Hadoop MapReduce 構成を上書きできますか?

27) Hive で列のデータ型を変更する方法を説明しますか?

28) Hive における order by と sort by の違いについて言及してください。

29) Hive で爆発をいつ使用するかを説明しますか?

30) パーティション フォームのクエリを停止するにはどうすればよいかについて述べてください。

3のコメント

コメント送信 返信をキャンセル

4) マップリデュースモードをいつ使用するかについて言及しますか?

17) Hive クエリプロセッサが何を行うかについて言及しますか?

18) Hive クエリプロセッサのコンポーネントについて言及してください。

30) パーティションフォームのクエリを停止するにはどうすればよいかについて述べてください。

コメント送信返信をキャンセル