Apache Storm インタビューのトップ 13 の質問と回答

嵐のインタビューの質問

ここでは、新人だけでなく経験豊富な開発者候補者が夢の仕事に就くための Apache Storm 面接の質問と回答を紹介します。

無料 PDF ダウンロード: Apache Storm のインタビューの質問


1) Apache Storm とは何ですか? ストームのコンポーネントは何ですか?

Apache storm は、リアルタイムのビッグ データ分析の処理に使用されるオープンソースの分散型リアルタイム コンピューティング システムです。 とは異なり Hadoopの Apache storm はバッチ処理ですが、リアルタイム処理には Apache storm が使用され、あらゆるプログラミング言語で使用できます。

Apache Storm のコンポーネントには以下が含まれます

  • ニンバス: Hadoop のジョブ トラッカーとして機能します。 クラスター全体にコードを分散し、実行のために計算をアップロードし、クラスター全体にワーカーを割り当て、計算を監視し、必要に応じてワーカーを再割り当てします。
  • Zookeeper: Storm Cluster との通信のメディエーターとして使用されます。
  • 監督者: Zookeeper を通じて Nimbus と対話し、Nimbus から受信した信号に応じてプロセスを実行します。

2) Apache Storm がリアルタイム処理の第一の選択肢である理由は何ですか?

  • 操作が簡単: 動作嵐も静かで楽
  • 本当に早いです: ノードごとに 100 秒あたり XNUMX 個のメッセージを処理できます
  • 耐障害性: 障害を自動的に検出し、機能属性を再起動します。
  • 信頼性のある: データの各ユニットが少なくとも XNUMX 回、または正確に XNUMX 回実行されることが保証されます。
  • 可変的な、測定できる、登れる、はがせる: マシンのクラスター全体で実行されます

3) Apache Storm におけるデータのストリーム フローについて説明しますか?

Apache storm では、データは XNUMX つのコンポーネントからなるストリーム フローです 注ぎ口、ボルト および タプル

  • 注ぎ口: スパウトは Storm のデータのソースです
  • ボルト: ボルトはこれらのデータを処理します。
  • タプル: データはタプルとして渡されます

4) Apache Hbase と Storm の違いについて言及してください。

                           アパッチストーム                               apache hbase
  • リアルタイムのデータ処理を提供します
  • データは処理しますが、保存はしません
  • データがリアルタイムで処理されるようにデータを合理化することで、必要に応じてアラートやアクションを発生させることができます。
  •  後でクエリを実行するために、処理されたデータを低レイテンシーで読み取ることができます。
  • データは保存されますが、保存されません

5) Apache storm を使用してログ ファイルを合理化する方法を説明しますか?

ログ ファイルから読み取るには、次のように設定できます。 注ぎ口 ログを読み取るときに行ごとに出力します。 その後、出力をボルトに割り当てて分析できます。

Apache Storm のインタビューの質問
Apache Storm のインタビューの質問

6) Apache storm におけるストリームとストリームのグループ化とは何かについて説明してください。

Apache Storm では、ストリームはタプルのグループまたは無制限のシーケンスとして参照されますが、ストリームのグループ化によってボルトのタスク間でストリームをどのように分割するかが決まります。


7) Apache storm のさまざまなストリーム グループをリストアップしますか?

  • シャッフルグループ化
  • フィールドのグループ化
  • グローバルグループ化
  • すべてのグループ化
  • グループ化なし
  • 直接グループ化
  • ローカルグループ化

8) ストームアプリケーションが金融サービスにおいてどのように有益であるかについて言及しますか?

金融サービスでは、Storm は防止に役立ちます。

  • 証券詐欺
  • 注文のルーティング
  • 価格(英語)
  • コンプライアンス違反
嵐のインタビューの質問
嵐のインタビューの質問

9) Apache Storm の Topology_Message_Timeout_secs とは何ですか?

スパウトによってリリースされたメッセージを完全に処理するためにトポロジに割り当てられる最大時間。 メッセージが指定された時間枠内に確認応答されなかった場合、Apache ストームはスパウトでのメッセージを失敗させます。


10) Apache Storm でメッセージがどのように完全に処理されるかを説明しますか?

電話をかけることで、 次のタプル Spout 上のプロシージャまたはメソッドを使用すると、Storm は Spout からタプルを要求します。 スパウトは、 スパウト出力コレクター で与えられた 開いた タプルを出力ストリームの XNUMX つに放出するメソッド。 タプルの排出中、 注ぎ口 後でタプルを認識するために使用される「メッセージ ID」を割り当てます。 その後、タプルは消費ボルトに送信され、ストームは生成されるメッセージのツリーの追跡を担当します。

ストームがタプルが完全に処理されたと確信している場合は、 ACK 発信側の手続き 注ぎ口 Spout が Storm に与えたメッセージ ID を持つタスク。


11) Storm を使用して出力をファイルに書き込む方法を説明しますか?

Spout で、ファイルを読み取るときに、次のようにします。 FileReaderオブジェクト in 開ける() メソッドを使用して、ワーカー ノードのリーダー オブジェクトを初期化します。 そして、そのオブジェクトを nextTuple() メソッドで使用します。


12) Apache Kafka と Apache Storm の違いについて述べてください。

  • アパッチカフカ: これは、大量のデータを処理でき、あるエンドポイントから別のエンドポイントへのメッセージの受け渡しを可能にする、分散型の堅牢なメッセージング システムです。
  • アパッチの嵐: これはリアルタイム メッセージ処理システムであり、データをリアルタイムで編集または操作できます。 Apache storm は Kafka からデータを取得し、必要な操作をいくつか適用します。

13) 嵐の中でフィールドのグループ化を使用する場合、タイムアウトや既知のフィールド値の制限はありますか?

ストームのフィールド グループ化では、mod ハッシュ関数を使用してタプルを送信するタスクを決定し、どのタスクが正しい順序で処理されるかを確認します。 そのため、キャッシュは必要ありません。 したがって、タイムアウトや既知のフィールド値の制限はありません。

これらの面接の質問は、あなたのビバ(口頭)にも役立ちます。 私たちを参照してください Apache チュートリアル 面接でさらに優位性を高めるために。

シェアする

1つのコメント

  1. アバター アナトリー・アグルニク 言います:

    #11の答えは間違っています。 答えはファイルからの読み取りに関するものですが、質問はファイルへの書き込みに関するものです

コメントを残す

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *