Apache Storm インタビューのトップ 13 の質問と回答
嵐のインタビューの質問
ここでは、新人だけでなく経験豊富な開発者候補者が夢の仕事に就くための Apache Storm 面接の質問と回答を紹介します。
無料 PDF ダウンロード: Apache Storm のインタビューの質問
1) Apache Storm とは何ですか? ストームのコンポーネントは何ですか?
Apache storm は、リアルタイムのビッグ データ分析の処理に使用されるオープンソースの分散型リアルタイム コンピューティング システムです。 とは異なり Hadoopの Apache storm はバッチ処理ですが、リアルタイム処理には Apache storm が使用され、あらゆるプログラミング言語で使用できます。
Apache Storm のコンポーネントには以下が含まれます
- ニンバス: Hadoop のジョブ トラッカーとして機能します。 クラスター全体にコードを分散し、実行のために計算をアップロードし、クラスター全体にワーカーを割り当て、計算を監視し、必要に応じてワーカーを再割り当てします。
- Zookeeper: Storm Cluster との通信のメディエーターとして使用されます。
- 監督者: Zookeeper を通じて Nimbus と対話し、Nimbus から受信した信号に応じてプロセスを実行します。
2) Apache Storm がリアルタイム処理の第一の選択肢である理由は何ですか?
- 操作が簡単: 動作嵐も静かで楽
- 本当に早いです: ノードごとに 100 秒あたり XNUMX 個のメッセージを処理できます
- 耐障害性: 障害を自動的に検出し、機能属性を再起動します。
- 信頼性のある: データの各ユニットが少なくとも XNUMX 回、または正確に XNUMX 回実行されることが保証されます。
- 可変的な、測定できる、登れる、はがせる: マシンのクラスター全体で実行されます
3) Apache Storm におけるデータのストリーム フローについて説明しますか?
Apache storm では、データは XNUMX つのコンポーネントからなるストリーム フローです 注ぎ口、ボルト タプル
- 注ぎ口: スパウトは Storm のデータのソースです
- ボルト: ボルトはこれらのデータを処理します。
- タプル: データはタプルとして渡されます
4) Apache Hbase と Storm の違いについて言及してください。
アパッチストーム | apache hbase |
|
|
5) Apache storm を使用してログ ファイルを合理化する方法を説明しますか?
ログ ファイルから読み取るには、次のように設定できます。 注ぎ口 ログを読み取るときに行ごとに出力します。 その後、出力をボルトに割り当てて分析できます。
6) Apache storm におけるストリームとストリームのグループ化とは何かについて説明してください。
Apache Storm では、ストリームはタプルのグループまたは無制限のシーケンスとして参照されますが、ストリームのグループ化によってボルトのタスク間でストリームをどのように分割するかが決まります。
7) Apache storm のさまざまなストリーム グループをリストアップしますか?
- シャッフルグループ化
- フィールドのグループ化
- グローバルグループ化
- すべてのグループ化
- グループ化なし
- 直接グループ化
- ローカルグループ化
8) ストームアプリケーションが金融サービスにおいてどのように有益であるかについて言及しますか?
金融サービスでは、Storm は防止に役立ちます。
- 証券詐欺
- 注文のルーティング
- 価格
- コンプライアンス違反
9) Apache Storm の Topology_Message_Timeout_secs とは何ですか?
スパウトによってリリースされたメッセージを完全に処理するためにトポロジに割り当てられる最大時間。 メッセージが指定された時間枠内に確認応答されなかった場合、Apache ストームはスパウトでのメッセージを失敗させます。
10) Apache Storm でメッセージがどのように完全に処理されるかを説明しますか?
電話をかけることで、 次のタプル Spout 上のプロシージャまたはメソッドを使用すると、Storm は Spout からタプルを要求します。 スパウトは、 スパウト出力コレクター で与えられた 開いた タプルを出力ストリームの XNUMX つに放出するメソッド。 タプルの排出中、 注ぎ口 後でタプルを認識するために使用される「メッセージ ID」を割り当てます。 その後、タプルは消費ボルトに送信され、ストームは生成されるメッセージのツリーの追跡を担当します。
ストームがタプルが完全に処理されたと確信している場合は、 包装展示会 発信側の手続き 注ぎ口 Spout が Storm に与えたメッセージ ID を持つタスク。
11) Storm を使用して出力をファイルに書き込む方法を説明しますか?
Spout で、ファイルを読み取るときに、次のようにします。 FileReaderオブジェクト in 開ける() メソッドを使用して、ワーカー ノードのリーダー オブジェクトを初期化します。 そして、そのオブジェクトを nextTuple() メソッドで使用します。
12) Apache Kafka と Apache Storm の違いについて述べてください。
- アパッチカフカ: これは、大量のデータを処理でき、あるエンドポイントから別のエンドポイントへのメッセージの受け渡しを可能にする、分散型の堅牢なメッセージング システムです。
- アパッチの嵐: これはリアルタイム メッセージ処理システムであり、データをリアルタイムで編集または操作できます。 Apache storm は Kafka からデータを取得し、必要な操作をいくつか適用します。
13) 嵐の中でフィールドのグループ化を使用する場合、タイムアウトや既知のフィールド値の制限はありますか?
ストームのフィールド グループ化では、mod ハッシュ関数を使用してタプルを送信するタスクを決定し、どのタスクが正しい順序で処理されるかを確認します。 そのため、キャッシュは必要ありません。 したがって、タイムアウトや既知のフィールド値の制限はありません。
これらの面接の質問は、あなたのビバ(口頭)にも役立ちます。 私たちを参照してください Apache チュートリアル 面接でさらに優位性を高めるために。
#11の答えは間違っています。 答えはファイルからの読み取りに関するものですが、質問はファイルへの書き込みに関するものです