Top 13 otázek a odpovědí na rozhovor s Apache Storm

Otázky k pohovoru Storm

Zde jsou otázky a odpovědi na pohovor s Apache Storm pro začátečníky i zkušené vývojářské kandidáty, aby získali svou vysněnou práci.

Zdarma ke stažení PDF: Otázky k rozhovoru s Apache Storm

1) Vysvětlete, co je Apache Storm? Jaké jsou součásti Stormu?

Apache storm je open source distribuovaný výpočetní systém v reálném čase používaný pro zpracování analýzy velkých dat v reálném čase. Na rozdíl od Hadoop dávkové zpracování, Apache storm provádí zpracování v reálném čase a lze jej použít s jakýmkoli programovacím jazykem.

Komponenty Apache Storm zahrnují

Nimbus: Funguje jako Hadoop's Job Tracker. Distribuuje kód napříč clusterem, nahrává výpočty pro provedení, přiděluje pracovníky napříč clusterem a monitoruje výpočty a přerozděluje pracovníky podle potřeby.
Ošetřovatel v zoo: Používá se jako prostředník pro komunikaci s Bouřkovou hvězdokupou
Dozorce: Interaguje s Nimbusem prostřednictvím Zookeeper, v závislosti na signálech přijatých z Nimbusu provádí proces.

2) Proč je Apache Storm první volbou pro zpracování v reálném čase?

Snadná obsluha: Provoz bouře je tichý a snadný
Opravdu rychle: Dokáže zpracovat 100 zpráv za sekundu na uzel
Tolerantní k chybám: Automaticky detekuje poruchu a znovu spustí funkční atributy
Spolehlivý: Zaručuje, že každá jednotka dat bude provedena alespoň jednou nebo přesně jednou
Škálovatelné: Běží napříč shlukem strojů

3) Vysvětlete, jak probíhá tok dat v Apache Storm?

V Apache Storu jsou data tok toku se třemi složkami Hubička, Bolte si Tuple

Výtok: Výtok je ve Stormu zdrojem dat
Šroub: Tato data zpracovává šroub
Tuple: Data jsou předávána jako Tuple

4) Uveďte, jaký je rozdíl mezi Apache Hbase a Storm?

Apache Storm	apache hbase
Poskytuje zpracování dat v reálném čase Data zpracovává, ale neukládá Zefektivníte svá data tam, kde se data zpracovávají v reálném čase, aby bylo možné v případě potřeby vyvolat upozornění a akce	Nabízí vám čtení zpracovaných dat s nízkou latencí pro pozdější dotazování Ukládá data, ale neukládá

5) Vysvětlete, jak můžete zefektivnit soubory protokolů pomocí Apache Storm?

Chcete-li číst ze souborů protokolu, můžete nakonfigurovat svůj výtok a vysílat na řádek při čtení protokolu. Výstup pak může být přiřazen šroubu pro analýzu.

6) Vysvětlete, co jsou toky a seskupení toků v bouři Apache?

V Apache Storm je proud označován jako skupina nebo neomezená sekvence n-tic, zatímco seskupování proudů určuje, jak by měl být proud rozdělen mezi úkoly šroubu.

7) Vyjmenujte různá seskupení streamů v Apache storm?

Náhodné seskupení
Seskupování polí
Globální seskupení
Všechna seskupení
Žádné seskupení
Přímé seskupování
Místní seskupení

8) Uveďte, jak může být aplikace bouře přínosná ve finančních službách?

Ve finančních službách může být Storm nápomocný při prevenci

Podvody s cennými papíry
Směrování objednávky
Ceník
Porušení souladu

9) Vysvětlete, co je Topology_Message_Timeout_secs v Apache Storm?

Maximální doba vyhrazená topologii k úplnému zpracování zprávy uvolněné výtokem. Pokud zpráva není potvrzena v daném časovém rámci, Apache Storm selže zprávu na hubici.

10) Vysvětlete, jak je zpráva plně zpracována v Apache Storm?

Zavoláním na dalšíTuple proceduru nebo metodu na hubici, Storm požaduje n-tici od hubice. Spout využívá SpoutoutputCollector daný v otevřít způsob vybití n-tice do jednoho z jejích výstupních toků. Při vybíjení n-tice, Výtok přiděluje „ID zprávy“, které bude později použito k rozpoznání n-tice. Poté je n-tice poslán ke konzumačním šroubům a storm se ujme sledování stromu zpráv, které jsou produkovány.

Pokud je bouře přesvědčena, že n-tice je důkladně zpracována, může zavolat ack postup na původní Výtok úkol s ID zprávy, které Spout dal Storm.

11) Vysvětlete, jak zapsat Výstup do souboru pomocí Stormu?

V Spout, když čtete soubor, vytvořte Objekt FileReader in OTEVŘENO() metoda, jako taková, že čas inicializuje objekt čtečky pro pracovní uzel. A použijte tento objekt v metodě nextTuple().

12) Uveďte, jaký je rozdíl mezi Apache Kafka a Apache Storm?

Apache Kafka: Jedná se o distribuovaný a robustní systém zasílání zpráv, který dokáže zpracovat obrovské množství dat a umožňuje přenos zpráv z jednoho koncového bodu do druhého.
Apache Storm: Jedná se o systém zpracování zpráv v reálném čase a data můžete upravovat nebo s nimi manipulovat v reálném čase. Apache storm vytáhne data z Kafky a použije nějakou požadovanou manipulaci.

13) Vysvětlete při použití seskupování polí v bouři, existuje nějaký časový limit nebo limit na známé hodnoty pole?

Seskupování polí v bouři používá mod hash funkci k rozhodnutí, který úkol poslat n-tici, což zajišťuje, který úkol bude zpracován ve správném pořadí. K tomu nepotřebujete žádnou mezipaměť. Neexistuje tedy žádný časový limit nebo omezení pro známé hodnoty polí.

Tyto otázky na pohovoru také pomohou ve vašem viva (orals). Odkazujte na naše Výukové programy Apache pro extra výhodu při pohovoru.

Máš rád: