Top 13 otázek a odpovědí na rozhovor s Apache Storm

Otázky k pohovoru Storm

Zde jsou otázky a odpovědi na pohovor s Apache Storm pro začátečníky i zkušené vývojářské kandidáty, aby získali svou vysněnou práci.

Zdarma ke stažení PDF: Otázky k rozhovoru s Apache Storm


1) Vysvětlete, co je Apache Storm? Jaké jsou součásti Stormu?

Apache storm je open source distribuovaný výpočetní systém v reálném čase používaný pro zpracování analýzy velkých dat v reálném čase. Na rozdíl od Hadoop dávkové zpracování, Apache storm provádí zpracování v reálném čase a lze jej použít s jakýmkoli programovacím jazykem.

Komponenty Apache Storm zahrnují

  • Nimbus: Funguje jako Hadoop's Job Tracker. Distribuuje kód napříč clusterem, nahrává výpočty pro provedení, přiděluje pracovníky napříč clusterem a monitoruje výpočty a přerozděluje pracovníky podle potřeby.
  • Ošetřovatel v zoo: Používá se jako prostředník pro komunikaci s Bouřkovou hvězdokupou
  • Dozorce: Interaguje s Nimbusem prostřednictvím Zookeeper, v závislosti na signálech přijatých z Nimbusu provádí proces.

2) Proč je Apache Storm první volbou pro zpracování v reálném čase?

  • Snadná obsluha: Provoz bouře je tichý a snadný
  • Opravdu rychle: Dokáže zpracovat 100 zpráv za sekundu na uzel
  • Tolerantní k chybám: Automaticky detekuje poruchu a znovu spustí funkční atributy
  • Spolehlivý: Zaručuje, že každá jednotka dat bude provedena alespoň jednou nebo přesně jednou
  • Škálovatelné: Běží napříč shlukem strojů

3) Vysvětlete, jak probíhá tok dat v Apache Storm?

V Apache Storu jsou data tok toku se třemi složkami Hubička, Bolte si Tuple

  • Výtok: Výtok je ve Stormu zdrojem dat
  • Šroub: Tato data zpracovává šroub
  • Tuple: Data jsou předávána jako Tuple

4) Uveďte, jaký je rozdíl mezi Apache Hbase a Storm?

                           Apache Storm                               apache hbase
  • Poskytuje zpracování dat v reálném čase
  • Data zpracovává, ale neukládá
  • Zefektivníte svá data tam, kde se data zpracovávají v reálném čase, aby bylo možné v případě potřeby vyvolat upozornění a akce
  •  Nabízí vám čtení zpracovaných dat s nízkou latencí pro pozdější dotazování
  • Ukládá data, ale neukládá

5) Vysvětlete, jak můžete zefektivnit soubory protokolů pomocí Apache Storm?

Chcete-li číst ze souborů protokolu, můžete nakonfigurovat svůj výtok a vysílat na řádek při čtení protokolu. Výstup pak může být přiřazen šroubu pro analýzu.

Otázky k rozhovoru s Apache Storm
Otázky k rozhovoru s Apache Storm

6) Vysvětlete, co jsou toky a seskupení toků v bouři Apache?

V Apache Storm je proud označován jako skupina nebo neomezená sekvence n-tic, zatímco seskupování proudů určuje, jak by měl být proud rozdělen mezi úkoly šroubu.


7) Vyjmenujte různá seskupení streamů v Apache storm?

  • Náhodné seskupení
  • Seskupování polí
  • Globální seskupení
  • Všechna seskupení
  • Žádné seskupení
  • Přímé seskupování
  • Místní seskupení

8) Uveďte, jak může být aplikace bouře přínosná ve finančních službách?

Ve finančních službách může být Storm nápomocný při prevenci

  • Podvody s cennými papíry
  • Směrování objednávky
  • Ceník
  • Porušení souladu
Otázky k pohovoru Storm
Otázky k pohovoru Storm

9) Vysvětlete, co je Topology_Message_Timeout_secs v Apache Storm?

Maximální doba vyhrazená topologii k úplnému zpracování zprávy uvolněné výtokem. Pokud zpráva není potvrzena v daném časovém rámci, Apache Storm selže zprávu na hubici.


10) Vysvětlete, jak je zpráva plně zpracována v Apache Storm?

Zavoláním na dalšíTuple proceduru nebo metodu na hubici, Storm požaduje n-tici od hubice. Spout využívá SpoutoutputCollector daný v otevřít způsob vybití n-tice do jednoho z jejích výstupních toků. Při vybíjení n-tice, Výtok přiděluje „ID zprávy“, které bude později použito k rozpoznání n-tice. Poté je n-tice poslán ke konzumačním šroubům a storm se ujme sledování stromu zpráv, které jsou produkovány.

Pokud je bouře přesvědčena, že n-tice je důkladně zpracována, může zavolat ack postup na původní Výtok úkol s ID zprávy, které Spout dal Storm.


11) Vysvětlete, jak zapsat Výstup do souboru pomocí Stormu?

V Spout, když čtete soubor, vytvořte Objekt FileReader in OTEVŘENO() metoda, jako taková, že čas inicializuje objekt čtečky pro pracovní uzel. A použijte tento objekt v metodě nextTuple().


12) Uveďte, jaký je rozdíl mezi Apache Kafka a Apache Storm?

  • Apache Kafka: Jedná se o distribuovaný a robustní systém zasílání zpráv, který dokáže zpracovat obrovské množství dat a umožňuje přenos zpráv z jednoho koncového bodu do druhého.
  • Apache Storm: Jedná se o systém zpracování zpráv v reálném čase a data můžete upravovat nebo s nimi manipulovat v reálném čase. Apache storm vytáhne data z Kafky a použije nějakou požadovanou manipulaci.

13) Vysvětlete při použití seskupování polí v bouři, existuje nějaký časový limit nebo limit na známé hodnoty pole?

Seskupování polí v bouři používá mod hash funkci k rozhodnutí, který úkol poslat n-tici, což zajišťuje, který úkol bude zpracován ve správném pořadí. K tomu nepotřebujete žádnou mezipaměť. Neexistuje tedy žádný časový limit nebo omezení pro známé hodnoty polí.

Tyto otázky na pohovoru také pomohou ve vašem viva (orals). Odkazujte na naše Výukové programy Apache pro extra výhodu při pohovoru.

Sdílet

jeden komentář

  1. avatar Anatolij Agulnik říká:

    Odpověď pro #11 je nesprávná. Odpověď je o čtení ze souboru, ale otázka je o zápisu do souboru

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *