Top 13 întrebări și răspunsuri la interviu Apache Storm

Întrebări la interviu Storm

Iată întrebările și răspunsurile la interviu Apache Storm pentru cei nou-veniți, precum și pentru candidații dezvoltatori cu experiență pentru a obține jobul visat.

Descărcare gratuită PDF: Întrebări interviu Apache Storm


1) Explicați ce este Apache Storm? Care sunt componentele Storm?

Apache storm este un sistem de calcul în timp real distribuit cu sursă deschisă, utilizat pentru procesarea analizei de date mari în timp real. Spre deosebire de Hadoop procesare batch, Apache storm o face pentru procesare în timp real și poate fi folosit cu orice limbaj de programare.

Componentele Apache Storm includ

  • Nimbus: Funcționează ca un Hadoop’s Job Tracker. Distribuie codul în cluster, încarcă calculul pentru execuție, alocă lucrători în cluster și monitorizează calculul și realocează lucrătorii după cum este necesar
  • Ingrijitor zoo: Este folosit ca mediator pentru comunicarea cu Storm Cluster
  • supervizor: Interacționează cu Nimbus prin Zookeeper, în funcție de semnalele primite de la Nimbus, execută procesul.

2) De ce Apache Storm este prima alegere pentru procesarea în timp real?

  • Ușor de utilizat: Operarea furtună este liniștită ușor
  • Foarte rapid: Poate procesa 100 de mesaje pe secundă pe nod
  • Tolerant la erori: Detectează automat defecțiunea și repornește atributele funcționale
  • De încredere: Acesta garantează că fiecare unitate de date va fi executată cel puțin o dată sau exact o dată
  • Scalable: Se execută peste un grup de mașini

3) Explicați cum este fluxul de date în Apache Storm?

În apache storm, datele sunt fluxuri cu trei componente Spout, Bolt și tuplu

  • spout: Un spout este o sursă de date în Storm
  • Șurub: Un șurub procesează aceste date
  • tuplu: Datele sunt transmise ca tuplu

4) Menționați care este diferența dintre Apache Hbase și Storm?

                           Furtuna Apache                               apache hbase
  • Oferă prelucrarea datelor în timp real
  • Prelucrează datele, dar nu le stochează
  • Vă veți eficientiza datele acolo unde datele sunt procesate în timp real, astfel încât alertele și acțiunile să poată fi lansate dacă este necesar
  •  Vă oferă citiri cu latență scăzută ale datelor procesate pentru a le interoga mai târziu
  • Stochează datele, dar nu le stochează

5) Explicați cum puteți eficientiza fișierele jurnal folosind Apache storm?

Pentru a citi din fișierele jurnal, puteți configura dvs canal de scurgere și emit pe linie pe măsură ce citește jurnalul. Ieșirea poate fi apoi atribuită unui șurub pentru analiză.

Întrebări la interviu Apache Storm
Întrebări la interviu Apache Storm

6) Explicați ce sunt fluxurile și gruparea fluxurilor în Apache storm?

În Apache Storm, fluxul este menționat ca un grup sau o secvență nelimitată de tupli, în timp ce gruparea fluxului determină modul în care fluxul ar trebui să fie împărțit între sarcinile bolt-ului.


7) Listați diferite grupări de fluxuri în Apache storm?

  • Amestecă gruparea
  • Gruparea câmpurilor
  • Gruparea globală
  • Toate gruparea
  • Nicio grupare
  • Grupare directă
  • Gruparea locală

8) Menționați cum poate fi benefică aplicarea furtunii în serviciile financiare?

În serviciile financiare, Storm poate fi de ajutor în prevenire

  • Fraude în domeniul valorilor mobiliare
  • Dirijarea comenzilor
  • Listă de prețuri
  • Încălcări de conformitate
Întrebări la interviu Storm
Întrebări la interviu Storm

9) Explicați ce este Topology_Message_Timeout_secs în Apache Storm?

Timpul maxim alocat topologiei pentru a procesa complet un mesaj eliberat de un canal. Dacă mesajul nu este confirmat într-un interval de timp dat, Apache storm va eșua mesajul de pe gura de scurgere.


10) Explicați cum este procesat complet mesajul în Apache Storm?

Apelând la următorulTuple procedură sau metodă pe Spout, Storm solicită un tuplu de la Spout. Pipa folosește SpoutoutputCollector dat în deschide metodă de a descărca un tuplu într-unul dintre fluxurile sale de ieșire. În timp ce descarcă un tuplu, canal de scurgere alocă un „id de mesaj” care va fi folosit pentru a recunoaște tuplu mai târziu. După aceea, tuplul este trimis la șuruburi consumatoare, iar storm se ocupă de urmărirea arborelui de mesaje care este produs.

Dacă furtuna este încrezătoare că un tuplu este procesat temeinic, atunci poate apela ACK procedura asupra originării canal de scurgere sarcină cu ID-ul mesajului pe care Spout l-a dat Furtunii.


11) Explicați cum să scrieți Ieșirea într-un fișier folosind Storm?

În Spout, când citiți fișierul, faceți Obiect FileReader in Deschis() metoda, ca atare atunci când inițializează obiectul cititor pentru nodul lucrător. Și utilizați acel obiect în metoda nextTuple().


12) Menționați care este diferența dintre Apache Kafka și Apache Storm?

  • Apache Kafka: Este un sistem de mesagerie distribuit și robust, care poate gestiona o cantitate imensă de date și permite trecerea mesajelor de la un punct final la altul.
  • Apache Storm: Este un sistem de procesare a mesajelor în timp real și puteți edita sau manipula datele în timp real. Apache storm extrage datele de la Kafka și aplică unele manipulări necesare.

13) Explicați când utilizați gruparea câmpurilor în furtună, există vreo expirare sau limită pentru valorile câmpurilor cunoscute?

Gruparea câmpurilor în storm folosește o funcție hash mod pentru a decide ce sarcină să trimită un tuplu, asigurându-se care sarcină va fi procesată în ordinea corectă. Pentru asta, nu aveți nevoie de nicio memorie cache. Deci, nu există o limită de timp sau limită pentru valorile câmpurilor cunoscute.

Aceste întrebări de interviu vă vor ajuta, de asemenea, în viva (orale). Consultați-ne Tutoriale Apache pentru un plus în plus în interviul tău.

Distribuie

Un comentariu

  1. Avatar Anatoly Agulnik spune:

    Răspunsul pentru numărul 11 ​​este incorect. Răspunsul este despre citirea dintr-un fișier, dar întrebarea este despre scrierea într-un fișier

Lasă un comentariu

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate *