Le 13 principali domande e risposte all'intervista su Apache Storm

Domande per l'intervista sulla tempesta

Ecco le domande e le risposte al colloquio su Apache Storm per i principianti e per i candidati sviluppatori esperti che vogliono ottenere il lavoro dei loro sogni.

Download gratuito del PDF: domande dell'intervista ad Apache Storm


1) Spiegare cos'è Apache Storm? Quali sono i componenti di Storm?

Apache Storm è un sistema di calcolo distribuito in tempo reale open source utilizzato per l'elaborazione di analisi di big data in tempo reale. A differenza di Hadoop elaborazione batch, Apache Storm funziona per l'elaborazione in tempo reale e può essere utilizzato con qualsiasi linguaggio di programmazione.

I componenti di Apache Storm includono

  • Nimbo: Funziona come Job Tracker di Hadoop. Distribuisce il codice nel cluster, carica i calcoli per l'esecuzione, assegna i lavoratori nel cluster, monitora i calcoli e rialloca i lavoratori secondo necessità
  • Guardiano dello zoo: Viene utilizzato come mediatore per la comunicazione con l'Ammasso Tempesta
  • Supervisore: Interagisce con Nimbus tramite Zookeeper, a seconda dei segnali ricevuti da Nimbus, esegue il processo.

2) Perché Apache Storm è la prima scelta per l'elaborazione in tempo reale?

  • Facile da usare: La tempesta operativa è abbastanza facile
  • Veramente veloce: Può elaborare 100 messaggi al secondo per nodo
  • Tollerante agli errori: Rileva automaticamente il guasto e riavvia gli attributi funzionali
  • Affidabile: Garantisce che ogni unità di dati verrà eseguita almeno una volta o esattamente una volta
  • Scalabile: Funziona attraverso un cluster di macchine

3) Spiegare come avviene il flusso dei dati in Apache Storm?

In Apache Storm, i dati sono un flusso di flusso con tre componenti Beccuccio, bullone ed tuple

  • Becco: Uno spout è un'origine dati in Storm
  • Bullone: Un bullone elabora questi dati
  • tupla: I dati vengono passati come tupla

4) Menziona qual è la differenza tra Apache Hbase e Storm?

                           Tempesta di Apache                               apache hbase
  • Fornisce l'elaborazione dei dati in tempo reale
  • Elabora i dati ma non li memorizza
  • Semplificherai i tuoi dati laddove i dati verranno elaborati in tempo reale, in modo che possano essere lanciati avvisi e azioni se necessario
  •  Offre letture a bassa latenza dei dati elaborati per eseguire query successive
  • Memorizza i dati ma non li memorizza

5) Spiegare come è possibile semplificare i file di registro utilizzando Apache Storm?

Per leggere dai file di registro puoi configurare il tuo becco ed emette per riga mentre legge il registro. L'output può quindi essere assegnato a un bullone per l'analisi.

Domande per l'intervista ad Apache Storm
Domande per l'intervista ad Apache Storm

6) Spiegare cosa sono i flussi e il raggruppamento dei flussi in Apache Storm?

In Apache Storm, il flusso viene indicato come un gruppo o una sequenza illimitata di tuple mentre il raggruppamento del flusso determina come il flusso deve essere partizionato tra le attività del bullone.


7) Elencare diversi raggruppamenti di flussi in Apache Storm?

  • Raggruppamento casuale
  • Raggruppamento di campi
  • Raggruppamento globale
  • Tutti i raggruppamenti
  • Nessun raggruppamento
  • Raggruppamento diretto
  • Raggruppamento locale

8) Menzionare in che modo l'applicazione Storm può essere vantaggiosa nei servizi finanziari?

Nei servizi finanziari, Storm può essere utile nella prevenzione

  • Frodi sui titoli
  • Instradamento dell'ordine
  • Prezzi
  • Violazioni della conformità
Domande per l'intervista sulla tempesta
Domande per l'intervista sulla tempesta

9) Spiegare cos'è Topology_Message_Timeout_secs in Apache Storm?

La quantità massima di tempo assegnata alla topologia per elaborare completamente un messaggio rilasciato da uno spout. Se il messaggio non viene riconosciuto entro un determinato intervallo di tempo, Apache Storm non riuscirà a trasmettere il messaggio sullo spout.


10) Spiegare come viene completamente elaborato il messaggio in Apache Storm?

Chiamando il nextTuple procedura o metodo sullo Spout, Storm richiede una tupla dallo Spout. Il beccuccio si avvale di SpoutoutputCollector dato nel aprire metodo per scaricare una tupla su uno dei suoi flussi di output. Durante lo scarico di una tupla, il beccuccio alloca un "ID messaggio" che verrà utilizzato per riconoscere la tupla in seguito. Successivamente, la tupla viene inviata a consumare bulloni e Storm si occupa di tracciare l'albero dei messaggi che viene prodotto.

Se Storm è sicuro che la tupla venga elaborata completamente, può chiamare il file ack procedura sull'origine beccuccio compito con l'id del messaggio che lo Spout ha dato alla Tempesta.


11) Spiegare come scrivere l'output in un file utilizzando Storm?

In Spout, quando leggi il file, crea Oggetto FileReader in Aprire() metodo, in quanto tale in quel momento inizializza l'oggetto lettore per il nodo di lavoro. E usa quell'oggetto nel metodo nextTuple().


12) Menziona qual è la differenza tra Apache Kafka e Apache Storm?

  • Apache Kafka: È un sistema di messaggistica distribuito e robusto in grado di gestire enormi quantità di dati e consente il passaggio di messaggi da un punto finale all'altro.
  • Tempesta Apache: È un sistema di elaborazione dei messaggi in tempo reale e puoi modificare o manipolare i dati in tempo reale. Apache Storm estrae i dati da Kafka e applica alcune manipolazioni richieste.

13) Spiegare quando si utilizza il raggruppamento di campi in tempesta, c'è qualche timeout o limite ai valori di campo noti?

Il raggruppamento dei campi in Storm utilizza una funzione mod hash per decidere quale attività inviare una tupla, garantendo quale attività verrà elaborata nell'ordine corretto. Per questo, non hai bisogno di alcuna cache. Pertanto, non esiste alcun timeout o limite ai valori dei campi noti.

Queste domande dell'intervista ti aiuteranno anche nella tua viva(orale). Segnala il nostro Tutorial di Apache per un tocco in più nella tua intervista.

Condividi

Un commento

  1. Avatar Anatolij Agulnik dice:

    La risposta per il punto 11 non è corretta. La risposta riguarda la lettura da un file, ma la domanda riguarda la scrittura in un file

Lascia un Commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *