Top 13 Apache Storm-interviewspørgsmål og -svar
Storm interview spørgsmål
Her er Apache Storm-interviewspørgsmål og svar til friskere såvel som erfarne udviklerkandidater til at få deres drømmejob.
Gratis PDF-download: Apache Storm-interviewspørgsmål
1) Forklar hvad Apache Storm er? Hvad er komponenterne i Storm?
Apache storm er et open source-distribueret realtidsberegningssystem, der bruges til at behandle big data-analyse i realtid. I modsætning til Hadoop batchbehandling, gør Apache storm til realtidsbehandling og kan bruges med ethvert programmeringssprog.
Komponenter af Apache Storm inkluderer
- Nimbus: Det fungerer som en Hadoop's Job Tracker. Det distribuerer kode på tværs af klyngen, uploader beregninger til udførelse, allokerer arbejdere på tværs af klyngen og overvåger beregninger og omallokerer arbejdere efter behov
- Dyrepasser: Det bruges som formidler til kommunikation med Storm Cluster
- Tilsynsførende: Interagerer med Nimbus gennem Zookeeper, afhængigt af de signaler, der modtages fra Nimbus, udfører den processen.
2) Hvorfor Apache Storm er det første valg til realtidsbehandling?
- Let at betjene: Drift storm er stille let
- Rigtig hurtig: Den kan behandle 100 beskeder pr. sekund pr. node
- Fejltolerant: Den registrerer fejlen automatisk og genstarter de funktionelle egenskaber
- Pålidelig: Det garanterer, at hver enhed af data vil blive udført mindst én gang eller nøjagtig én gang
- Skalerbar: Det kører på tværs af en klynge af maskiner
3) Forklar hvordan data er stream flow i Apache Storm?
I Apache storm er data stream flow med tre komponenter Tud, Bolt og Tuple
- Tud: En tud er en datakilde i Storm
- Bolt: En bolt behandler disse data
- Tuple: Data videregives som Tuple
4) Nævn hvad er forskellen mellem Apache Hbase og Storm?
Apache Storm | apache hbase |
|
|
5) Forklar, hvordan du kan strømline logfiler ved hjælp af Apache storm?
For at læse fra logfilerne kan du konfigurere din tud og udsende pr. linje, mens den læser loggen. Udgangen kan derefter tildeles en bolt til analyse.
6) Forklar hvad vandløb er og vandløbsgruppering i Apache-storm?
I Apache Storm omtales stream som en gruppe eller ubegrænset sekvens af Tuples, mens strømgruppering bestemmer, hvordan stream skal opdeles blandt boltens opgaver.
7) Liste over forskellige strømgrupper i Apache-stormen?
- Bland gruppering
- Feltgruppering
- Global gruppering
- Alle grupperinger
- Ingen gruppering
- Direkte gruppering
- Lokal gruppering
8) Nævn, hvordan stormapplikation kan være gavnlig i finansielle tjenesteydelser?
Inden for finansielle tjenesteydelser kan Storm være behjælpelig med at forebygge
- Værdipapirsvig
- Ordredirigering
- Priser
- Overtrædelser af overholdelse
9) Forklar, hvad er Topology_Message_Timeout_secs i Apache Storm?
Den maksimale tid, der er tildelt topologien til fuldt ud at behandle en meddelelse frigivet af en tud. Hvis beskeden ikke bliver bekræftet inden for en given tidsramme, vil Apache storm fejle beskeden på tuden.
10) Forklar, hvordan beskeden behandles fuldt ud i Apache Storm?
Ved at ringe til næsteTuple procedure eller metode på tuden, anmoder Storm om en tupel fra tuden. Tuden benytter SpoutoutputCollector givet i åbent metode til at udlede en tupel til en af dens udgangsstrømme. Mens man udleder en tupel, Tud tildeler et "besked-id", som vil blive brugt til at genkende tuple senere. Derefter bliver tuplet sendt til forbrugende bolte, og storm tager ansvaret for at spore træet af beskeder, der produceres.
Hvis stormen er sikker på, at en tupel er behandlet grundigt, så kan den kalde den ack procedure på oprindelsen Tud opgave med det besked-id, som Tuden har givet til Stormen.
11) Forklar hvordan man skriver output til en fil ved hjælp af Storm?
I Tud, når du læser fil, lav FileReader objekt in Åben() metode, som sådan den tid, den initialiserer læserobjektet for arbejderknudepunkt. Og brug det objekt i metoden nextTuple().
12) Nævn hvad er forskellen mellem Apache Kafka og Apache Storm?
- Apache Kafka: Det er et distribueret og robust meddelelsessystem, der kan håndtere enorme mængder data og tillader passage af meddelelser fra et slutpunkt til et andet.
- Apache Storm: Det er et meddelelsesbehandlingssystem i realtid, og du kan redigere eller manipulere data i realtid. Apache-stormen trækker dataene fra Kafka og anvender noget påkrævet manipulation.
13) Forklar ved brug af feltgruppering i storm, er der nogen time-out eller grænse for kendte feltværdier?
Feltgruppering i storm bruger en mod-hash-funktion til at bestemme, hvilken opgave der skal sendes en tuple, hvilket sikrer, at opgaven bliver behandlet i den rigtige rækkefølge. Til det behøver du ikke nogen cache. Så der er ingen time-out eller grænse for kendte feltværdier.
Disse interviewspørgsmål vil også hjælpe i din viva(orals). Henvis vores Apache tutorials for en ekstra kant i dit interview.
Svar til #11 er forkert. Svaret handler om at læse fra en fil, men spørgsmålet handler om at skrive ind i en fil