Topp 13 Apache Storm-intervjuspørsmål og svar
Storm-intervjuspørsmål
Her er Apache Storm-intervjuspørsmål og svar for ferskere så vel som erfarne utviklerkandidater for å få drømmejobben.
Gratis PDF-nedlasting: Apache Storm-intervjuspørsmål
1) Forklar hva er Apache Storm? Hva er komponentene i Storm?
Apache storm er et åpen kildekode-distribuert sanntidsberegningssystem som brukes til å behandle sanntids big data-analyse. I motsetning til Hadoop batchbehandling, gjør Apache storm for sanntidsbehandling og kan brukes med et hvilket som helst programmeringsspråk.
Komponenter av Apache Storm inkluderer
- Nimbus: Den fungerer som en Hadoop's Job Tracker. Den distribuerer kode på tvers av klyngen, laster opp beregninger for utførelse, tildeler arbeidere på tvers av klyngen og overvåker beregninger og omallokerer arbeidere etter behov
- Dyrepasser: Den brukes som formidler for kommunikasjon med Storm Cluster
- veileder: Samhandler med Nimbus gjennom Zookeeper, avhengig av signalene mottatt fra Nimbus, utfører den prosessen.
2) Hvorfor Apache Storm er førstevalget for sanntidsbehandling?
- Enkel å betjene: Operasjon storm er stille lett
- Skikkelig raskt: Den kan behandle 100 meldinger per sekund per node
- Feiltolerant: Den oppdager feilen automatisk og starter funksjonsattributtene på nytt
- Pålitelig: Den garanterer at hver dataenhet vil bli utført minst én gang eller nøyaktig én gang
- Skalerbar: Den kjører over en klynge av maskiner
3) Forklar hvordan data er strømflyt i Apache Storm?
I Apache-storm er data strømflyt med tre komponenter Tut, Bolt og tuppel
- tut: En tut er en datakilde i Storm
- BOLT: En bolt behandler disse dataene
- Tuppel: Data sendes som Tuple
4) Nevn hva som er forskjellen mellom Apache Hbase og Storm?
Apache Storm | apache hbase |
|
|
5) Forklar hvordan du kan strømlinjeforme loggfiler ved hjelp av Apache storm?
For å lese fra loggfilene kan du konfigurere din tut og sender ut per linje når den leser loggen. Utgangen kan deretter tilordnes en bolt for analyse.
6) Forklar hva bekker er og bekkegruppering i Apache-storm?
I Apache Storm blir strømmen referert til som en gruppe eller ubegrenset sekvens av Tuples mens strømgruppering bestemmer hvordan strømmen skal deles opp mellom boltens oppgaver.
7) Liste ut forskjellige strømgrupperinger i Apache-stormen?
- Bland gruppering
- Feltgruppering
- Global gruppering
- All gruppering
- Ingen gruppering
- Direkte gruppering
- Lokal gruppering
8) Nevn hvordan stormapplikasjon kan være gunstig i finansielle tjenester?
Innen finansielle tjenester kan Storm være behjelpelig med å forebygge
- Verdipapirsvindel
- Bestillingsruting
- Prising:
- Overholdelsesbrudd
9) Forklar hva er Topology_Message_Timeout_secs i Apache Storm?
Den maksimale tiden som er tildelt topologien for å fullstendig behandle en melding utgitt av en tut. Hvis meldingen ikke er bekreftet innen gitt tidsramme, vil Apache storm mislykkes med meldingen på tuten.
10) Forklar hvordan meldingen behandles fullstendig i Apache Storm?
Ved å ringe til nesteTuple prosedyre eller metode på tuten, ber Storm om en tuppel fra tuten. Tuten benytter seg av SpoutoutputCollector gitt i åpen metode for å slippe ut en tuppel til en av utgangsstrømmene. Mens du tømmer en tuppel, tut tildeler en "meldings-ID" som vil bli brukt til å gjenkjenne tuppelen senere. Etter det blir tuppelen sendt til fortærende bolter, og storm tar ansvar for å spore meldingstreet som produseres.
Hvis stormen er sikker på at en tuppel blir behandlet grundig, kan den ringe ack prosedyre på opprinnelsen tut oppgave med meldings-ID som tuten har gitt til stormen.
11) Forklar hvordan du skriver utdata til en fil ved hjelp av Storm?
I Tut, når du leser filen, lag FileReader-objekt in Åpne() metoden, som sådan at den initialiserer leserobjektet for arbeidernoden. Og bruk det objektet i nextTuple()-metoden.
12) Nevn hva er forskjellen mellom Apache Kafka og Apache Storm?
- Apache Kafka: Det er et distribuert og robust meldingssystem som kan håndtere enorme mengder data og tillater passasje av meldinger fra ett endepunkt til et annet.
- Apache Storm: Det er et sanntidsmeldingsbehandlingssystem, og du kan redigere eller manipulere data i sanntid. Apache storm henter dataene fra Kafka og bruker noe nødvendig manipulasjon.
13) Forklar ved bruk av feltgruppering i storm, er det noen time-out eller grense for kjente feltverdier?
Feltgruppering i storm bruker en mod-hash-funksjon for å bestemme hvilken oppgave som skal sendes en tuppel, og sikrer hvilken oppgave som blir behandlet i riktig rekkefølge. For det trenger du ingen cache. Så det er ingen tidsavbrudd eller grense for kjente feltverdier.
Disse intervjuspørsmålene vil også hjelpe i din viva(orals). Se vår Apache veiledninger for en ekstra fordel i intervjuet ditt.
Svaret for #11 er feil. Svaret handler om å lese fra en fil, men spørsmålet handler om å skrive inn i en fil