Topp 13 Apache Storm-intervjufrågor och svar
Stormintervjufrågor
Här är Apache Storm-intervjufrågor och svar för nyblivna såväl som erfarna utvecklarkandidater för att få sitt drömjobb.
Gratis PDF-nedladdning: Apache Storm-intervjufrågor
1) Förklara vad Apache Storm är? Vilka är komponenterna i Storm?
Apache storm är ett distribuerat realtidsberäkningssystem med öppen källkod som används för att bearbeta realtidsanalys av big data. Till skillnad från Hadoop batchbearbetning, gör Apache storm för realtidsbearbetning och kan användas med vilket programmeringsspråk som helst.
Komponenter i Apache Storm inkluderar
- Nimbus: Det fungerar som en Hadoop's Job Tracker. Den distribuerar kod över klustret, laddar upp beräkningar för exekvering, allokerar arbetare över klustret och övervakar beräkningar och omfördelar arbetare efter behov
- Djurskötare: Den används som förmedlare för kommunikation med Storm Cluster
- Handledare: Interagerar med Nimbus genom Zookeeper, beroende på signalerna som tas emot från Nimbus, exekverar den processen.
2) Varför Apache Storm är förstahandsvalet för realtidsbehandling?
- Enkel att använda: Operativ storm är tyst lätt
- Riktigt snabbt: Den kan behandla 100 meddelanden per sekund per nod
- Feltolerant: Den upptäcker felet automatiskt och startar om funktionsattributen
- Pålitlig: Det garanterar att varje dataenhet kommer att exekveras minst en gång eller exakt en gång
- skalbar: Den körs över ett kluster av maskiner
3) Förklara hur dataflödet är i Apache Storm?
I Apache storm är data strömflöde med tre komponenter Pip, Bolt och tupel
- Pip: En pip är en datakälla i Storm
- Bult: En bult bearbetar dessa data
- Tuppel: Data skickas som Tuple
4) Nämn vad är skillnaden mellan Apache Hbase och Storm?
Apache Storm | apache hbase |
|
|
5) Förklara hur du kan effektivisera loggfiler med Apache storm?
För att läsa från loggfilerna kan du konfigurera din pip och sänder ut per rad när den läser loggen. Utgången kan sedan tilldelas en bult för analys.
6) Förklara vad strömmar är och strömgruppering i Apache storm?
I Apache Storm hänvisas ström till som en grupp eller obegränsad sekvens av Tuples medan strömgruppering avgör hur strömmen ska delas upp bland bultens uppgifter.
7) Lista ut olika strömgrupper i Apache-stormen?
- Blanda gruppering
- Fältgruppering
- Global gruppering
- All gruppering
- Ingen gruppering
- Direkt gruppering
- Lokal gruppering
8) Nämn hur stormapplikationer kan vara fördelaktiga inom finansiella tjänster?
Inom finansiella tjänster kan Storm vara till hjälp för att förebygga
- Värdepappersbedrägeri
- Beställningsdirigering
- Priser
- Överträdelser av efterlevnad
9) Förklara vad är Topology_Message_Timeout_secs i Apache Storm?
Den maximala tid som tilldelas topologin för att fullständigt bearbeta ett meddelande som släpps av en pip. Om meddelandet inte bekräftas inom en given tidsram kommer Apache storm att misslyckas med meddelandet på pipen.
10) Förklara hur meddelandet behandlas fullt ut i Apache Storm?
Genom att ringa till nästaTuple procedur eller metod på pipen, begär Storm en tuppel från pipen. Pipen utnyttjar SpoutoutputCollector ges i öppet metod för att tömma en tupel till en av dess utströmmar. Medan man laddar ur en tupel, Pip tilldelar ett "meddelande-id" som kommer att användas för att känna igen tuppeln senare. Efter det skickas tuppeln till förtärande bultar, och storm tar ansvar för att spåra trädet av meddelanden som produceras.
Om stormen är säker på att en tuppel bearbetas noggrant, kan den ringa ack förfarande om ursprunget Pip uppgift med meddelande-id som pipen har gett till stormen.
11) Förklara hur man skriver utdata till en fil med Storm?
I Spout, när du läser filen, gör FileReader-objekt in Öppen() metod, som sådan den gången den initierar läsarobjektet för arbetarnod. Och använd det objektet i metoden nextTuple().
12) Nämn vad är skillnaden mellan Apache Kafka och Apache Storm?
- Apache Kafka: Det är ett distribuerat och robust meddelandesystem som kan hantera enorma mängder data och tillåter passage av meddelanden från en slutpunkt till en annan.
- Apache Storm: Det är ett meddelandebehandlingssystem i realtid och du kan redigera eller manipulera data i realtid. Apache storm hämtar data från Kafka och tillämpar viss nödvändig manipulation.
13) Förklara när man använder fältgruppering i storm, finns det någon time-out eller gräns för kända fältvärden?
Fältgruppering i storm använder en mod-hash-funktion för att bestämma vilken uppgift som ska skickas en tupel, vilket säkerställer vilken uppgift som kommer att behandlas i rätt ordning. För det behöver du ingen cache. Så det finns ingen time-out eller gräns för kända fältvärden.
Dessa intervjufrågor kommer också att hjälpa dig i din viva(orals). Se vår Tutorials för Apache för en extra fördel i din intervju.
Svaret för #11 är felaktigt. Svaret handlar om att läsa från en fil men frågan handlar om att skriva till en fil