Topp 13 Apache Storm-intervjufrågor och svar

Stormintervjufrågor

Här är Apache Storm-intervjufrågor och svar för nyblivna såväl som erfarna utvecklarkandidater för att få sitt drömjobb.

Gratis PDF-nedladdning: Apache Storm-intervjufrågor

1) Förklara vad Apache Storm är? Vilka är komponenterna i Storm?

Apache storm är ett distribuerat realtidsberäkningssystem med öppen källkod som används för att bearbeta realtidsanalys av big data. Till skillnad från Hadoop batchbearbetning, gör Apache storm för realtidsbearbetning och kan användas med vilket programmeringsspråk som helst.

Komponenter i Apache Storm inkluderar

Nimbus: Det fungerar som en Hadoop's Job Tracker. Den distribuerar kod över klustret, laddar upp beräkningar för exekvering, allokerar arbetare över klustret och övervakar beräkningar och omfördelar arbetare efter behov
Djurskötare: Den används som förmedlare för kommunikation med Storm Cluster
Handledare: Interagerar med Nimbus genom Zookeeper, beroende på signalerna som tas emot från Nimbus, exekverar den processen.

2) Varför Apache Storm är förstahandsvalet för realtidsbehandling?

Enkel att använda: Operativ storm är tyst lätt
Riktigt snabbt: Den kan behandla 100 meddelanden per sekund per nod
Feltolerant: Den upptäcker felet automatiskt och startar om funktionsattributen
Pålitlig: Det garanterar att varje dataenhet kommer att exekveras minst en gång eller exakt en gång
skalbar: Den körs över ett kluster av maskiner

3) Förklara hur dataflödet är i Apache Storm?

I Apache storm är data strömflöde med tre komponenter Pip, Bolt och tupel

Pip: En pip är en datakälla i Storm
Bult: En bult bearbetar dessa data
Tuppel: Data skickas som Tuple

4) Nämn vad är skillnaden mellan Apache Hbase och Storm?

Apache Storm	apache hbase
Det ger databehandling i realtid Den bearbetar data men lagrar inte Du kommer att effektivisera din data där data bearbetas i realtid, så att varningar och åtgärder kan höjas vid behov	Det ger dig läsningar med låg latens av bearbetade data för att fråga senare Den lagrar data men lagrar inte

5) Förklara hur du kan effektivisera loggfiler med Apache storm?

För att läsa från loggfilerna kan du konfigurera din pip och sänder ut per rad när den läser loggen. Utgången kan sedan tilldelas en bult för analys.

6) Förklara vad strömmar är och strömgruppering i Apache storm?

I Apache Storm hänvisas ström till som en grupp eller obegränsad sekvens av Tuples medan strömgruppering avgör hur strömmen ska delas upp bland bultens uppgifter.

7) Lista ut olika strömgrupper i Apache-stormen?

Blanda gruppering
Fältgruppering
Global gruppering
All gruppering
Ingen gruppering
Direkt gruppering
Lokal gruppering

8) Nämn hur stormapplikationer kan vara fördelaktiga inom finansiella tjänster?

Inom finansiella tjänster kan Storm vara till hjälp för att förebygga

Värdepappersbedrägeri
Beställningsdirigering
Priser
Överträdelser av efterlevnad

9) Förklara vad är Topology_Message_Timeout_secs i Apache Storm?

Den maximala tid som tilldelas topologin för att fullständigt bearbeta ett meddelande som släpps av en pip. Om meddelandet inte bekräftas inom en given tidsram kommer Apache storm att misslyckas med meddelandet på pipen.

10) Förklara hur meddelandet behandlas fullt ut i Apache Storm?

Genom att ringa till nästaTuple procedur eller metod på pipen, begär Storm en tuppel från pipen. Pipen utnyttjar SpoutoutputCollector ges i öppet metod för att tömma en tupel till en av dess utströmmar. Medan man laddar ur en tupel, Pip tilldelar ett "meddelande-id" som kommer att användas för att känna igen tuppeln senare. Efter det skickas tuppeln till förtärande bultar, och storm tar ansvar för att spåra trädet av meddelanden som produceras.

Om stormen är säker på att en tuppel bearbetas noggrant, kan den ringa ack förfarande om ursprunget Pip uppgift med meddelande-id som pipen har gett till stormen.

11) Förklara hur man skriver utdata till en fil med Storm?

I Spout, när du läser filen, gör FileReader-objekt in Öppen() metod, som sådan den gången den initierar läsarobjektet för arbetarnod. Och använd det objektet i metoden nextTuple().

12) Nämn vad är skillnaden mellan Apache Kafka och Apache Storm?

Apache Kafka: Det är ett distribuerat och robust meddelandesystem som kan hantera enorma mängder data och tillåter passage av meddelanden från en slutpunkt till en annan.
Apache Storm: Det är ett meddelandebehandlingssystem i realtid och du kan redigera eller manipulera data i realtid. Apache storm hämtar data från Kafka och tillämpar viss nödvändig manipulation.

13) Förklara när man använder fältgruppering i storm, finns det någon time-out eller gräns för kända fältvärden?

Fältgruppering i storm använder en mod-hash-funktion för att bestämma vilken uppgift som ska skickas en tupel, vilket säkerställer vilken uppgift som kommer att behandlas i rätt ordning. För det behöver du ingen cache. Så det finns ingen time-out eller gräns för kända fältvärden.

Dessa intervjufrågor kommer också att hjälpa dig i din viva(orals). Se vår Tutorials för Apache för en extra fördel i din intervju.

Du kanske gillar: