13 parasta Apache Storm -haastattelun kysymystä ja vastausta
Myrskyhaastattelukysymykset
Tässä Apache Storm -haastattelukysymyksiä ja vastauksia fuksilaisille sekä kokeneille kehittäjäehdokkaille saadakseen unelmatyönsä.
Ilmainen PDF-lataus: Apache Storm -haastattelukysymykset
1) Selitä mikä on Apache Storm? Mitkä ovat Stormin komponentit?
Apache storm on avoimen lähdekoodin hajautettu reaaliaikainen laskentajärjestelmä, jota käytetään reaaliaikaisen big data-analytiikan käsittelyyn. Toisin kuin Hadoop eräkäsittely, Apache storm tekee reaaliaikaiseen käsittelyyn ja sitä voidaan käyttää minkä tahansa ohjelmointikielen kanssa.
Apache Stormin komponentit sisältävät
- Nimbus: Se toimii Hadoop's Job Trackerina. Se jakaa koodia klusterin kesken, lataa laskentaa suoritettaviksi, allokoi työntekijät klusterin kesken ja valvoo laskentaa ja kohdistaa työntekijät uudelleen tarpeen mukaan.
- Eläintarhanhoitaja: Sitä käytetään välittäjänä viestinnässä Storm Clusterin kanssa
- Valvoja: On vuorovaikutuksessa Nimbuksen kanssa Zookeeperin kautta, riippuen Nimbuksesta vastaanotetuista signaaleista, se suorittaa prosessin.
2) Miksi Apache Storm on ensimmäinen valinta reaaliaikaiseen käsittelyyn?
- Helppo käyttää: Myrskyn käyttö on hiljaista helppoa
- Todella nopea: Se voi käsitellä 100 viestiä sekunnissa solmua kohden
- Vikasietokykyinen: Se havaitsee vian automaattisesti ja käynnistää toiminnalliset ominaisuudet uudelleen
- Luotettava: Se takaa, että jokainen tietoyksikkö suoritetaan vähintään kerran tai täsmälleen kerran
- skaalautuva: Se kulkee koneryhmän poikki
3) Selitä, kuinka data virtaa Apache Stormissa?
Apache-myrskyssä data on kolmen komponentin virtaa Nokka, Bolt ja monikko
- Suutin, nokka: Nokka on Stormin tietolähde
- Pultti: Pultti käsittelee nämä tiedot
- Tupla: Tiedot välitetään Tuple-muodossa
4) Mainitse mikä ero on Apache Hbasen ja Stormin välillä?
Apache Storm | apache hbase |
|
|
5) Selitä, kuinka voit virtaviivaistaa lokitiedostoja Apache stormin avulla?
Lukeaksesi lokitiedostoista voit määrittää oman nokka ja lähettää riviä kohden, kun se lukee lokia. Tulos voidaan sitten määrittää pulttiin analysointia varten.
6) Selitä mitä virrat ovat ja virtojen ryhmittely Apache-myrskyssä?
Apache Stormissa streamiin viitataan ryhmänä tai rajoittamattomana Tuples-sekvenssinä, kun taas virran ryhmittely määrittää, kuinka virta tulisi jakaa pultin tehtävien kesken.
7) Luettele eri virtaryhmittely Apache-myrskyssä?
- Satunnaisryhmittely
- Kenttien ryhmittely
- Globaali ryhmittymä
- Kaikki ryhmittely
- Ei mitään ryhmittelyä
- Suora ryhmittely
- Paikallinen ryhmittely
8) Mainitse kuinka myrskysovelluksesta voi olla hyötyä rahoituspalveluissa?
Rahoituspalveluissa Storm voi auttaa ehkäisemään
- Arvopaperipetokset
- Tilauksen reititys
- Hinnasto:
- Vaatimustenmukaisuusrikkomukset
9) Selitä mikä on Topology_Message_Timeout_secs Apache Stormissa?
Topologialle varattu enimmäisaika nokan lähettämän viestin käsittelemiseen kokonaan. Jos viestiä ei kuitata tietyn ajan kuluessa, Apache storm epäonnistuu viestissä suuttimessa.
10) Selitä, kuinka viesti käsitellään kokonaan Apache Stormissa?
Soittamalla nextTuple Proseduuri tai menetelmä suuttimessa, Storm pyytää monikkoa juoksuputkesta. Nokka hyödyntää SpoutoutputCollector annettu kohdassa avata tapa purkaa monikko johonkin sen lähtövirroista. Kun tyhjennät monikkoa, nokka määrittää "viestitunnuksen", jota käytetään monikon tunnistamiseen myöhemmin. Sen jälkeen monikko lähetetään kuluttaville pulteille, ja myrsky ottaa vastuun tuotetun viestipuun seurannasta.
Jos myrsky on varma, että tuple on käsitelty perusteellisesti, se voi kutsua ack menettelyä alkuperään nokka tehtävä viestitunnuksella, jonka Spout on antanut Myrskylle.
11) Selitä, kuinka tuloste kirjoitetaan tiedostoon Stormin avulla?
Spoutissa, kun luet tiedostoa, tee FileReader-objekti in Avata() menetelmä sellaisenaan, jolloin se alustaa lukijaobjektin työntekijäsolmulle. Ja käytä kyseistä objektia nextTuple()-metodissa.
12) Mainitse mikä ero on Apache Kafkan ja Apache Stormin välillä?
- Apache Kafka: Se on hajautettu ja vankka viestintäjärjestelmä, joka pystyy käsittelemään valtavan määrän dataa ja mahdollistaa viestien siirtämisen päätepisteestä toiseen.
- Apache Storm: Se on reaaliaikainen viestienkäsittelyjärjestelmä, ja voit muokata tai käsitellä tietoja reaaliajassa. Apache-myrsky hakee tiedot Kafkasta ja tekee tarvittavat manipulaatiot.
13) Selitä, kun käytät kenttäryhmittelyä myrskyssä, onko tunnetuilla kenttäarvoilla aikakatkaisua tai rajoitusta?
Kenttien ryhmittely myrskyssä käyttää mod hash -toimintoa päättääkseen, mikä tehtävä lähettää monikko, mikä varmistaa, mikä tehtävä käsitellään oikeassa järjestyksessä. Tätä varten et vaadi välimuistia. Tunnetuille kenttäarvoille ei siis ole aikakatkaisua tai rajoitusta.
Nämä haastattelukysymykset auttavat myös viva-asioissasi. Katso meidän Apache opetusohjelmat saadaksesi lisäedun haastattelussasi.
Vastaus numeroon 11 on virheellinen. Vastaus koskee tiedostosta lukemista, mutta kysymys on tiedostoon kirjoittamisesta