A 30 legnépszerűbb Hive-interjú kérdés és válasz (2025)
Kaptárinterjúkérdések pályakezdőknek és tapasztaltaknak
Íme a Hive-interjúval kapcsolatos kérdések és válaszok pályakezdőknek és tapasztalt jelölteknek álmaik állása megszerzéséhez.
Ingyenes PDF letöltés: Kaptár-interjúkérdések
1) Magyarázza el, mi az a Hive?
A Hive egy ETL és adattárház-eszköz, amelyet a Hadoop Distributed File System (HDFS) tetején fejlesztettek ki. Ez egy adattárház-keretrendszer a HDFS-ben tárolt adatok lekérdezésére és elemzésére. A Hive egy nyílt forráskódú szoftver, amely lehetővé teszi a programozóknak, hogy nagy adathalmazokat elemezzenek Hadoop.
2) Mikor kell használni a Hive-t?
- A kaptár hasznos a készítés során adattárház alkalmazások
- Amikor statikus adatokkal foglalkozik dinamikus adatok helyett
- Amikor az alkalmazás magas késleltetésű (magas válaszidő)
- Ha nagy adatkészletet tart fenn
- Amikor lekérdezéseket használunk szkriptelés helyett
3) Említse meg, melyek a Hive különböző módjai?
A Hadoop adatcsomópontjainak méretétől függően a Hive két módban működhet. Ezek a módok,
- Helyi mód
- Térképcsökkentési mód
4) Említse meg, mikor kell használni a Térképcsökkentési módot?
A térképcsökkentési módot akkor használja, ha
- Nagy mennyiségű adathalmazon fog teljesíteni, és a lekérdezéseket párhuzamosan hajtják végre
- A Hadoop több adatcsomóponttal rendelkezik, és az adatok különböző csomópontok között vannak elosztva, amelyeket ebben a módban használunk
- Nagy adathalmazok jobb teljesítményű feldolgozását kell elérni
5) Említse meg a Hive Architecture kulcsfontosságú összetevőit?
A Hive Architecture kulcsfontosságú összetevői a következők:
- felhasználói felület
- fordítóprogram
- Metastore
- Vezető
- Motor végrehajtása
6) Említse meg, milyen típusú táblázatok állnak rendelkezésre a Hive-ban?
A Hive-ben kétféle asztal érhető el.
- Kezelt asztal: A felügyelt táblában mind az adatokat, mind a sémát a Hive vezérli
- Külső asztal: A külső táblában csak a séma van a Hive irányítása alatt.
7) Magyarázza el, mi az a Metastore in Hive?
A Metastore a Hive központi tárolója. A sémainformációk vagy metaadatok külső adatbázisban történő tárolására szolgál.
8) Említse meg, miből áll a Hive?
A kaptár 3 fő részből áll,
- Hive ügyfelek
- Hive szolgáltatások
- Kaptár tárolás és számítástechnika
9) Említse meg, milyen típusú adatbázisokat támogat a Hive?
Az egyfelhasználós metaadatok tárolására a Hive a derby adatbázist, a többfelhasználós metaadatokhoz vagy a megosztott metaadat-esetekhez pedig a Hive-et használja MySQL.
10) Említse meg a Hive alapértelmezett olvasási és írási osztályait?
A Hive alapértelmezett olvasási és írási osztályai
- TextInputFormat/HiveIgnoreKeyTextOutputFormat
- SequenceFileInputFormat/SequenceFileOutputFormat
11) Mi az indexelés a Hive-ben?
A kaptárindexelés egy lekérdezésoptimalizálási technika, amellyel a táblázat egyes oszlopaiban javítható a lekérdezés keresése.
12) Miért nem alkalmas a Hive OLTP-rendszerekhez?
A Hive nem alkalmas OLTP-rendszerekhez, mert nem biztosít beszúrási és frissítési funkciót sorszinten.
13) Említse meg, mi a különbség a Hbase és a Hive között?
A Hbase és a Hive közötti különbség
- A kaptár lehetővé teszi a legtöbb SQL lekérdezéseket, de a HBase nem engedélyezi az SQL lekérdezéseket
- A Hive nem támogatja a rekordszintű beszúrási, frissítési és törlési műveleteket a táblán
- A Hive egy adattárház-keretrendszer, míg a HBase egy NoSQL-adatbázis
- A Hive a MapReduce tetején fut, a HBase a HDFS tetején fut
14) Magyarázza el, mi az a Hive-változó? Mire használjuk?
A Hive-változó a Hive-környezetben jön létre, amelyre Hive-szkriptek hivatkozhatnak. Arra szolgál, hogy bizonyos értékeket adjon át a hive-lekérdezéseknek, amikor a lekérdezés elindul.
15) Említse meg, mi az ObjectInspector funkció a Hive-ban?
A Hive ObjectInspector funkciói az oszlopok, sorok és összetett objektumok belső szerkezetének elemzésére szolgálnak. Lehetővé teszi az objektumok belső mezőinek elérését.
16) Említse meg, mi az (HS2) HiveServer2?
Ez egy szerver interfész, amely a következő funkciókat látja el.
- Lehetővé teszi a távoli ügyfelek számára, hogy lekérdezéseket hajtsanak végre a Hive ellen
- Kérje le az említett lekérdezések eredményeit
Néhány speciális funkció, amely a Thrift RPC-n alapul a legújabb verziójában
- Több ügyfél párhuzamossága
- Hitelesítés
17) Említse meg, mit csinál a Hive lekérdezésfeldolgozó?
Hive lekérdezésfeldolgozó konvertálja a MapReduce-feladatok grafikonját a végrehajtási időkerettel. Hogy a munkákat a függőségi sorrendben lehessen végrehajtani.
18) Említse meg, melyek a Hive lekérdezésfeldolgozó összetevői?
A Hive lekérdező processzor összetevői a következők:
- Logikai tervgenerálás
- Fizikai terv generálása
- Végrehajtó motor
- Üzemeltetők
- UDF-ek és UDAF-ok
- Optimizer
- értelmező
- Szemantikus elemző
- Típusellenőrzés
19) Említse meg, mi az a partíciók a Kaptárban?
A Hive a táblákat partíciókba rendezi.
- Ez az egyik módja annak, hogy a táblákat partíciós kulcsok alapján különböző részekre osztjuk.
- A partíció akkor hasznos, ha a tábla egy vagy több partíciókulccsal rendelkezik.
- A partíciós kulcsok alapvető elemek az adatok táblázatban való tárolásának meghatározásához.
20) Említse meg, mikor válassza a „Belső táblázat” és a „Külső táblázat” lehetőséget a Hive-ban?
A Hive-ben kiválaszthatja a belső táblázatot,
- Ha a feldolgozási adatok a helyi fájlrendszerben elérhetők
- Ha azt szeretnénk, hogy a Hive kezelje az adatok teljes életciklusát, beleértve a törlést is
Választhat külső asztalt,
- Ha HDFS-ben elérhető adatokat dolgoz fel
- Hasznos, ha a fájlokat a Hive-n kívül használják
21) Említse meg, hogy el tudjuk-e nevezni a nézetet egy Hive tábla nevével?
Nem. A nézet nevének egyedinek kell lennie az összes többi táblához képest és az ugyanabban az adatbázisban lévő nézetekhez képest.
22) Említse meg, melyek azok a nézetek a Kaptárban?
A Hive-ban a nézetek hasonlóak a táblázatokhoz. Ezeket a követelmények alapján állítják elő.
- Bármilyen eredményhalmaz adatot elmenthetünk nézetként a Hive-ban
- A használat hasonló az SQL-ben használt nézetekhez
- Minden típusú DML-művelet végrehajtható egy nézeten
23) Magyarázza el, hogyan tudja a Hive deszerializálni és szerializálni az adatokat?
Általában az adatok olvasása/írása közben a felhasználó először a bemeneti formátummal kommunikál. Ezután csatlakozik a Record olvasóhoz a rekord olvasásához/írásához. Az adatok sorba rendezéséhez az adatok sorba kerülnek. Itt a deserializált egyéni serde objektumellenőrt használ a mezőkben lévő adatok deszerializálásához.
24) Mi az a Buckets in Hive?
- A partíciókban található adatok tovább bonthatók vödörekre
- A felosztás a táblázatban kiválasztott oszlopok hash-je alapján történik.
25) A Hive-ban hogyan lehet engedélyezni a csoportokat?
A Hive-ben a következő paranccsal engedélyezheti a gyűjtőcsoportokat:
set.hive.enforce.bucketing=true;
26) A Hive-ban felülírhatja a Hadoop MapReduce konfigurációját a Hive-ben?
Igen, felülírhatja a Hadoop MapReduce konfigurációját a Hive-ben.
27) Magyarázza el, hogyan módosíthatja az oszlop adattípusát a Hive-ben?
A Hive oszlop adattípusát a következő paranccsal módosíthatja:
ALTER TABLE table_name CHANGE column_name column_name new_datatype;
28) Említse meg, mi a különbség a sorrend és a rendezés között a Kaptárban?
- A SORT BY az egyes reduktorokon belül rendezi az adatokat. A SORT BY művelethez tetszőleges számú szűkítőt használhat.
- A ORDER BY az összes adatot egybe rendezi, amelyeknek egy szűkítőn kell átmenniük. Így az ORDER BY a kaptárban egyetlent használ
29) Magyarázza el, mikor kell használni az explode-t a Hive-ben?
A Hadoop fejlesztői néha egy sor bemenetként, és konvertálja egy külön táblázatsorba. Az összetett adattípusok kívánt táblázatformátumokká alakításához használja a Hive explode-t.
30) Említse meg, hogyan lehet leállítani egy partíciós űrlap lekérdezését?
A partíciós űrlap lekérdezését az ENABLE OFFLINE záradékkal és az ALTER TABLE utasítással állíthatja le.
Ezek az interjúkérdések a viva(orals) során is segítenek. Lásd a mi Kaptár oktatóanyagok egy extra előnyért az interjúban.
Nagyon hasznos……..hasznos……..segít az interjú előkészítésében, valamint az önfelkészülésben.
Köszönöm! Nagyon hasznos!
Azt hiszem, feltehetsz néhány kérdést az „adattorzítással” kapcsolatban, mivel általában arra kértek, hogy válaszoljak ezekre a kérdésekre, amikor kérdező voltam.
kérjük, adjon hozzá interjúkérdéseket, amelyeket feltett