Top 30 de întrebări și răspunsuri la interviu Hive (2025)

Întrebări de interviu Hive pentru cei proaspăt și cu experiență

Iată întrebările și răspunsurile la interviul Hive pentru studenții, precum și candidații cu experiență, pentru a obține jobul visat.

Descărcare PDF gratuită: Întrebări de interviu Hive

1) Explicați ce este Hive?

Hive este un instrument ETL și de depozitare a datelor dezvoltat pe lângă Hadoop Distributed File System (HDFS). Este un cadru de depozit de date pentru interogarea și analiza datelor care sunt stocate în HDFS. Hive este un software open-source care le permite programatorilor să analizeze seturi mari de date Hadoop.

2) Când să folosiți Hive?

Stupul este util când se face depozit de date aplicatii
Când aveți de-a face cu date statice în loc de date dinamice
Când aplicația are o latență mare (timp de răspuns mare)
Când se menține un set mare de date
Când folosim interogări în loc de scripting

3) Menționați care sunt diferitele moduri de Hive?

În funcție de dimensiunea nodurilor de date din Hadoop, Hive poate funcționa în două moduri. Aceste moduri sunt,

Mod local
Modul de reducere a hărții

4) Menționați când să utilizați modul de reducere a hărții?

Modul de reducere a hărții este utilizat atunci când,

Acesta va funcționa pe o cantitate mare de seturi de date și interogarea va fi executată în mod paralel
Hadoop are mai multe noduri de date, iar datele sunt distribuite pe diferite noduri pe care le folosim Hive în acest mod
Trebuie realizată procesarea seturilor mari de date cu performanțe mai bune

5) Menționați componentele cheie ale arhitecturii Hive?

Componentele cheie ale arhitecturii Hive includ,

User Interface
compilator
Metastore
Şofer
Executați motorul

6) Menționați care sunt diferitele tipuri de mese disponibile în Hive?

Există două tipuri de mese disponibile în Hive.

Masa gestionată: În tabelul gestionat, atât datele, cât și schema sunt sub controlul Hive
Masa externa: În tabelul extern, numai schema este sub controlul lui Hive.

7) Explicați ce este Metastore în Hive?

Metastore este un depozit central în Hive. Este folosit pentru stocarea informațiilor de schemă sau a metadatelor în baza de date externă.

8) Menționați din ce este compus Stupul?

Stupul este format din 3 părți principale,

Clienții Hive
Servicii de stup
Stocare și calcul Hive

9) Menționați care sunt tipurile de baze de date suportate de Hive?

Pentru stocarea metadatelor cu un singur utilizator, Hive folosește baza de date Derby și pentru metadatele cu mai mulți utilizatori sau cazul metadatelor partajate Hive folosește MySQL.

10) Menționați cursurile implicite de citire și scriere Hive?

Clasele implicite de citire și scriere Hive sunt

TextInputFormat/HiveIgnoreKeyTextOutputFormat
SequenceFileInputFormat/SequenceFileOutputFormat

11) Ce este indexarea în Hive?

Hive indexing este o tehnică de optimizare a interogărilor pentru a îmbunătăți viteza de căutare a interogărilor pe anumite coloane ale unui tabel.

12) De ce Hive nu este potrivit pentru sistemele OLTP?

Hive nu este potrivit pentru sistemele OLTP, deoarece nu oferă funcția de inserare și actualizare la nivel de rând.

13) Menționați care este diferența dintre Hbase și Hive?

Diferența dintre Hbase și Hive este,

Hive permite majoritatea SQL interogări, dar HBase nu permite interogări SQL
Hive nu acceptă operațiuni de inserare, actualizare și ștergere la nivel de înregistrare pe masă
Hive este un cadru de depozit de date, în timp ce HBase este o bază de date NoSQL
Hive rulează pe partea de sus a MapReduce, HBase rulează pe partea de sus a HDFS

14) Explicați ce este o variabilă Hive? Pentru ce o folosim?

Variabila Hive este creată în mediul Hive, care poate fi referită de scripturile Hive. Este folosit pentru a transmite unele valori interogărilor stup atunci când interogarea începe să se execute.

15) Menționați ce este funcționalitatea ObjectInspector în Hive?

Funcționalitatea ObjectInspector din Hive este utilizată pentru a analiza structura internă a coloanelor, rândurilor și obiectelor complexe. Permite accesarea câmpurilor interne din interiorul obiectelor.

16) Menționați ce este (HS2) HiveServer2?

Este o interfață de server care îndeplinește următoarele funcții.

Le permite clienților la distanță să execute interogări împotriva Hive
Preluați rezultatele interogărilor menționate

Unele caracteristici avansate bazate pe Thrift RPC în cea mai recentă versiune includ

Concurență multi-client
Autentificare

17) Menționați ce face procesorul de interogări Hive?

Procesorul de interogări Hive convertește graficul joburilor MapReduce cu cadrul de timp de execuție. Pentru ca joburile să poată fi executate în ordinea dependențelor.

18) Menționați care sunt componentele unui procesor de interogări Hive?

Componentele unui procesor de interogări Hive includ,

Generarea planului logic
Generarea Planului Fizic
Motor de executie
Operatorii
UDF și UDAF
Instrumentul de optimizare a
parser
Analizor semantic
Verificare tip

19) Menționați ce este Partitions în Hive?

Hive organizează tabelele în partiții.

Este una dintre modalitățile de împărțire a tabelelor în diferite părți pe baza cheilor de partiție.
Partiția este utilă atunci când tabelul are una sau mai multe chei de partiție.
Cheile de partiție sunt elemente de bază pentru a determina modul în care datele sunt stocate în tabel.

20) Menționați când să alegeți „Internal Table” și „External Table” în Hive?

În Hive puteți alege masa internă,

Dacă datele de prelucrare sunt disponibile în sistemul de fișiere local
Dacă dorim ca Hive să gestioneze întregul ciclu de viață al datelor, inclusiv ștergerea

Puteți alege tabel extern,

Dacă procesarea datelor este disponibilă în HDFS
Util atunci când fișierele sunt utilizate în afara Hive

21) Menționați dacă putem numi vizualizarea la fel ca și numele unui tabel Hive?

Nu. Numele unei vizualizări trebuie să fie unic în comparație cu toate celelalte tabele și ca vizualizări prezente în aceeași bază de date.

22) Menționați ce sunt vederile în Hive?

În Hive, vizualizările sunt similare cu tabelele. Sunt generate pe baza cerințelor.

Putem salva orice date de set de rezultate ca vizualizare în Hive
Utilizarea este similară cu vizualizările utilizate în SQL
Toate tipurile de operațiuni DML pot fi efectuate pe o vizualizare

23) Explicați cum Hive deserializează și serializează datele?

De obicei, în timp ce citește/scrie datele, utilizatorul comunică mai întâi cu formatul de intrare. Apoi se conectează cu cititorul de înregistrări pentru a citi/scrie înregistrarea. Pentru a serializa datele, datele merg pe rând. Aici serde personalizat deserializat folosește inspectorul de obiecte pentru a deserializa datele din câmpuri.

24) Ce este Buckets in Hive?

Datele prezente în partiții pot fi împărțite în continuare în Buckets
Împărțirea se efectuează pe baza hash-ului anumitor coloane care este selectată în tabel.

25) În Hive, cum puteți activa gălețile?

În Hive, puteți activa găleți folosind următoarea comandă,

set.hive.enforce.bucketing=true;

26) În Hive, puteți suprascrie configurația Hadoop MapReduce în Hive?

Da, puteți suprascrie configurația Hadoop MapReduce în Hive.

27) Explicați cum puteți schimba un tip de date de coloană în Hive?

Puteți schimba un tip de date de coloană în Hive utilizând comanda,

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Menționați care este diferența dintre ordonarea și sortarea în Hive?

SORT BY va sorta datele din fiecare reductor. Puteți utiliza orice număr de reductoare pentru operarea SORT BY.
ORDER BY va sorta toate datele împreună, care trebuie să treacă printr-un reductor. Astfel, ORDER BY în stup folosește un singur

29) Explicați când să folosiți explode în Hive?

Dezvoltatorii Hadoop iau uneori un mulțime ca intrare și convertiți într-un rând separat de tabel. Pentru a converti tipurile de date complexe în formatele de tabel dorite, Hive folosește explode.

30) Menționați cum puteți opri interogarea unui formular de partiție?

Puteți opri interogarea unui formular de partiție folosind clauza ENABLE OFFLINE cu instrucțiunea ALTER TABLE.

Aceste întrebări de interviu vă vor ajuta, de asemenea, în viva (orale). Consultați-ne Tutoriale Hive pentru un plus în plus în interviul tău.

S-ar putea sa-ti placa:

4 Comentarii

Este foarte util……..util……..util pentru pregătirea interviului, precum și pentru auto-pregătirea.

răspuns

Multumesc! Este foarte util!

Cred că puteți adăuga câteva întrebări despre „deformarea datelor”, pentru că de obicei mi s-a cerut să răspund la aceste întrebări când eram intervievator.