30 najpopularnijih pitanja i odgovora na intervjuu za Hive (2025.)
Pitanja za intervju za Hive za brucoše i iskusne
Ovdje su pitanja i odgovori za Hive intervju za brucoše, kao i za iskusne kandidate da dobiju posao iz snova.
Besplatno preuzimanje PDF-a: Hive Interview Questions
1) Objasnite što je Hive?
Hive je ETL i alat za skladištenje podataka razvijen na vrhu Hadoop distribuiranog datotečnog sustava (HDFS). To je okvir skladišta podataka za upite i analizu podataka koji su pohranjeni u HDFS-u. Hive je softver otvorenog koda koji programerima omogućuje analizu velikih skupova podataka Hadoop.
2) Kada koristiti Hive?
- Košnica je korisna pri izradi skladište podataka aplikacije
- Kada radite sa statičkim podacima umjesto s dinamičkim podacima
- Kada je aplikacija na visokoj latenciji (visoko vrijeme odziva)
- Kada se održava veliki skup podataka
- Kada koristimo upite umjesto skriptiranja
3) Navedite koji su različiti načini Hivea?
Ovisno o veličini podatkovnih čvorova u Hadoopu, Hive može raditi u dva načina. Ovi načini su,
- Lokalni način
- Način smanjivanja karte
4) Navedite kada koristiti način smanjivanja karte?
Način smanjenja karte koristi se kada,
- Djelovat će na velikoj količini skupova podataka i upit će se izvršavati na paralelan način
- Hadoop ima više podatkovnih čvorova, a podaci se distribuiraju po različitim čvorovima koje koristimo Hive u ovom načinu rada
- Potrebno je postići bolju izvedbu obrade velikih skupova podataka
5) Spomenite ključne komponente Hive Architecture?
Ključne komponente Hive Architecture uključuju,
- Korisničko sučelje
- kompajler
- Metastore
- vozač
- Izvrši motor
6) Navedite koje su različite vrste tablica dostupne u Hiveu?
U Hiveu su dostupne dvije vrste tablica.
- Upravljana tablica: U upravljanoj tablici i podaci i shema su pod kontrolom Hive-a
- Vanjski stol: U vanjskoj tablici samo je shema pod kontrolom Hive-a.
7) Objasnite što je Metastore u Hiveu?
Metastore je središnje spremište u Hiveu. Koristi se za pohranu informacija o shemi ili metapodataka u vanjsku bazu podataka.
8) Navedite od čega se sastoji košnica?
Košnica se sastoji od 3 glavna dijela,
- Hive Klijenti
- Usluge košnica
- Hive Storage and Computing
9) Navedite koju vrstu baze podataka podržava Hive?
Za pohranu metapodataka jednog korisnika, Hive koristi derby bazu podataka, a za slučaj metapodataka više korisnika ili zajedničkih metapodataka Hive koristi MySQL.
10) Spominjanje Hive zadanih klasa za čitanje i pisanje?
Hive zadane klase za čitanje i pisanje su
- TextInputFormat/HiveIgnoreKeyTextOutputFormat
- SequenceFileInputFormat/SequenceFileOutputFormat
11) Što je indeksiranje u Hiveu?
Hive indeksiranje je tehnika optimizacije upita za poboljšanje brzine traženja upita u određenim stupcima tablice.
12) Zašto Hive nije prikladan za OLTP sustave?
Košnica nije prikladna za OLTP sustave jer ne pruža funkciju umetanja i ažuriranja na razini retka.
13) Navedite koja je razlika između Hbase i Hive?
Razlika između Hbase i Hive je,
- Hive omogućuje većinu SQL upite, ali HBase ne dopušta SQL upite
- Košnica ne podržava operacije umetanja, ažuriranja i brisanja na razini zapisa na tablici
- Hive je okvir za skladište podataka dok je HBase NoSQL baza podataka
- Hive radi na vrhu MapReducea, HBase radi na vrhu HDFS-a
14) Objasnite što je Hive varijabla? Za što ga koristimo?
Varijabla Hive kreirana je u okruženju Hive na koju se mogu pozivati Hive skripte. Koristi se za prosljeđivanje nekih vrijednosti upitima košnice kada se upit počne izvršavati.
15) Navedite što je funkcija ObjectInspector u Hiveu?
Funkcionalnost ObjectInspector u Hiveu koristi se za analizu unutarnje strukture stupaca, redaka i složenih objekata. Omogućuje pristup unutarnjim poljima unutar objekata.
16) Navedite što je (HS2) HiveServer2?
To je poslužiteljsko sučelje koje obavlja sljedeće funkcije.
- Omogućuje udaljenim klijentima izvršavanje upita protiv Hivea
- Dohvaćanje rezultata navedenih upita
Neke napredne značajke temeljene na Thrift RPC u najnovijoj verziji uključuju
- Konkurentnost s više klijenata
- Ovjera
17) Navedite što Hive procesor upita radi?
Grafikon pretvaranja procesora upita Hive MapReduce poslova s vremenskim okvirom izvršenja. Tako da se poslovi mogu izvršavati prema redoslijedu ovisnosti.
18) Navedite koje su komponente Hive procesora upita?
Komponente Hive procesora upita uključuju,
- Generiranje logičnog plana
- Generacija prostornog plana
- Izvršni motor
- Operateri
- UDF-a i UDAF-a
- optimizaciju
- rastavljač
- Semantički analizator
- Provjera tipa
19) Navedite što su particije u košnici?
Hive organizira tablice u particije.
- To je jedan od načina dijeljenja tablica na različite dijelove na temelju particijskih ključeva.
- Particija je korisna kada tablica ima jedan ili više ključeva particije.
- Particijski ključevi su osnovni elementi za određivanje načina pohranjivanja podataka u tablici.
20) Navedite kada odabrati "Unutarnju tablicu" i "Vanjsku tablicu" u košnici?
U Hiveu možete odabrati internu tablicu,
- Ako su podaci za obradu dostupni u lokalnom datotečnom sustavu
- Ako želimo da Hive upravlja cijelim životnim ciklusom podataka uključujući brisanje
Možete odabrati vanjski stol,
- Ako se obrađuju podaci dostupni u HDFS-u
- Korisno kada se datoteke koriste izvan Hivea
21) Navedite možemo li pogled nazvati istim imenom Hive tablice?
Ne. Naziv pogleda mora biti jedinstven u usporedbi sa svim drugim tablicama i kao prikazi prisutni u istoj bazi podataka.
22) Navedite što su pogledi u košnici?
U Hiveu su pogledi slični tablicama. Generiraju se na temelju zahtjeva.
- Možemo spremiti bilo koji skup rezultata kao prikaz u Hive
- Upotreba je slična pogledima koji se koriste u SQL-u
- Na pogledu se mogu izvoditi sve vrste DML operacija
23) Objasnite kako Hive deserialize i serijalizira podatke?
Obično, dok čita/piše podatke, korisnik prvo komunicira s inputformatom. Zatim se povezuje s čitačem zapisa za čitanje/pisanje zapisa. Za serijalizaciju podataka, podaci idu u red. Ovdje deserijalizirani prilagođeni servisi koriste inspektor objekata za deserijalizaciju podataka u poljima.
24) Što su kante u košnici?
- Podaci prisutni u particijama mogu se dalje podijeliti u segmente
- Podjela se vrši na temelju Hasha pojedinih stupaca koji je odabran u tablici.
25) Kako u Hiveu možete omogućiti spremnike?
U Hiveu možete omogućiti spremnike pomoću sljedeće naredbe,
set.hive.enforce.bucketing=true;
26) U Hiveu, možete li prebrisati konfiguraciju Hadoop MapReduce u Hiveu?
Da, možete prebrisati Hadoop MapReduce konfiguraciju u Hiveu.
27) Objasnite kako možete promijeniti vrstu podataka stupca u Hive-u?
Možete promijeniti vrstu podataka stupca u Hive pomoću naredbe,
ALTER TABLE table_name CHANGE column_name column_name new_datatype;
28) Navedite koja je razlika između reda prema i sortiranja po u Hive-u?
- SORT BY sortira podatke unutar svakog reduktora. Za rad SORT BY možete koristiti bilo koji broj reduktora.
- ORDER BY će sortirati sve podatke zajedno, koji moraju proći kroz jedan reduktor. Dakle, ORDER BY u košnici koristi jedan
29) Objasnite kada koristiti explode u Hive-u?
Hadoop programeri ponekad uzimaju poredak kao ulaz i pretvoriti u zaseban red tablice. Za pretvaranje složenih tipova podataka u željene formate tablica, Hive upotrijebi eksplodiranje.
30) Navedite kako možete zaustaviti upite o particionom obrascu?
Možete zaustaviti upite particijskog obrasca korištenjem klauzule ENABLE OFFLINE s naredbom ALTER TABLE.
Ova pitanja za intervju također će vam pomoći u usmenom razgovoru. Obratite se našim Hive Tutorials za dodatnu prednost u vašem intervjuu.
Vrlo je korisno……..korisno……..korisno za pripremu intervjua, kao i za samopripremu.
Hvala! Vrlo je korisno!
Mislim da biste mogli dodati neka pitanja o "iskrivljenosti podataka", jer su me obično pitali da odgovorim na ta pitanja dok sam bio anketar.
dodajte pitanja za intervju koja ste postavili