30 parasta Hive-haastattelun kysymystä ja vastausta (2025)

Hive-haastattelukysymyksiä uusille ja kokeneille

Tässä on Hiven haastattelukysymyksiä ja vastauksia niin fuksilaisille kuin kokeneille hakijoille unelmatyönsä saamiseksi.

Ilmainen PDF-lataus: Hive-haastattelukysymykset

1) Selitä mikä on Hive?

Hive on ETL- ja tietovarastotyökalu, joka on kehitetty Hadoop Distributed File Systemin (HDFS) päälle. Se on tietovarastokehys HDFS:ään tallennettujen tietojen kyselyyn ja analysointiin. Hive on avoimen lähdekoodin ohjelmisto, jonka avulla ohjelmoijat voivat analysoida suuria tietojoukkoja Hadoop.

2) Milloin Hivea käytetään?

Hive on hyödyllinen valmistuksessa tietovarasto sovellukset
Kun käsittelet staattista dataa dynaamisen tiedon sijaan
Kun sovellus on korkealla latenssilla (korkea vasteaika)
Kun ylläpidetään suurta tietojoukkoa
Kun käytämme kyselyitä komentosarjan sijaan

3) Mainitse mitkä ovat Hiven eri tilat?

Hadoopin datasolmujen koosta riippuen Hive voi toimia kahdessa tilassa. Nämä tilat ovat,

Paikallinen tila
Kartan pienennystila

4) Mainitse milloin kartan pienennystilaa tulee käyttää?

Kartan pienennystilaa käytetään, kun

Se suorittaa suuria määriä tietojoukkoja ja kyselyitä suoritetaan rinnakkain
Hadoopilla on useita datasolmuja, ja tiedot jaetaan eri solmuihin, joita käytämme Hivea tässä tilassa
On saavutettava suurempien tietojoukkojen käsittely tehokkaammin

5) Mainitse Hive-arkkitehtuurin avainkomponentit?

Hive Architecturen avainkomponentteja ovat mm.

Käyttöliittymä
kääntäjä
Metastore
kuljettaja
Suorita moottori

6) Mainitse mitä erilaisia pöytiä Hivessa on saatavilla?

Hivessa on saatavilla kahden tyyppisiä pöytiä.

Hallittu pöytä: Hallitussa taulukossa sekä tiedot että skeema ovat Hiven hallinnassa
Ulkoinen pöytä: Ulkoisessa taulukossa vain skeema on Hiven hallinnassa.

7) Selitä mikä on Metastore in Hive?

Metastore on Hiven keskusvarasto. Sitä käytetään skeematietojen tai metatietojen tallentamiseen ulkoiseen tietokantaan.

8) Mainitse mistä Hive koostuu?

Pesä koostuu 3 pääosasta,

Hive asiakkaat
Hive-palvelut
Hive varastointi ja tietojenkäsittely

9) Mainitse minkä tyyppisiä tietokantoja Hive tukee?

Yhden käyttäjän metatietojen tallentamiseen Hive käyttää derby-tietokantaa ja useiden käyttäjien metadataa tai jaettua metatietotapausta Hive käyttää MySQL.

10) Mainitse Hiven oletusarvoiset luku- ja kirjoituskurssit?

Hiven oletusarvoiset luku- ja kirjoitusluokat ovat

TextInputFormat/HiveIgnoreKeyTextOutputFormat
SequenceFileInputFormat/SequenceFileOutputFormat

11) Mitä on indeksointi Hivessa?

Hive-indeksointi on kyselyn optimointitekniikka, joka parantaa kyselyn hakunopeutta taulukon tietyissä sarakkeissa.

12) Miksi Hive ei sovellu OLTP-järjestelmille?

Hive ei sovellu OLTP-järjestelmiin, koska se ei tarjoa lisäys- ja päivitystoimintoa rivitasolla.

13) Mainitse mitä eroa on Hbasen ja Hiven välillä?

Ero Hbasen ja Hiven välillä on,

Hive mahdollistaa suurimman osan SQL kyselyitä, mutta HBase ei salli SQL-kyselyjä
Hive ei tue tietuetason lisäys-, päivitys- ja poistotoimintoja taulukossa
Hive on tietovarastokehys, kun taas HBase on NoSQL-tietokanta
Hive toimii MapReducen päällä, HBase toimii HDFS:n päällä

14) Selitä mikä on Hive-muuttuja? Mihin käytämme sitä?

Hive-muuttuja luodaan Hive-ympäristöön, johon Hive-skriptit voivat viitata. Sitä käytetään joidenkin arvojen välittämiseen pesäkyselyihin, kun kysely alkaa suorittaa.

15) Mainitse mikä on ObjectInspector-toiminto Hivessa?

Hiven ObjectInspector-toimintoa käytetään sarakkeiden, rivien ja monimutkaisten objektien sisäisen rakenteen analysointiin. Se mahdollistaa pääsyn esineiden sisäisiin kenttiin.

16) Mainitse mikä on (HS2) HiveServer2?

Se on palvelinliitäntä, joka suorittaa seuraavat toiminnot.

Sen avulla etäasiakkaat voivat suorittaa kyselyitä Hiveen
Hae mainittujen kyselyiden tulokset

Joitakin edistyneitä ominaisuuksia, jotka perustuvat viimeisimmän versionsa Thrift RPC:hen

Usean asiakkaan samanaikaisuus
Authentication

17) Mainitse mitä Hive-kyselyprosessori tekee?

Hive-kyselyprosessori muuntaa MapReduce-töiden kaavion suoritusaikakehyksen avulla. Jotta työt voidaan suorittaa riippuvuusjärjestyksessä.

18) Mainitse mitkä ovat Hive-kyselyprosessorin komponentit?

Hive-kyselyprosessorin komponentteja ovat mm.

Loogisen suunnitelman luominen
Fyysisen suunnitelman luominen
Suoritusmoottori
Operaattorit
UDF:t ja UDAF:t
Optimizer
jäsennin
Semanttinen analysaattori
Tyypin tarkistus

19) Mainitse mikä on Partitions in Hive?

Hive järjestää taulukot osioihin.

Se on yksi tavoista jakaa taulukot eri osiin osioavainten perusteella.
Osio on hyödyllinen, kun taulukossa on yksi tai useampia osioavaimia.
Osioavaimet ovat peruselementtejä määritettäessä, kuinka tiedot tallennetaan taulukkoon.

20) Mainitse milloin Hivessa tulee valita "sisäinen taulukko" ja "ulkoinen taulukko"?

Hivessa voit valita sisäisen taulukon,

Jos käsittelytiedot ovat saatavilla paikallisessa tiedostojärjestelmässä
Jos haluamme Hiven hallitsevan tietojen koko elinkaarta, mukaan lukien poistaminen

Voit valita ulkoisen pöydän,

Jos käsitellään HDFS:ssä saatavilla olevia tietoja
Hyödyllinen, kun tiedostoja käytetään Hiven ulkopuolella

21) Mainitse, voimmeko nimetä näkymän saman kuin Hive-taulukon nimen?

Ei. Näkymän nimen on oltava ainutlaatuinen verrattuna kaikkiin muihin samassa tietokannassa oleviin taulukoihin ja näkymiin.

22) Mainitse mitä näkymät ovat Hivessa?

Hivessä näkymät ovat samanlaisia kuin taulukot. Ne luodaan vaatimusten perusteella.

Voimme tallentaa minkä tahansa tulosjoukon tiedot näkymänä Hiveen
Käyttö on samanlaista kuin SQL:ssä käytetyt näkymät
Näkymille voidaan suorittaa kaikenlaisia DML-toimintoja

23) Selitä, kuinka Hive sarjoittaa ja sarjoittaa tiedot?

Yleensä kun käyttäjä lukee/kirjoittaa tietoja, hän kommunikoi ensin syöttömuodon kanssa. Sitten se muodostaa yhteyden Record-lukijaan tallenteen lukemista/kirjoittamista varten. Tietojen sarjoittamiseksi tiedot menevät riville. Tässä deserialisoitu mukautettu serde käyttää objektitarkistusohjelmaa kenttien tietojen sarjoittamiseen.

24) Mikä on Buckets in Hive?

Osioissa olevat tiedot voidaan jakaa edelleen kauhoihin
Jako suoritetaan taulukosta valittujen tiettyjen sarakkeiden hajautusarvon perusteella.

25) Kuinka voit ottaa ämpärit käyttöön Hivessa?

Hivessa voit ottaa ämpäri käyttöön käyttämällä seuraavaa komentoa,

set.hive.enforce.bucketing=true;

26) Voitko Hivessä korvata Hadoop MapReduce -määritykset Hivessä?

Kyllä, voit korvata Hadoop MapReduce -määritykset Hivessa.

27) Selitä, kuinka voit muuttaa sarakkeen tietotyyppiä Hivessa?

Voit muuttaa Hiven sarakkeen tietotyyppiä komennolla,

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Mainitse mitä eroa on Hiven järjestyksen ja lajittelun välillä?

SORT BY lajittelee tiedot kunkin pienentimen sisällä. Voit käyttää SORT BY -toimintoon mitä tahansa vähennyksiä.
ORDER BY lajittelee kaikki tiedot yhteen, jonka täytyy kulkea yhden supistimen läpi. Siten ORDER BY pesässä käyttää yhtä

29) Selitä, milloin explodea käytetään Hivessa?

Hadoop-kehittäjät ottavat joskus ryhmä syötteenä ja muuntaa erilliseksi taulukon riviksi. Jos haluat muuntaa monimutkaisia tietotyyppejä haluttuihin taulukkomuotoihin, käytä Hiven räjähdystä.

30) Mainitse kuinka voit estää osiolomakkeen kyselyn?

Voit lopettaa osiolomakkeen kyselyn käyttämällä ENABLE OFFLINE -lausetta ALTER TABLE -käskyn kanssa.

Nämä haastattelukysymykset auttavat myös viva-asioissasi. Katso meidän Hive opetusohjelmat saadaksesi lisäedun haastattelussasi.

Saatat tykätä:

3 Kommentit

Se on erittäin hyödyllistä…………………………………………………………………………………………………………………………………………………………………………………….

vastata

Kiitos! Se on erittäin hyödyllistä!

Luulen, että voit lisätä kysymyksiä "tietojen vääristymisestä", koska minua pyydettiin yleensä vastaamaan näihin kysymyksiin haastattelijana.