30 parasta Hive-haastattelun kysymystä ja vastausta (2025)
Hive-haastattelukysymyksiä uusille ja kokeneille
Tässä on Hiven haastattelukysymyksiä ja vastauksia niin fuksilaisille kuin kokeneille hakijoille unelmatyönsä saamiseksi.
Ilmainen PDF-lataus: Hive-haastattelukysymykset
1) Selitä mikä on Hive?
Hive on ETL- ja tietovarastotyökalu, joka on kehitetty Hadoop Distributed File Systemin (HDFS) päälle. Se on tietovarastokehys HDFS:ään tallennettujen tietojen kyselyyn ja analysointiin. Hive on avoimen lähdekoodin ohjelmisto, jonka avulla ohjelmoijat voivat analysoida suuria tietojoukkoja Hadoop.
2) Milloin Hivea käytetään?
- Hive on hyödyllinen valmistuksessa tietovarasto sovellukset
- Kun käsittelet staattista dataa dynaamisen tiedon sijaan
- Kun sovellus on korkealla latenssilla (korkea vasteaika)
- Kun ylläpidetään suurta tietojoukkoa
- Kun käytämme kyselyitä komentosarjan sijaan
3) Mainitse mitkä ovat Hiven eri tilat?
Hadoopin datasolmujen koosta riippuen Hive voi toimia kahdessa tilassa. Nämä tilat ovat,
- Paikallinen tila
- Kartan pienennystila
4) Mainitse milloin kartan pienennystilaa tulee käyttää?
Kartan pienennystilaa käytetään, kun
- Se suorittaa suuria määriä tietojoukkoja ja kyselyitä suoritetaan rinnakkain
- Hadoopilla on useita datasolmuja, ja tiedot jaetaan eri solmuihin, joita käytämme Hivea tässä tilassa
- On saavutettava suurempien tietojoukkojen käsittely tehokkaammin
5) Mainitse Hive-arkkitehtuurin avainkomponentit?
Hive Architecturen avainkomponentteja ovat mm.
- Käyttöliittymä
- kääntäjä
- Metastore
- kuljettaja
- Suorita moottori
6) Mainitse mitä erilaisia pöytiä Hivessa on saatavilla?
Hivessa on saatavilla kahden tyyppisiä pöytiä.
- Hallittu pöytä: Hallitussa taulukossa sekä tiedot että skeema ovat Hiven hallinnassa
- Ulkoinen pöytä: Ulkoisessa taulukossa vain skeema on Hiven hallinnassa.
7) Selitä mikä on Metastore in Hive?
Metastore on Hiven keskusvarasto. Sitä käytetään skeematietojen tai metatietojen tallentamiseen ulkoiseen tietokantaan.
8) Mainitse mistä Hive koostuu?
Pesä koostuu 3 pääosasta,
- Hive asiakkaat
- Hive-palvelut
- Hive varastointi ja tietojenkäsittely
9) Mainitse minkä tyyppisiä tietokantoja Hive tukee?
Yhden käyttäjän metatietojen tallentamiseen Hive käyttää derby-tietokantaa ja useiden käyttäjien metadataa tai jaettua metatietotapausta Hive käyttää MySQL.
10) Mainitse Hiven oletusarvoiset luku- ja kirjoituskurssit?
Hiven oletusarvoiset luku- ja kirjoitusluokat ovat
- TextInputFormat/HiveIgnoreKeyTextOutputFormat
- SequenceFileInputFormat/SequenceFileOutputFormat
11) Mitä on indeksointi Hivessa?
Hive-indeksointi on kyselyn optimointitekniikka, joka parantaa kyselyn hakunopeutta taulukon tietyissä sarakkeissa.
12) Miksi Hive ei sovellu OLTP-järjestelmille?
Hive ei sovellu OLTP-järjestelmiin, koska se ei tarjoa lisäys- ja päivitystoimintoa rivitasolla.
13) Mainitse mitä eroa on Hbasen ja Hiven välillä?
Ero Hbasen ja Hiven välillä on,
- Hive mahdollistaa suurimman osan SQL kyselyitä, mutta HBase ei salli SQL-kyselyjä
- Hive ei tue tietuetason lisäys-, päivitys- ja poistotoimintoja taulukossa
- Hive on tietovarastokehys, kun taas HBase on NoSQL-tietokanta
- Hive toimii MapReducen päällä, HBase toimii HDFS:n päällä
14) Selitä mikä on Hive-muuttuja? Mihin käytämme sitä?
Hive-muuttuja luodaan Hive-ympäristöön, johon Hive-skriptit voivat viitata. Sitä käytetään joidenkin arvojen välittämiseen pesäkyselyihin, kun kysely alkaa suorittaa.
15) Mainitse mikä on ObjectInspector-toiminto Hivessa?
Hiven ObjectInspector-toimintoa käytetään sarakkeiden, rivien ja monimutkaisten objektien sisäisen rakenteen analysointiin. Se mahdollistaa pääsyn esineiden sisäisiin kenttiin.
16) Mainitse mikä on (HS2) HiveServer2?
Se on palvelinliitäntä, joka suorittaa seuraavat toiminnot.
- Sen avulla etäasiakkaat voivat suorittaa kyselyitä Hiveen
- Hae mainittujen kyselyiden tulokset
Joitakin edistyneitä ominaisuuksia, jotka perustuvat viimeisimmän versionsa Thrift RPC:hen
- Usean asiakkaan samanaikaisuus
- Authentication
17) Mainitse mitä Hive-kyselyprosessori tekee?
Hive-kyselyprosessori muuntaa MapReduce-töiden kaavion suoritusaikakehyksen avulla. Jotta työt voidaan suorittaa riippuvuusjärjestyksessä.
18) Mainitse mitkä ovat Hive-kyselyprosessorin komponentit?
Hive-kyselyprosessorin komponentteja ovat mm.
- Loogisen suunnitelman luominen
- Fyysisen suunnitelman luominen
- Suoritusmoottori
- Operaattorit
- UDF:t ja UDAF:t
- Optimizer
- jäsennin
- Semanttinen analysaattori
- Tyypin tarkistus
19) Mainitse mikä on Partitions in Hive?
Hive järjestää taulukot osioihin.
- Se on yksi tavoista jakaa taulukot eri osiin osioavainten perusteella.
- Osio on hyödyllinen, kun taulukossa on yksi tai useampia osioavaimia.
- Osioavaimet ovat peruselementtejä määritettäessä, kuinka tiedot tallennetaan taulukkoon.
20) Mainitse milloin Hivessa tulee valita "sisäinen taulukko" ja "ulkoinen taulukko"?
Hivessa voit valita sisäisen taulukon,
- Jos käsittelytiedot ovat saatavilla paikallisessa tiedostojärjestelmässä
- Jos haluamme Hiven hallitsevan tietojen koko elinkaarta, mukaan lukien poistaminen
Voit valita ulkoisen pöydän,
- Jos käsitellään HDFS:ssä saatavilla olevia tietoja
- Hyödyllinen, kun tiedostoja käytetään Hiven ulkopuolella
21) Mainitse, voimmeko nimetä näkymän saman kuin Hive-taulukon nimen?
Ei. Näkymän nimen on oltava ainutlaatuinen verrattuna kaikkiin muihin samassa tietokannassa oleviin taulukoihin ja näkymiin.
22) Mainitse mitä näkymät ovat Hivessa?
Hivessä näkymät ovat samanlaisia kuin taulukot. Ne luodaan vaatimusten perusteella.
- Voimme tallentaa minkä tahansa tulosjoukon tiedot näkymänä Hiveen
- Käyttö on samanlaista kuin SQL:ssä käytetyt näkymät
- Näkymille voidaan suorittaa kaikenlaisia DML-toimintoja
23) Selitä, kuinka Hive sarjoittaa ja sarjoittaa tiedot?
Yleensä kun käyttäjä lukee/kirjoittaa tietoja, hän kommunikoi ensin syöttömuodon kanssa. Sitten se muodostaa yhteyden Record-lukijaan tallenteen lukemista/kirjoittamista varten. Tietojen sarjoittamiseksi tiedot menevät riville. Tässä deserialisoitu mukautettu serde käyttää objektitarkistusohjelmaa kenttien tietojen sarjoittamiseen.
24) Mikä on Buckets in Hive?
- Osioissa olevat tiedot voidaan jakaa edelleen kauhoihin
- Jako suoritetaan taulukosta valittujen tiettyjen sarakkeiden hajautusarvon perusteella.
25) Kuinka voit ottaa ämpärit käyttöön Hivessa?
Hivessa voit ottaa ämpäri käyttöön käyttämällä seuraavaa komentoa,
set.hive.enforce.bucketing=true;
26) Voitko Hivessä korvata Hadoop MapReduce -määritykset Hivessä?
Kyllä, voit korvata Hadoop MapReduce -määritykset Hivessa.
27) Selitä, kuinka voit muuttaa sarakkeen tietotyyppiä Hivessa?
Voit muuttaa Hiven sarakkeen tietotyyppiä komennolla,
ALTER TABLE table_name CHANGE column_name column_name new_datatype;
28) Mainitse mitä eroa on Hiven järjestyksen ja lajittelun välillä?
- SORT BY lajittelee tiedot kunkin pienentimen sisällä. Voit käyttää SORT BY -toimintoon mitä tahansa vähennyksiä.
- ORDER BY lajittelee kaikki tiedot yhteen, jonka täytyy kulkea yhden supistimen läpi. Siten ORDER BY pesässä käyttää yhtä
29) Selitä, milloin explodea käytetään Hivessa?
Hadoop-kehittäjät ottavat joskus ryhmä syötteenä ja muuntaa erilliseksi taulukon riviksi. Jos haluat muuntaa monimutkaisia tietotyyppejä haluttuihin taulukkomuotoihin, käytä Hiven räjähdystä.
30) Mainitse kuinka voit estää osiolomakkeen kyselyn?
Voit lopettaa osiolomakkeen kyselyn käyttämällä ENABLE OFFLINE -lausetta ALTER TABLE -käskyn kanssa.
Nämä haastattelukysymykset auttavat myös viva-asioissasi. Katso meidän Hive opetusohjelmat saadaksesi lisäedun haastattelussasi.
Se on erittäin hyödyllistä…………………………………………………………………………………………………………………………………………………………………………………….
Kiitos! Se on erittäin hyödyllistä!
Luulen, että voit lisätä kysymyksiä "tietojen vääristymisestä", koska minua pyydettiin yleensä vastaamaan näihin kysymyksiin haastattelijana.
lisää haastattelukysymykset, joita olet esittänyt