Nangungunang 30 Mga Tanong at Sagot sa Panayam sa Hive (2025)
Mga Tanong sa Panayam sa Hive para sa mga Fresher at Nakaranas
Narito ang mga tanong at sagot sa panayam ng Hive para sa mga fresher pati na rin sa mga nakaranasang kandidato upang makuha ang kanilang pangarap na trabaho.
Libreng PDF Download: Hive Interview Questions
1) Ipaliwanag kung ano ang Hive?
Ang Hive ay isang ETL at Data warehousing tool na binuo sa ibabaw ng Hadoop Distributed File System (HDFS). Ito ay isang balangkas ng data warehouse para sa pagtatanong at pagsusuri ng data na nakaimbak sa HDFS. Ang Hive ay isang open-source-software na nagbibigay-daan sa mga programmer na suriin ang malalaking set ng data Hadoop.
2) Kailan gagamitin ang Hive?
- Ang pugad ay kapaki-pakinabang kapag gumagawa data bodega mga application
- Kapag nakikipag-usap ka sa static na data sa halip na sa dynamic na data
- Kapag ang application ay nasa mataas na latency (mataas na oras ng pagtugon)
- Kapag ang isang malaking set ng data ay pinananatili
- Kapag gumagamit kami ng mga query sa halip na scripting
3) Banggitin kung ano ang iba't ibang mga mode ng Hive?
Depende sa laki ng mga node ng data sa Hadoop, maaaring gumana ang Hive sa dalawang mode. Ang mga mode na ito ay,
- Lokal na mode
- Mapa reduce mode
4) Banggitin kung kailan gagamitin ang Map reduce mode?
Ginagamit ang map reduce mode kapag,
- Ito ay gaganap sa malaking halaga ng mga set ng data at query na isasagawa sa parallel na paraan
- Ang Hadoop ay may maraming data node, at ang data ay ipinamamahagi sa iba't ibang node na ginagamit namin sa Hive sa mode na ito
- Ang pagproseso ng malalaking set ng data na may mas mahusay na pagganap ay kailangang makamit
5) Banggitin ang mga pangunahing bahagi ng Arkitektura ng Hive?
Kabilang sa mga pangunahing bahagi ng Hive Architecture,
- User Interface
- tagatala
- Metastore
- Drayber
- Ipatupad ang Engine
6) Banggitin kung ano ang iba't ibang uri ng mga talahanayan na magagamit sa Hive?
Mayroong dalawang uri ng mga talahanayan na magagamit sa Hive.
- Pinamamahalaang talahanayan: Sa pinamamahalaang talahanayan, parehong nasa ilalim ng kontrol ng Hive ang data at schema
- Panlabas na mesa: Sa panlabas na talahanayan, tanging ang schema ang nasa ilalim ng kontrol ng Hive.
7) Ipaliwanag kung ano ang Metastore sa Hive?
Ang Metastore ay isang sentral na imbakan sa Hive. Ginagamit ito para sa pag-iimbak ng impormasyon ng schema o metadata sa panlabas na database.
8) Banggitin kung ano ang binubuo ng Hive?
Ang pugad ay binubuo ng 3 pangunahing bahagi,
- Mga Kliyente sa Hive
- Mga Serbisyo sa Hive
- Imbakan at Pag-compute ng Hive
9) Banggitin kung ano ang uri ng database na sinusuportahan ng Hive?
Para sa imbakan ng metadata ng solong user, gumagamit ang Hive ng derby database at para sa maramihang user Metadata o shared Metadata case na ginagamit ng Hive MYSQL.
10) Banggitin ang mga default na klase sa pagbasa at pagsulat ng Hive?
Ang mga default na klase sa pagbasa at pagsulat ng hive ay
- TextInputFormat/HiveIgnoreKeyTextOutputFormat
- SequenceFileInputFormat/SequenceFileOutputFormat
11) Ano ang pag-index sa Hive?
Ang pag-index ng hive ay isang diskarte sa pag-optimize ng query upang mapabuti ang bilis ng paghahanap ng query sa ilang mga column ng isang talahanayan.
12) Bakit hindi angkop ang Hive para sa mga OLTP system?
Hindi angkop ang Hive para sa mga OLTP system dahil hindi ito nagbibigay ng insert at update function sa row level.
13) Banggitin kung ano ang pagkakaiba sa pagitan ng Hbase at Hive?
Ang pagkakaiba sa pagitan ng Hbase at Hive ay,
- Pinapagana ng Hive ang karamihan sa SQL mga query, ngunit hindi pinapayagan ng HBase ang mga query sa SQL
- Hindi sinusuportahan ng Hive ang mga operasyon sa pagpasok, pag-update, at pagtanggal ng antas ng record sa talahanayan
- Ang Hive ay isang data warehouse framework samantalang ang HBase ay NoSQL database
- Hive run sa tuktok ng MapReduce, tumatakbo ang HBase sa tuktok ng HDFS
14) Ipaliwanag kung ano ang variable ng Hive? Para saan natin ito ginagamit?
Ang variable ng Hive ay nilikha sa kapaligiran ng Hive na maaaring i-reference ng mga script ng Hive. Ito ay ginagamit upang ipasa ang ilang mga halaga sa mga query sa hive kapag nagsimulang isagawa ang query.
15) Banggitin kung ano ang pag-andar ng ObjectInspector sa Hive?
Ang functionality ng ObjectInspector sa Hive ay ginagamit upang suriin ang panloob na istraktura ng mga column, row, at kumplikadong mga bagay. Pinapayagan nitong ma-access ang mga panloob na patlang sa loob ng mga bagay.
16) Banggitin kung ano ang (HS2) HiveServer2?
Ito ay isang interface ng server na gumaganap ng mga sumusunod na function.
- Pinapayagan nito ang mga malalayong kliyente na magsagawa ng mga query laban sa Hive
- Kunin ang mga resulta ng nabanggit na mga query
Kasama sa ilang advanced na feature Batay sa Thrift RPC sa pinakabagong bersyon nito
- Multi-client concurrency
- Pagpapatunay
17) Banggitin kung ano ang ginagawa ng processor ng query sa Hive?
Ang processor ng query sa Hive ay nagko-convert ng graph ng mga trabaho sa MapReduce gamit ang balangkas ng oras ng pagpapatupad. Upang ang mga trabaho ay maisakatuparan sa pagkakasunud-sunod ng mga dependency.
18) Banggitin kung ano ang mga bahagi ng isang processor ng query sa Hive?
Ang mga bahagi ng isang processor ng query sa Hive ay kinabibilangan ng,
- Pagbuo ng Lohikal na Plano
- Pagbuo ng Pisikal na Plano
- Engine ng Pagpapatupad
- Operator
- Mga UDF at UDAF
- Optimizer
- Parser
- Semantic Analyzer
- Pagsusuri ng Uri
19) Banggitin kung ano ang Partitions in Hive?
Inaayos ng Hive ang mga talahanayan sa mga partisyon.
- Ito ay isa sa mga paraan ng paghahati ng mga talahanayan sa iba't ibang bahagi batay sa mga partition key.
- Nakakatulong ang partition kapag ang talahanayan ay may isa o higit pang Partition key.
- Ang mga partition key ay mga pangunahing elemento para sa pagtukoy kung paano iniimbak ang data sa talahanayan.
20) Banggitin kung kailan pipiliin ang "Internal Table" at "External Table" sa Hive?
Sa Hive maaari kang pumili ng panloob na talahanayan,
- Kung ang pagproseso ng data ay magagamit sa lokal na file system
- Kung gusto naming pamahalaan ni Hive ang kumpletong lifecycle ng data kasama ang pagtanggal
Maaari kang pumili ng Panlabas na talahanayan,
- Kung available ang pagproseso ng data sa HDFS
- Kapaki-pakinabang kapag ang mga file ay ginagamit sa labas ng Hive
21) Banggitin kung maaari nating pangalanan ang view na katulad ng pangalan ng talahanayan ng Hive?
Hindi. Ang pangalan ng isang view ay dapat na natatangi kumpara sa lahat ng iba pang mga talahanayan at bilang mga view na nasa parehong database.
22) Banggitin kung ano ang mga pananaw sa Hive?
Sa Hive, Ang mga View ay Katulad sa mga talahanayan. Ang mga ito ay nabuo batay sa mga kinakailangan.
- Maaari naming i-save ang anumang data ng set ng resulta bilang isang view sa Hive
- Ang paggamit ay katulad ng mga view na ginamit sa SQL
- Lahat ng uri ng pagpapatakbo ng DML ay maaaring isagawa sa isang view
23) Ipaliwanag kung paano Deserialize at serialize ng Hive ang data?
Karaniwan, habang binabasa/isinulat ang data, ang gumagamit ay unang nakikipag-usap sa inputformat. Pagkatapos ay kumokonekta ito sa Record reader para basahin/isulat ang record. Upang i-serialize ang data, mapupunta ang data sa row. Dito ang deserialized custom serde ay gumagamit ng object inspector upang deserialize ang data sa mga field.
24) Ano ang Bucket in Hive?
- Ang data na naroroon sa mga partisyon ay maaaring hatiin pa sa mga Bucket
- Isinasagawa ang paghahati batay sa Hash ng mga partikular na column na pinili sa talahanayan.
25) Sa Hive, paano mo mapagana ang mga bucket?
Sa Hive, maaari mong paganahin ang mga bucket sa pamamagitan ng paggamit ng sumusunod na command,
set.hive.enforce.bucketing=true;
26) Sa Hive, maaari mo bang i-overwrite ang Hadoop MapReduce configuration sa Hive?
Oo, maaari mong i-overwrite ang configuration ng Hadoop MapReduce sa Hive.
27) Ipaliwanag kung paano mo mababago ang isang uri ng data ng column sa Hive?
Maaari mong baguhin ang uri ng data ng column sa Hive sa pamamagitan ng paggamit ng command,
ALTER TABLE table_name CHANGE column_name column_name new_datatype;
28) Banggitin kung ano ang pagkakaiba sa pagitan ng pagkakasunud-sunod ayon sa at pag-uuri ayon sa Hive?
- Ang SORT BY ay pagbukud-bukurin ang data sa loob ng bawat reducer. Maaari mong gamitin ang anumang bilang ng mga reducer para sa SORT BY operation.
- Ang ORDER BY ay pag-uuri-uriin ang lahat ng data nang sama-sama, na kailangang dumaan sa isang reducer. Kaya, ang ORDER BY sa pugad ay gumagamit ng isang solong
29) Ipaliwanag kung kailan gagamitin ang explode sa Hive?
Ang mga developer ng Hadoop kung minsan ay kumukuha ng isang ayos bilang input at i-convert sa isang hiwalay na hilera ng talahanayan. Para i-convert ang mga kumplikadong uri ng data sa gustong mga format ng talahanayan, gumamit ng explode ang Hive.
30) Banggitin kung paano mo mapipigilan ang pagtatanong ng partition form?
Maaari mong ihinto ang pag-query ng partition form sa pamamagitan ng paggamit ng ENBLE OFFLINE clause na may ALTER TABLE na pahayag.
Ang mga tanong sa panayam na ito ay makakatulong din sa iyong viva(orals). Sumangguni sa aming Mga Tutorial sa Hive para sa dagdag na kalamangan sa iyong panayam.
Ito ay napaka-kapaki-pakinabangโฆโฆ..kapaki-pakinabangโฆโฆ..kapaki-pakinabang para sa paghahanda sa pakikipanayam pati na rin sa paghahanda sa sarili.
Salamat! Napakalaking tulong nito!
Sa tingin ko, maaari kang magdagdag ng ilang mga katanungan tungkol sa "data skew", dahil kadalasan ay hinihiling sa akin na sagutin ang mga tanong na ito noong ako ay isang tagapanayam.
mangyaring magdagdag ng mga tanong sa panayam, na iyong itinanong