30 populaarseimat Taru intervjuu küsimust ja vastust (2025)

Taruintervjuu küsimused värsketele ja kogenud inimestele

Siin on Taru intervjuu küsimused ja vastused nii värsketele kui ka kogenud kandidaatidele unistuste töökoha saamiseks.

Tasuta PDF-i allalaadimine: taruintervjuu küsimused


1) Selgitage, mis on taru?

Hive on ETL-i ja andmehoidla tööriist, mis on välja töötatud Hadoopi hajutatud failisüsteemi (HDFS) peal. See on andmehoidla raamistik HDFS-is salvestatud andmete päringute tegemiseks ja analüüsimiseks. Hive on avatud lähtekoodiga tarkvara, mis võimaldab programmeerijatel analüüsida suuri andmekogumeid hadoop.


2) Millal taru kasutada?

  • Taru on valmistamisel kasulik andmekogus rakendused
  • Kui tegelete dünaamiliste andmete asemel staatiliste andmetega
  • Kui rakendusel on kõrge latentsusaeg (kõrge reageerimisaeg)
  • Kui säilitatakse suur andmekogum
  • Kui kasutame skriptimise asemel päringuid

3) Nimetage, millised on taru erinevad režiimid?

Sõltuvalt Hadoopi andmesõlmede suurusest saab Hive töötada kahes režiimis. Need režiimid on

  • Kohalik režiim
  • Kaardi vähendamise režiim

4) Mainige, millal kasutada kaardi vähendamise režiimi?

Kaardi vähendamise režiimi kasutatakse, kui

  • See toimib suure hulga andmekogumite ja päringutega, mida täidetakse paralleelselt
  • Hadoopil on mitu andmesõlme ja andmed jaotatakse erinevates sõlmedes, mida me selles režiimis kasutame Hive'is
  • Tuleb saavutada parema jõudlusega suurte andmekogumite töötlemine

5) Mainige Hive Arhitektuuri põhikomponente?

Hive Architecture'i põhikomponendid hõlmavad järgmist:

  • Kasutajaliides
  • Kompilaator
  • Metastore
  • juht
  • Käivitage mootor
Taruintervjuu küsimused
Taruintervjuu küsimused

6) Nimetage, millised on Taru erinevat tüüpi tabelid?

Tarus on saadaval kahte tüüpi tabeleid.

  • Hallatud tabel: hallatavas tabelis on nii andmed kui ka skeem Hive'i kontrolli all
  • Väline laud: Välistabelis on Hive'i kontrolli all ainult skeem.

7) Selgitage, mis on taru Metastore?

Metastore on Hive'i keskne hoidla. Seda kasutatakse skeemiteabe või metaandmete salvestamiseks välisesse andmebaasi.


8) Mainige, millest Hive koosneb?

Taru koosneb 3 põhiosast,

  1. Taru kliendid
  2. Taruteenused
  3. Taru ladustamine ja andmetöötlus

9) Mainige, millist tüüpi andmebaase Hive toetab?

Ühe kasutaja metaandmete salvestamiseks kasutab Hive Derby andmebaasi ja mitme kasutaja jaoks metaandmeid või jagatud metaandmete juhtumit Hive kasutab MySQL.


10) Mainige Taru vaikimisi lugemise ja kirjutamise klasse?

Taru vaikimisi lugemis- ja kirjutamisklassid on

  1. TextInputFormat/HiveIgnoreKeyTextOutputFormat
  2. SequenceFileInputFormat/SequenceFileOutputFormat

11) Mis on Hive'is indekseerimine?

Taru indekseerimine on päringu optimeerimise tehnika, mis parandab päringu otsimise kiirust tabeli teatud veergudes.


12) Miks Hive ei sobi OLTP-süsteemide jaoks?

Taru ei sobi OLTP-süsteemide jaoks, kuna see ei paku rea tasemel sisestamise ja värskendamise funktsiooni.


13) Mainige, mis vahe on Hbase'il ja Hive'il?

Erinevus Hbase ja Hive vahel on

  • Taru võimaldab enamikku SQL päringuid, kuid HBase ei luba SQL-päringuid
  • Taru ei toeta tabelis kirjetaseme sisestamise, värskendamise ja kustutamise toiminguid
  • Hive on andmelao raamistik, samas kui HBase on NoSQL-i andmebaas
  • Hive töötab MapReduce'i ülaosas, HBase töötab HDFS-i ülaosas

14) Selgitage, mis on Hive muutuja? Milleks me seda kasutame?

Hive muutuja luuakse Hive keskkonnas, millele saab Hive skripte viidata. Seda kasutatakse teatud väärtuste edastamiseks tarupäringutele, kui päring hakkab täitma.


15) Mainige, mis on Taru ObjectInspectori funktsioon?

Taru ObjectInspectori funktsioone kasutatakse veergude, ridade ja keerukate objektide sisemise struktuuri analüüsimiseks. See võimaldab juurdepääsu objektide sisemistele väljadele.


16) Mainige, mis on (HS2) HiveServer2?

See on serveriliides, mis täidab järgmisi funktsioone.

  • See võimaldab kaugklientidel täita päringuid Hive'i vastu
  • Tooge mainitud päringute tulemused

Mõned täiustatud funktsioonid, mis põhinevad selle uusimas versioonis Thrift RPC-l

  • Mitme kliendi samaaegsus
  • Autentimine

17) Mainige, mida Hive päringuprotsessor teeb?

Taru päringuprotsessor teisendab MapReduce'i tööde graafiku täitmisaja raamistikuga. Et töid saaks täita sõltuvuste järjekorras.


18) Nimetage, millised on Hive päringuprotsessori komponendid?

Hive päringuprotsessori komponendid hõlmavad järgmist:

  • Loogilise plaani loomine
  • Füüsilise plaani loomine
  • Täitmismootor
  • Ettevõtjad
  • UDF-id ja UDAF-id
  • Optimeerija
  • Parser
  • Semantiline analüsaator
  • Tüübi kontrollimine

19) Mainige, mis on taru vaheseinad?

Taru korraldab tabelid vaheseinteks.

  • See on üks viise tabelite jagamiseks erinevateks osadeks partitsioonivõtmete alusel.
  • Partition on abiks siis, kui tabelis on üks või mitu partitsioonivõtit.
  • Sektsioonivõtmed on põhielemendid andmete tabelis salvestamise määramiseks.

20) Märkige, millal valida tarus "Sisemine tabel" ja "Väline tabel"?

Tarus saate valida sisemise tabeli,

  • Kui töötlemisandmed on saadaval kohalikus failisüsteemis
  • Kui tahame, et Hive haldaks andmete kogu elutsüklit, sealhulgas kustutamist

Saate valida välise tabeli,

  • Kui töödeldakse HDFS-is saadaolevaid andmeid
  • Kasulik, kui faile kasutatakse väljaspool Hive'i

21) Mainige, kas saame vaate nimetada samaks kui taru tabeli nimi?

Ei. Vaate nimi peab olema ainulaadne võrreldes kõigi teiste samas andmebaasis olevate tabelitega ja vaadetega.


22) Mainige, mis on Taru vaated?

Tarus on vaated sarnased tabelitega. Need luuakse nõuete alusel.

  • Saame kõik tulemuskomplekti andmed Taru vaatena salvestada
  • Kasutus on sarnane SQL-is kasutatavatele vaadetele
  • Vaatega saab teha igat tüüpi DML-operatsioone

23) Selgitage, kuidas Hive andmeid deserialiseerib ja järjestab?

Tavaliselt suhtleb kasutaja andmete lugemise/kirjutamise ajal esmalt sisendvorminguga. Seejärel ühendub see kirje lugemiseks/kirjutamiseks salvestuslugejaga. Andmete järjestamiseks lähevad andmed reale. Siin deserialiseeritud kohandatud serde kasutab objektide inspektorit väljade andmete deserialiseerimiseks.


24) Mis on Buckets in Hive?

  • Sektsioonides olevad andmed saab jagada edasi ämbriteks
  • Jagamine toimub tabelis valitud konkreetsete veergude räsi alusel.

25) Kuidas saate Hive'is ämbrid lubada?

Tarus saate ämbrid lubada, kasutades järgmist käsku:

set.hive.enforce.bucketing=true;

26) Kas saate Hive'is Hadoop MapReduce'i konfiguratsiooni Hive'is üle kirjutada?

Jah, saate Hadoop MapReduce'i konfiguratsiooni Hive'is üle kirjutada.


27) Selgitage, kuidas saate Hive'is veeru andmetüüpi muuta?

Veeru andmetüüpi saate Hive'is muuta käsuga,

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Mainige, mis vahe on Taru järjestuse ja sortimise vahel?

  • SORT BY sorteerib andmed igas reduktoris. Funktsiooni SORT BY jaoks saate kasutada mis tahes arvu reduktoreid.
  • ORDER BY sorteerib kõik andmed kokku, mis peavad läbima ühe redutseerija. Seega kasutab ORDER BY tarus singlit

29) Selgitage, millal kasutada tarus explode'i?

Hadoopi arendajad võtavad mõnikord an massiivi sisendiks ja teisendada eraldi tabelireale. Keeruliste andmetüüpide teisendamiseks soovitud tabelivormingutesse kasutage Hive'i plahvatust.


30) Mainige, kuidas saate partitsioonivormi päringu peatada?

Saate peatada partitsioonivormi päringu, kasutades lauset ENABLE OFFLINE koos lausega ALTER TABLE.

Need intervjuu küsimused aitavad ka teie viva (orals) puhul. Vaadake meie Taru õpetused oma intervjuus lisaeelise saamiseks.

Jaga

3 Kommentaarid

  1. Avatar Satyaranjan Singh ütleb:

    See on väga kasulik……………………………………………………………………………….

  2. Aitäh! See on väga abiks!

    Ma arvan, et võite lisada mõned küsimused "andmete kallutamise" kohta, sest tavaliselt paluti mul neile küsimustele vastata, kui olin intervjueerija.

    1. Avatar meenakshi ütleb:

      palun lisage intervjuu küsimused, mida olete küsinud

Jäta vastus

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on märgitud *