Topp 30 Hive-intervjuspørsmål og -svar (2024)

Hive-intervjuspørsmål for ferskinger og erfarne

Her er Hive-intervjuspørsmål og svar for ferskinger så vel som erfarne kandidater for å få drømmejobben.

Gratis PDF-nedlasting: Hive-intervjuspørsmål


1) Forklar hva er Hive?

Hive er et ETL- og datavarehusverktøy utviklet på toppen av Hadoop Distributed File System (HDFS). Det er et datavarehus-rammeverk for spørring og analyse av data som er lagret i HDFS. Hive er en åpen kildekode-programvare som lar programmerere analysere store datasett på Hadoop.


2) Når skal man bruke Hive?

  • Hive er nyttig når du lager datalager søknader
  • Når du har å gjøre med statiske data i stedet for dynamiske data
  • Når applikasjonen har høy latens (høy responstid)
  • Når et stort datasett opprettholdes
  • Når vi bruker spørringer i stedet for skripting

3) Nevn hva er de forskjellige modusene til Hive?

Avhengig av størrelsen på datanoder i Hadoop, kan Hive operere i to moduser. Disse modusene er,

  • Lokal modus
  • Kartreduksjonsmodus

4) Nevn når du skal bruke kartreduksjonsmodus?

Kartreduksjonsmodus brukes når,

  • Den vil utføre på store mengder datasett og spørring kommer til å utføres på en parallell måte
  • Hadoop har flere datanoder, og data er fordelt på forskjellige noder vi bruker Hive i denne modusen
  • Behandling av store datasett med bedre ytelse må oppnås

5) Nevn nøkkelkomponenter i Hive Architecture?

Nøkkelkomponenter i Hive Architecture inkluderer,

  • Brukergrensesnitt
  • kompilatoren
  • Metastore
  • Driver
  • Kjør motor
Hive-intervjuspørsmål
Hive-intervjuspørsmål

6) Nevn hvilke typer bord som er tilgjengelige i Hive?

Det er to typer bord tilgjengelig i Hive.

  • Administrert bord: I administrert tabell er både data og skjema under kontroll av Hive
  • Utvendig bord: I den eksterne tabellen er det bare skjemaet som er under kontroll av Hive.

7) Forklar hva er Metastore i Hive?

Metastore er et sentralt depot i Hive. Den brukes til å lagre skjemainformasjon eller metadata i den eksterne databasen.


8) Nevn hva Hive består av?

Hive består av 3 hoveddeler,

  1. Hive-kunder
  2. Hive-tjenester
  3. Hive-lagring og databehandling

9) Nevn hva slags databaser Hive støtter?

For lagring av metadata for én bruker bruker Hive derbydatabase og for metadata for flere brukere eller delte metadatatilfeller bruker Hive MySQL.


10) Nevn Hive standard lese- og skriveklasser?

Hive standard lese- og skriveklasser er

  1. TextInputFormat/HiveIgnoreKeyTextOutputFormat
  2. SequenceFileInputFormat/SequenceFileOutputFormat

11) Hva er indeksering i Hive?

Hive-indeksering er en spørringsoptimaliseringsteknikk for å forbedre hastigheten på søkeoppslag på visse kolonner i en tabell.


12) Hvorfor er ikke Hive egnet for OLTP-systemer?

Hive er ikke egnet for OLTP-systemer fordi den ikke gir innsettings- og oppdateringsfunksjon på radnivå.


13) Nevn hva er forskjellen mellom Hbase og Hive?

Forskjellen mellom Hbase og Hive er,

  • Hive muliggjør det meste SQL spørringer, men HBase tillater ikke SQL-spørringer
  • Hive støtter ikke innsettings-, oppdaterings- og slettingsoperasjoner på tabellnivå på rekordnivå
  • Hive er et datavarehusrammeverk mens HBase er NoSQL-database
  • Hive kjører på toppen av MapReduce, HBase kjører på toppen av HDFS

14) Forklar hva en Hive-variabel er? Hva bruker vi det til?

Hive-variabelen opprettes i Hive-miljøet som kan refereres til av Hive-skript. Den brukes til å sende noen verdier til hive-spørringene når spørringen begynner å kjøre.


15) Nevn hva er ObjectInspector-funksjonalitet i Hive?

ObjectInspector-funksjonalitet i Hive brukes til å analysere den interne strukturen til kolonnene, radene og komplekse objekter. Den gir tilgang til de interne feltene inne i objektene.


16) Nevn hva er (HS2) HiveServer2?

Det er et servergrensesnitt som utfører følgende funksjoner.

  • Den lar eksterne klienter utføre spørringer mot Hive
  • Hent resultatene av nevnte søk

Noen avanserte funksjoner Basert på Thrift RPC i sin nyeste versjon inkluderer

  • Multiklient samtidighet
  • Autentisering

17) Nevn hva Hive spørringsprosessor gjør?

Hive spørringsprosessor konvertere graf over MapReduce-jobber med rammeverket for utførelsestid. Slik at jobbene kan utføres i rekkefølgen av avhengigheter.


18) Nevn hva er komponentene i en Hive-spørringsprosessor?

Komponentene til en Hive spørringsprosessor inkluderer,

  • Generering av logisk plan
  • Generering av fysisk plan
  • Utførelsesmotor
  • Operatører
  • UDF-er og UDAF-er
  • Optimizer
  • parser
  • Semantisk analysator
  • Typekontroll

19) Nevn hva er partisjoner i Hive?

Hive organiserer tabeller i partisjoner.

  • Det er en av måtene å dele tabeller inn i forskjellige deler basert på partisjonsnøkler.
  • Partisjon er nyttig når tabellen har én eller flere partisjonsnøkler.
  • Partisjonsnøkler er grunnleggende elementer for å bestemme hvordan dataene lagres i tabellen.

20) Nevn når du skal velge "Internt bord" og "Eksternt bord" i Hive?

I Hive kan du velge internt bord,

  • Hvis behandlingsdataene er tilgjengelige i det lokale filsystemet
  • Hvis vi vil at Hive skal administrere hele livssyklusen til data, inkludert sletting

Du kan velge Eksternt bord,

  • Hvis du behandler data tilgjengelig i HDFS
  • Nyttig når filene brukes utenfor Hive

21) Nevn om vi kan navngi det samme som navnet på et Hive-bord?

Nei. Navnet på en visning må være unik sammenlignet med alle andre tabeller og som visninger som finnes i samme database.


22) Nevn hva er visninger i Hive?

I Hive ligner visninger på tabeller. De genereres basert på kravene.

  • Vi kan lagre alle resultatsettdata som en visning i Hive
  • Bruken ligner på visninger som brukes i SQL
  • Alle typer DML-operasjoner kan utføres på en visning

23) Forklar hvordan Hive deserialiserer og serialiserer dataene?

Vanligvis, mens du leser/skriver dataene, kommuniserer brukeren først med inputformat. Deretter kobles den til Record reader for å lese/skrive posten. For å serialisere dataene går dataene til rad. Her bruker deserialiserte tilpassede serde objektinspektør for å deserialisere dataene i felt.


24) Hva er Bøtter i Hive?

  • Dataene som finnes i partisjonene kan deles videre inn i Buckets
  • Delingen utføres basert på Hash for bestemte kolonner som er valgt i tabellen.

25) Hvordan kan du aktivere buckets i Hive?

I Hive kan du aktivere bøtter ved å bruke følgende kommando,

set.hive.enforce.bucketing=true;

26) Kan du overskrive Hadoop MapReduce-konfigurasjonen i Hive i Hive?

Ja, du kan overskrive Hadoop MapReduce-konfigurasjonen i Hive.


27) Forklar hvordan du kan endre en kolonnedatatype i Hive?

Du kan endre en kolonnedatatype i Hive ved å bruke kommando,

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Nevn hva er forskjellen mellom sortere etter og sortere etter i Hive?

  • SORT BY vil sortere dataene innenfor hver redusering. Du kan bruke et hvilket som helst antall reduksjonsstykker for SORTERING ETTER-operasjon.
  • ORDER BY vil sortere alle dataene sammen, som må passere gjennom en redusering. Dermed bruker ORDER BY i hive en singel

29) Forklar når du skal bruke eksplodere i Hive?

Hadoop-utviklere tar noen ganger en matrise som input og konverter til en egen tabellrad. For å konvertere komplekse datatyper til ønskede tabellformater, bruker Hive eksploderer.


30) Nevn hvordan kan du stoppe et partisjonsskjema som blir spurt?

Du kan stoppe et partisjonsskjema som blir spurt ved å bruke ENABLE OFFLINE-leddet med ALTER TABLE-setningen.

Disse intervjuspørsmålene vil også hjelpe i din viva(orals). Se vår Hive-veiledninger for en ekstra fordel i intervjuet ditt.

Del

3 Kommentarer

  1. Avatar Satyaranjan Singh sier:

    Det er veldig nyttig……..nyttig……..nyttig for intervjuforberedelse så vel som selvforberedelse.

  2. Takk! Det er veldig nyttig!

    Jeg tror kanskje du kan legge til noen spørsmål om "dataskjevhet", fordi jeg vanligvis ble bedt om å svare på disse spørsmålene da jeg var intervjuer.

    1. Avatar meenakshi sier:

      legg til intervjuspørsmål som du har stilt

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket *