De 30 bästa Hive-intervjufrågorna och -svaren (2025)

Hive-intervjufrågor för nybörjare och erfarna

Här är Hive-intervjufrågor och svar för såväl nyblivna som erfarna kandidater för att få sitt drömjobb.

Gratis PDF-nedladdning: Hive-intervjufrågor


1) Förklara vad är Hive?

Hive är ett ETL- och datalagerverktyg utvecklat ovanpå Hadoop Distributed File System (HDFS). Det är ett datalagerramverk för sökning och analys av data som lagras i HDFS. Hive är en öppen källkodsprogramvara som låter programmerare analysera stora datamängder på Hadoop.


2) När ska man använda Hive?

  • Hive är användbart när man gör datalagret tillämpningar
  • När du har att göra med statisk data istället för dynamisk data
  • När applikationen har hög latens (hög svarstid)
  • När en stor datamängd bibehålls
  • När vi använder frågor istället för skript

3) Nämn vilka är de olika sätten för Hive?

Beroende på storleken på datanoderna i Hadoop kan Hive fungera i två lägen. Dessa lägen är,

  • Lokalt läge
  • Kartförminskningsläge

4) Nämn när man ska använda kartförminskningsläget?

Kartförminskningsläge används när,

  • Det kommer att fungera på stora mängder datamängder och fråga kommer att köras på ett parallellt sätt
  • Hadoop har flera datanoder, och data distribueras över olika noder som vi använder Hive i det här läget
  • Bearbetning av stora datamängder med bättre prestanda måste uppnås

5) Nämn nyckelkomponenter i Hive Architecture?

Nyckelkomponenter i Hive Architecture inkluderar,

  • Användargränssnitt
  • Kompilator
  • Metastore
  • Chaufför
  • Kör motor
Hive intervjufrågor
Hive intervjufrågor

6) Nämn vilka olika typer av bord som finns tillgängliga i Hive?

Det finns två typer av bord tillgängliga i Hive.

  • Hanterat bord: I hanterad tabell är både data och schema under kontroll av Hive
  • Externt bord: I den externa tabellen är endast schemat under kontroll av Hive.

7) Förklara vad är Metastore i Hive?

Metastore är ett centralt förvar i Hive. Den används för att lagra schemainformation eller metadata i den externa databasen.


8) Nämn vad Hive består av?

Hive består av 3 huvuddelar,

  1. Hive kunder
  2. Hive Services
  3. Hive-lagring och datoranvändning

9) Nämn vilken typ av databas stöder Hive?

För lagring av metadata för en användare använder Hive derbydatabas och för metadata för flera användare eller delade metadatafall som Hive använder MySQL.


10) Nämn Hive standard läs- och skrivklasser?

Hive är standardläs- och skrivklasser

  1. TextInputFormat/HiveIgnoreKeyTextOutputFormat
  2. SequenceFileInputFormat/SequenceFileOutputFormat

11) Vad är indexering i Hive?

Hive-indexering är en frågeoptimeringsteknik för att förbättra hastigheten för frågesökning i vissa kolumner i en tabell.


12) Varför är Hive inte lämplig för OLTP-system?

Hive är inte lämpligt för OLTP-system eftersom det inte tillhandahåller infogning och uppdateringsfunktion på radnivå.


13) Nämn vad är skillnaden mellan Hbase och Hive?

Skillnaden mellan Hbase och Hive är,

  • Hive möjliggör de flesta SQL frågor, men HBase tillåter inte SQL-frågor
  • Hive stöder inte operationer för infogning, uppdatering och radering på postnivå på tabell
  • Hive är ett datalagerramverk medan HBase är NoSQL-databas
  • Hive kör på toppen av MapReduce, HBase körs på toppen av HDFS

14) Förklara vad en Hive-variabel är? Vad använder vi det till?

Hive-variabeln skapas i Hive-miljön som kan refereras av Hive-skript. Den används för att skicka vissa värden till hive-frågorna när frågan börjar köras.


15) Nämn vad är ObjectInspector-funktionalitet i Hive?

ObjectInspector-funktionaliteten i Hive används för att analysera den interna strukturen för kolumner, rader och komplexa objekt. Det gör det möjligt att komma åt de interna fälten inuti objekten.


16) Nämn vad är (HS2) HiveServer2?

Det är ett servergränssnitt som utför följande funktioner.

  • Det tillåter fjärrklienter att utföra frågor mot Hive
  • Hämta resultaten av nämnda frågor

Några avancerade funktioner baserade på Thrift RPC i sin senaste version inkluderar

  • Samtidighet med flera klienter
  • Autentisering

17) Nämn vad Hive frågeprocessor gör?

Hive-frågeprocessor konverterar graf över MapReduce-jobb med ramverket för körningstid. Så att jobben kan utföras i beroendeordning.


18) Nämn vad är komponenterna i en Hive-frågeprocessor?

Komponenterna i en Hive-frågeprocessor inkluderar,

  • Generering av logisk plan
  • Generering av fysiska planer
  • Exekveringsmotor
  • Operatörer
  • UDF:s och UDAF:s
  • Optimizer
  • parser
  • Semantisk analysator
  • Typkontroll

19) Nämn vad är partitioner i Hive?

Hive organiserar tabeller i partitioner.

  • Det är ett av sätten att dela upp tabeller i olika delar baserat på partitionsnycklar.
  • Partition är användbart när tabellen har en eller flera partitionsnycklar.
  • Partitionsnycklar är grundläggande element för att bestämma hur data lagras i tabellen.

20) Nämn när man ska välja "Internt bord" och "Externt bord" i Hive?

I Hive kan du välja internt bord,

  • Om bearbetningsdata finns i det lokala filsystemet
  • Om vi ​​vill att Hive ska hantera hela livscykeln för data inklusive raderingen

Du kan välja Externt bord,

  • Om bearbetning av data tillgänglig i HDFS
  • Användbart när filerna används utanför Hive

21) Nämn om vi kan namnge samma som namnet på en Hive-tabell?

Nej. Namnet på en vy måste vara unikt jämfört med alla andra tabeller och som vyer som finns i samma databas.


22) Nämn vad är vyer i Hive?

I Hive liknar vyerna tabeller. De genereras utifrån kraven.

  • Vi kan spara alla resultatuppsättningsdata som en vy i Hive
  • Användningen liknar vyer som används i SQL
  • Alla typer av DML-operationer kan utföras på en vy

23) Förklara hur Hive avserialiserar och serialiserar data?

Vanligtvis, medan läser/skriver data, kommunicerar användaren först med inmatningsformat. Sedan ansluter den till Record reader för att läsa/skriva rekord. För att serialisera data går data till rad. Här deserialiserade anpassade serde använder objektinspektör för att deserialisera data i fält.


24) Vad är Buckets in Hive?

  • Data som finns i partitionerna kan delas upp ytterligare i Buckets
  • Uppdelningen utförs baserat på Hash för särskilda kolumner som väljs i tabellen.

25) Hur kan du aktivera hinkar i Hive?

I Hive kan du aktivera hinkar genom att använda följande kommando,

set.hive.enforce.bucketing=true;

26) Kan du skriva över Hadoop MapReduce-konfigurationen i Hive i Hive?

Ja, du kan skriva över Hadoop MapReduce-konfigurationen i Hive.


27) Förklara hur du kan ändra en kolumndatatyp i Hive?

Du kan ändra en kolumndatatyp i Hive genom att använda kommando,

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Nämn vad är skillnaden mellan sortera efter och sortera efter i Hive?

  • SORT BY kommer att sortera data inom varje reducering. Du kan använda valfritt antal reducerare för SORTERING EFTER-drift.
  • ORDER BY kommer att sortera all data tillsammans, som måste passera genom en reducering. Således använder ORDER BY i hive en singel

29) Förklara när man ska använda explode i Hive?

Hadoop-utvecklare tar ibland en array som inmatning och konvertera till en separat tabellrad. För att konvertera komplexa datatyper till önskade tabellformat, använder Hive explodera.


30) Nämn hur kan du förhindra att ett partitionsformulär efterfrågas?

Du kan stoppa efterfrågan av ett partitionsformulär genom att använda ENABLE OFFLINE-satsen med ALTER TABLE-satsen.

Dessa intervjufrågor kommer också att hjälpa dig i din viva(orals). Se vår Hive Tutorials för en extra fördel i din intervju.

Dela

3 Kommentarer

  1. Avatar Satyaranjan Singh säger:

    Det är mycket användbart……..nyttigt……..nyttigt för intervjuförberedelser såväl som självförberedelser.

  2. Tack! Det är väldigt användbart!

    Jag tror att du kanske kan lägga till några frågor om "dataskev", eftersom jag vanligtvis blev ombedd att svara på dessa frågor när jag var intervjuare.

    1. Avatar meenakshi säger:

      lägg till intervjufrågor som du har ställt

Lämna en kommentar

E-postadressen publiceras inte. Obligatoriska fält är markerade *