En İyi 30 Hive Röportaj Soruları ve Cevapları (2024)

Yeni Öğrenciler ve Deneyimliler için Hive Mülakat Soruları

İşte hem yeni başlayanlar hem de deneyimli adaylar için hayallerindeki işi bulmaları için Hive mülakat soruları ve cevapları.

Ücretsiz PDF İndir: Hive Mülakat Soruları


1) Hive nedir açıklayınız?

Hive, Hadoop Dağıtılmış Dosya Sistemi (HDFS) üzerine geliştirilmiş bir ETL ve Veri depolama aracıdır. HDFS'de depolanan verilerin sorgulanması ve analizi için bir veri ambarı çerçevesidir. Hive, programcıların büyük veri kümelerini analiz etmesine olanak tanıyan açık kaynaklı bir yazılımdır. Hadoop'un.


2) Hive ne zaman kullanılmalı?

  • Kovan yaparken faydalıdır veri ambarı uygulamaları
  • Dinamik veriler yerine statik verilerle uğraşırken
  • Uygulama yüksek gecikme süresinde olduğunda (yüksek yanıt süresi)
  • Büyük bir veri seti muhafaza edildiğinde
  • Komut dosyası yazmak yerine sorgular kullandığımızda

3) Hive'ın farklı modlarının neler olduğundan bahsedin?

Hadoop'taki veri düğümlerinin boyutuna bağlı olarak Hive iki modda çalışabilir. Bu modlar,

  • Yerel mod
  • Harita küçültme modu

4) Harita küçültme modunun ne zaman kullanılacağını belirtin?

Harita küçültme modu şu durumlarda kullanılır:

  • Büyük miktarda veri kümesi üzerinde çalışacak ve sorgu paralel bir şekilde yürütülecek
  • Hadoop'un birden fazla veri düğümü vardır ve veriler, bu modda Hive'ı kullandığımız farklı düğümlere dağıtılır.
  • Büyük veri kümelerinin daha iyi performansla işlenmesinin sağlanması gerekiyor

5) Hive Mimarisinin temel bileşenlerinden bahseder misiniz?

Hive Mimarisinin temel bileşenleri şunları içerir:

  • Kullanıcı Arayüzü
  • derleyici
  • meta mağaza
  • Sürücü
  • Motoru Çalıştır
Kovan Mülakat Soruları
Kovan Mülakat Soruları

6) Hive'da mevcut olan farklı tablo türlerinin neler olduğundan bahsedin?

Hive'da iki tür tablo vardır.

  • Yönetilen tablo: Yönetilen tabloda hem veriler hem de şema Hive'ın kontrolü altındadır
  • Dış tablo: Dış tabloda yalnızca şema Hive'ın kontrolü altındadır.

7) Hive'da Metastore'un ne olduğunu açıklayın?

Metastore, Hive'daki merkezi bir depodur. Şema bilgilerini veya meta verileri harici veritabanında depolamak için kullanılır.


8) Hive'ın nelerden oluştuğundan bahsedin?

Kovan 3 ana bölümden oluşur,

  1. Hive İstemcileri
  2. Kovan Hizmetleri
  3. Kovan Depolama ve Bilgi İşlem

9) Hive'ın desteklediği veritabanı türlerinden bahsedin?

Tek kullanıcılı meta veri depolama için Hive, derby veritabanını kullanır ve birden fazla kullanıcılı Meta Veri veya paylaşılan Meta Veri durumu için Hive kullanır. MYSQL.


10) Hive'ın varsayılan okuma ve yazma sınıflarından bahsedin mi?

Hive varsayılan okuma ve yazma sınıfları

  1. TextInputFormat/HiveIgnoreKeyTextOutputFormat
  2. SequenceFileInputFormat/SequenceFileOutputFormat

11) Hive'da indeksleme nedir?

Hive indeksleme, bir tablonun belirli sütunlarında sorgu arama hızını artırmaya yönelik bir sorgu optimizasyon tekniğidir.


12) Hive neden OLTP sistemlerine uygun değil?

Hive, satır düzeyinde ekleme ve güncelleme işlevi sağlamadığından OLTP sistemleri için uygun değildir.


13) Hbase ve Hive arasındaki farkın ne olduğundan bahsedin?

Hbase ve Hive arasındaki fark,

  • Hive çoğu şeyi mümkün kılar SQL sorgular, ancak HBase SQL sorgularına izin vermiyor
  • Hive, tablodaki kayıt düzeyinde ekleme, güncelleme ve silme işlemlerini desteklemez
  • Hive bir veri ambarı çerçevesidir, HBase ise NoSQL veritabanıdır
  • Hive, MapReduce'un üstünde çalışır, HBase, HDFS'nin üstünde çalışır

14) Hive değişkeni nedir açıklayınız? Ne için kullanıyoruz?

Hive değişkeni, Hive betikleri tarafından başvurulabilen Hive ortamında oluşturulur. Sorgu yürütülmeye başladığında bazı değerleri Hive sorgularına iletmek için kullanılır.


15) Hive'daki ObjectInspector işlevselliğinin ne olduğundan bahsedin?

Hive'daki ObjectInspector işlevi sütunların, satırların ve karmaşık nesnelerin iç yapısını analiz etmek için kullanılır. Nesnelerin içindeki iç alanlara erişime izin verir.


16) (HS2) HiveServer2 nedir?

Aşağıdaki işlevleri yerine getiren bir sunucu arayüzüdür.

  • Uzak istemcilerin Hive'a karşı sorgu yürütmesine olanak tanır
  • Bahsedilen sorguların sonuçlarını alın

En son sürümündeki Thrift RPC'yi temel alan bazı gelişmiş özellikler şunları içerir:

  • Çok istemcili eşzamanlılık
  • Doğrulama

17) Hive sorgu işlemcisinin ne işe yaradığından bahsedin?

Hive sorgu işlemcisi, MapReduce işlerinin grafiğini yürütme süresi çerçevesiyle dönüştürür. Böylece işler bağımlılık sırasına göre yürütülebilir.


18) Hive sorgu işlemcisinin bileşenleri nelerdir?

Hive sorgu işlemcisinin bileşenleri şunları içerir:

  • Mantıksal Plan Oluşturma
  • Fiziksel Plan Oluşturma
  • Yürütme Motoru
  • Operatörler
  • UDF'ler ve UDAF'lar
  • Doktoru
  • Ayrıştırıcı
  • Semantik Çözümleyici
  • Tip Kontrolü

19) Hive'daki Partition'ların ne olduğundan bahsedin.

Hive, tabloları bölümler halinde düzenler.

  • Tabloları bölüm anahtarlarına göre farklı parçalara ayırmanın yollarından biridir.
  • Tabloda bir veya daha fazla Bölüm anahtarı bulunduğunda bölüm yararlı olur.
  • Bölüm anahtarları, verilerin tabloda nasıl saklanacağını belirleyen temel öğelerdir.

20) Hive'da “Dahili Tablo” ve “Harici Tablo”yu ne zaman seçeceğinizi belirtin?

Hive'da dahili tabloyu seçebilirsiniz,

  • İşleme verileri yerel dosya sisteminde mevcutsa
  • Hive'ın, silme işlemi de dahil olmak üzere veri yaşam döngüsünün tamamını yönetmesini istiyorsak

Harici tabloyu seçebilirsiniz,

  • HDFS'de veri işleniyorsa
  • Dosyalar Hive dışında kullanıldığında kullanışlıdır

21) Görünümü Hive tablosunun adıyla aynı şekilde adlandırabilir miyiz?

Hayır. Bir görünümün adı, diğer tüm tablolarla karşılaştırıldığında ve aynı veritabanında bulunan görünümler olarak benzersiz olmalıdır.


22) Hive'daki görünümlerin ne olduğundan bahsedin?

Hive'da Görünümler tablolara benzer. İhtiyaçlara göre üretilirler.

  • Herhangi bir sonuç kümesi verisini Hive'da görünüm olarak kaydedebiliriz
  • Kullanımı SQL'de kullanılan görünümlere benzer
  • Bir görünümde her türlü DML işlemi gerçekleştirilebilir

23) Hive'ın verileri nasıl seri durumdan çıkardığını ve seri hale getirdiğini açıklayın.

Genellikle veriyi okurken/yazarken kullanıcı ilk olarak inputformat ile iletişim kurar. Daha sonra kaydı okumak/yazmak için Kayıt okuyucuya bağlanır. Verileri serileştirmek için veriler satıra gider. Burada seri durumdan çıkarılan özel serde, alanlardaki verileri seri durumdan çıkarmak için nesne denetçisini kullanır.


24) Kovandaki Kovalar Nedir?

  • Bölümlerde bulunan veriler Kovalara daha da bölünebilir
  • Bölme, tabloda seçilen belirli sütunların Karmasına göre gerçekleştirilir.

25) Hive'da kovaları nasıl etkinleştirebilirsiniz?

Hive'da aşağıdaki komutu kullanarak paketleri etkinleştirebilirsiniz:

set.hive.enforce.bucketing=true;

26) Hive'da, Hive'daki Hadoop MapReduce yapılandırmasının üzerine yazabilir misiniz?

Evet, Hive'daki Hadoop MapReduce yapılandırmasının üzerine yazabilirsiniz.


27) Hive'da bir sütun veri türünü nasıl değiştirebileceğinizi açıklayın?

Hive'daki bir sütun veri türünü şu komutu kullanarak değiştirebilirsiniz:

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Hive'da sıralama ve sıralama arasındaki farkın ne olduğundan bahsedin?

  • SORT BY her redüktör içindeki verileri sıralayacaktır. SORT BY işlemi için istediğiniz sayıda redüktör kullanabilirsiniz.
  • ORDER BY, tek bir redüktörden geçmesi gereken tüm verileri birlikte sıralayacaktır. Bu nedenle Hive'daki ORDER BY tek bir komut kullanır.

29) Hive'da patlatmanın ne zaman kullanılacağını açıklayın?

Hadoop geliştiricileri bazen dizi giriş olarak kullanın ve ayrı bir tablo satırına dönüştürün. Karmaşık veri türlerini istenen tablo formatlarına dönüştürmek için Hive, patlamayı kullanır.


30) Bir bölümleme formunun sorgulanmasını nasıl durdurabileceğinizi söyleyin?

ALTER TABLE deyimiyle ENABLE OFFLINE yan tümcesini kullanarak bir bölüm formunun sorgulanmasını durdurabilirsiniz.

Bu röportaj soruları aynı zamanda sözlü konuşmanıza da yardımcı olacaktır. bizim başvurun Kovan Eğitimleri Röportajınızda ekstra bir avantaj sağlamak için.

paylaş

3 Yorumlar

  1. Avatar Satyaranjan Singh diyor ki:

    Çok faydalıdır……..yararlı……..röportaj hazırlığı ve kişisel hazırlık için faydalıdır.

  2. Teşekkür ederim! Çok faydalı!

    Belki "veri çarpıklığı" ile ilgili bazı sorular ekleyebilirsiniz, çünkü görüşmeci olduğumda genellikle bu soruyu yanıtlamam isteniyordu.

    1. Avatar Meenakshi diyor ki:

      lütfen sorduğunuz röportaj sorularını ekleyin

Yorum bırak

E-posta hesabınız yayımlanmayacak. Gerekli alanlar işaretlenmişlerdir. *