30 найкращих запитань і відповідей на інтерв’ю Hive (2025)

Запитання для співбесіди з Hive для новачків і досвідчених

Ось питання та відповіді на співбесіді в Hive для новачків, а також для досвідчених кандидатів, щоб отримати роботу своєї мрії.

Безкоштовне завантаження у форматі PDF: Питання для інтерв’ю Hive


1) Поясніть, що таке Hive?

Hive — це інструмент ETL і сховищ даних, розроблений на основі розподіленої файлової системи Hadoop (HDFS). Це структура сховища даних для запитів і аналізу даних, які зберігаються в HDFS. Hive — це програмне забезпечення з відкритим кодом, яке дозволяє програмістам аналізувати великі набори даних Hadoop.


2) Коли використовувати Hive?

  • Вулик корисний при виготовленні сховище даних застосування
  • Коли ви маєте справу зі статичними даними замість динамічних
  • Коли програма має високу затримку (високий час відповіді)
  • Коли підтримується великий набір даних
  • Коли ми використовуємо запити замість сценаріїв

3) Згадайте, які існують різні режими Hive?

Залежно від розміру вузлів даних у Hadoop, Hive може працювати в двох режимах. Ці режими,

  • Локальний режим
  • Режим зменшення карти

4) Згадайте, коли використовувати режим зменшення карти?

Режим зменшення карти використовується, коли

  • Він виконуватиме роботу з великою кількістю наборів даних і запити виконуватимуться паралельно
  • Hadoop має кілька вузлів даних, і дані розподіляються між різними вузлами, які ми використовуємо Hive у цьому режимі
  • Потрібно досягти кращої продуктивності обробки великих наборів даних

5) Згадайте ключові компоненти Hive Architecture?

Ключові компоненти Hive Architecture включають:

  • Інтерфейс користувача
  • компілятор
  • Метасховище
  • Водій
  • Виконати двигун
Запитання для інтерв'ю Hive
Запитання для інтерв'ю Hive

6) Згадайте, які різні типи таблиць доступні в Hive?

У Hive доступні два типи таблиць.

  • Керована таблиця: у керованій таблиці і дані, і схема знаходяться під контролем Hive
  • Зовнішній стіл: у зовнішній таблиці під контролем Hive знаходиться лише схема.

7) Поясніть, що таке Metastore у Hive?

Metastore є центральним репозиторієм у Hive. Він використовується для зберігання інформації про схему або метаданих у зовнішній базі даних.


8) Згадайте, з чого складається вулик?

Вулик складається з 3 основних частин,

  1. Клієнти Hive
  2. Служби Hive
  3. Зберігання та обчислення Hive

9) Згадайте, який тип бази даних підтримує Hive?

Для зберігання метаданих одного користувача Hive використовує базу даних derby, а для метаданих кількох користувачів або спільних метаданих використовує Hive MYSQL.


10) Згадайте стандартні класи читання та запису Hive?

Типовими класами читання та запису Hive є

  1. TextInputFormat/HiveIgnoreKeyTextOutputFormat
  2. SequenceFileInputFormat/SequenceFileOutputFormat

11) Що таке індексування в Hive?

Індексування куща – це техніка оптимізації запитів для підвищення швидкості пошуку запитів у певних стовпцях таблиці.


12) Чому Hive не підходить для систем OLTP?

Hive не підходить для систем OLTP, оскільки він не забезпечує функції вставки та оновлення на рівні рядка.


13) Згадайте, яка різниця між Hbase і Hive?

Різниця між Hbase і Hive полягає в тому,

  • Hive дозволяє більшість із SQL запити, але HBase не дозволяє запити SQL
  • Hive не підтримує операції вставки, оновлення та видалення таблиці на рівні запису
  • Hive — це структура сховища даних, тоді як HBase — база даних NoSQL
  • Hive працює на вершині MapReduce, HBase працює на вершині HDFS

14) Поясніть, що таке змінна Hive? Для чого ми це використовуємо?

Змінна Hive створюється в середовищі Hive, на яку можуть посилатися сценарії Hive. Він використовується для передачі деяких значень у запити куща, коли запит починає виконуватися.


15) Згадайте, що таке функція ObjectInspector у Hive?

Функція ObjectInspector у Hive використовується для аналізу внутрішньої структури стовпців, рядків і складних об’єктів. Це дозволяє отримати доступ до внутрішніх полів всередині об'єктів.


16) Згадайте, що таке (HS2) HiveServer2?

Це серверний інтерфейс, який виконує наступні функції.

  • Це дозволяє віддаленим клієнтам виконувати запити до Hive
  • Отримати результати згаданих запитів

Деякі розширені функції, засновані на Thrift RPC в останній версії, включають

  • Багатоклієнтська паралельність
  • Authentication

17) Згадайте, що робить процесор запитів Hive?

Процесор запитів Hive перетворює графік завдань MapReduce із часовими рамками виконання. Щоб завдання можна було виконувати в порядку залежностей.


18) Згадайте, з яких компонентів складається процесор запитів Hive?

Компоненти процесора запитів Hive включають:

  • Генерація логічного плану
  • Генерація фізичного плану
  • Двигун виконання
  • Оператори
  • ОДС і УДАФ
  • Оптимізатор
  • Парсер
  • Семантичний аналізатор
  • Перевірка типу

19) Згадайте, що таке Partitions у Hive?

Hive організовує таблиці в розділи.

  • Це один із способів поділу таблиць на різні частини на основі ключів розділів.
  • Секція корисна, коли таблиця має один або кілька ключів секції.
  • Ключі розділу є основними елементами для визначення того, як дані зберігаються в таблиці.

20) Згадайте, коли вибрати «Внутрішню таблицю» та «Зовнішню таблицю» у Hive?

У Hive ви можете вибрати внутрішню таблицю,

  • Якщо дані обробки доступні в локальній файловій системі
  • Якщо ми хочемо, щоб Hive керував повним життєвим циклом даних, включаючи видалення

Ви можете вибрати Зовнішній стіл,

  • Якщо обробка даних доступна в HDFS
  • Корисно, коли файли використовуються поза Hive

21) Згадайте, чи можемо ми назвати представлення так само, як ім’я таблиці Hive?

Ні. Ім’я подання має бути унікальним порівняно з усіма іншими таблицями та представленнями в одній базі даних.


22) Згадайте, що таке перегляди в Hive?

У Hive представлення схожі на таблиці. Вони формуються на основі вимог.

  • Ми можемо зберегти будь-які дані набору результатів як подання в Hive
  • Використання подібне до представлень, що використовуються в SQL
  • У поданні можна виконувати всі типи операцій DML

23) Поясніть, як Hive десеріалізує та серіалізує дані?

Зазвичай під час читання/запису даних користувач спочатку спілкується з форматом введення. Потім він підключається до пристрою читання записів для читання/запису запису. Щоб серіалізувати дані, дані переходять до рядка. Тут десеріалізоване користувацьке serde використовує інспектор об’єктів для десеріалізації даних у полях.


24) Що таке відра у вулику?

  • Дані, наявні в розділах, можна далі розділити на сегменти
  • Розподіл виконується на основі Хешу окремих стовпців, які вибрані в таблиці.

25) Як увімкнути сегменти в Hive?

У Hive ви можете ввімкнути сегменти за допомогою наступної команди:

set.hive.enforce.bucketing=true;

26) Чи можете ви перезаписати конфігурацію Hadoop MapReduce у Hive?

Так, ви можете перезаписати конфігурацію Hadoop MapReduce у Hive.


27) Поясніть, як можна змінити тип даних стовпця в Hive?

Ви можете змінити тип даних стовпця в Hive за допомогою команди,

ALTER TABLE table_name CHANGE column_name column_name new_datatype;

28) Згадайте, яка різниця між упорядкуванням за та сортуванням у Hive?

  • SORT BY відсортує дані в кожному редукторі. Ви можете використовувати будь-яку кількість редукторів для операції SORT BY.
  • ORDER BY відсортує всі дані разом, які мають пройти через один редуктор. Таким чином, ORDER BY у вулику використовує єдиний

29) Поясніть, коли використовувати explode у Hive?

Розробники Hadoop іноді беруть an масив як вхідні дані та перетворити в окремий рядок таблиці. Щоб перетворити складні типи даних у потрібні формати таблиць, Hive використовуйте рознесення.


30) Згадайте, як можна зупинити запит форми розділу?

Ви можете припинити запит форми розділу, використовуючи речення ENABLE OFFLINE з оператором ALTER TABLE.

Ці запитання для співбесіди також допоможуть у вашій віва (усній). Зверніться до нашого Hive Підручники для додаткової переваги під час співбесіди.

Поділитись

3 Коментарі

  1. Аватара Сатьяранджан Сінгх каже:

    Це дуже корисно……..корисно……..корисно для підготовки до співбесіди, а також для самопідготовки.

  2. дякую! Це дуже корисно!

    Я думаю, можливо, ви можете додати кілька запитань про «перекос даних», тому що мене зазвичай просили відповісти на ці запитання, коли я був інтерв’юером.

    1. Аватара менакші каже:

      будь ласка, додайте питання для співбесіди, які ви задавали

залишити коментар

Ваша електронна адреса не буде опублікований. Обов'язкові поля позначені * *