Топ 30 на въпросите и отговорите за интервю за Hive (2025)
Въпроси за интервю за Hive за първокурсници и опитни
Ето въпроси и отговори за интервю за Hive за новопостъпили, както и за опитни кандидати, за да получат мечтаната работа.
Безплатно изтегляне на PDF: Въпроси за интервю в Hive
1) Обяснете какво е Hive?
Hive е ETL и инструмент за съхранение на данни, разработен върху Hadoop Distributed File System (HDFS). Това е рамка за съхранение на данни за заявки и анализ на данни, които се съхраняват в HDFS. Hive е софтуер с отворен код, който позволява на програмистите да анализират големи набори от данни Hadoop.
2) Кога да използвате Hive?
- Кошерът е полезен при правене склад за данни приложения
- Когато работите със статични данни вместо с динамични данни
- Когато приложението е с висока латентност (високо време за реакция)
- Когато се поддържа голям набор от данни
- Когато използваме заявки вместо скриптове
3) Споменете какви са различните режими на Hive?
В зависимост от размера на възлите за данни в Hadoop, Hive може да работи в два режима. Тези режими са,
- Местен режим
- Режим за намаляване на картата
4) Споменете кога да използвате режима за намаляване на картата?
Режимът за намаляване на картата се използва, когато,
- Той ще изпълнява голямо количество набори от данни и заявката ще се изпълнява по паралелен начин
- Hadoop има множество възли за данни и данните се разпределят между различни възли, които използваме Hive в този режим
- Трябва да се постигне обработка на големи набори от данни с по-добра производителност
5) Споменете ключови компоненти на Hive Architecture?
Ключовите компоненти на Hive Architecture включват,
- User Interface
- съставител
- Metastore
- драйвер
- Изпълнете двигателя
6) Споменете какви са различните типове таблици, налични в Hive?
В Hive има два типа таблици.
- Управлявана таблица: В управляваната таблица както данните, така и схемата са под контрола на Hive
- Външна маса: Във външната таблица само схемата е под контрола на Hive.
7) Обяснете какво е Metastore в Hive?
Metastore е централно хранилище в Hive. Използва се за съхраняване на информация за схема или метаданни във външната база данни.
8) Споменете от какво се състои Hive?
Кошерът се състои от 3 основни части,
- Клиенти на Hive
- Hive Services
- Съхранение и компютри в Hive
9) Споменете какъв тип база данни поддържа Hive?
За съхранение на метаданни за един потребител Hive използва база данни derby, а за метаданни за множество потребители или случай на споделени метаданни Hive използва MySQL.
10) Споменете класове за четене и запис по подразбиране на Hive?
Класовете за четене и запис по подразбиране в Hive са
- TextInputFormat/HiveIgnoreKeyTextOutputFormat
- SequenceFileInputFormat/SequenceFileOutputFormat
11) Какво представлява индексирането в Hive?
Индексирането на Hive е техника за оптимизиране на заявки за подобряване на скоростта на търсене на заявки в определени колони на таблица.
12) Защо Hive не е подходящ за OLTP системи?
Hive не е подходящ за OLTP системи, защото не предоставя функция за вмъкване и актуализиране на ниво ред.
13) Споменете каква е разликата между Hbase и Hive?
Разликата между Hbase и Hive е,
- Hive позволява повечето от SQL заявки, но HBase не позволява SQL заявки
- Hive не поддържа операции за вмъкване, актуализиране и изтриване на ниво запис в таблицата
- Hive е рамка за съхранение на данни, докато HBase е NoSQL база данни
- Hive работи на върха на MapReduce, HBase работи на върха на HDFS
14) Обяснете какво е променлива Hive? За какво го използваме?
Променливата Hive се създава в средата на Hive, която може да бъде препратена от скриптове на Hive. Използва се за предаване на някои стойности към заявките за кошер, когато заявката започне да се изпълнява.
15) Споменете какво представлява функционалността на ObjectInspector в Hive?
Функционалността на ObjectInspector в Hive се използва за анализиране на вътрешната структура на колони, редове и сложни обекти. Позволява достъп до вътрешните полета вътре в обектите.
16) Споменете какво е (HS2) HiveServer2?
Това е сървърен интерфейс, който изпълнява следните функции.
- Той позволява на отдалечени клиенти да изпълняват заявки срещу Hive
- Извличане на резултатите от споменатите заявки
Някои разширени функции, базирани на Thrift RPC в последната му версия, включват
- Мултиклиентска паралелност
- заверка
17) Споменете какво прави процесорът за заявки Hive?
Процесорът на заявки Hive конвертира графика на заданията на MapReduce с рамката за време на изпълнение. Така че заданията да могат да се изпълняват в реда на зависимостите.
18) Споменете какви са компонентите на процесора за заявки Hive?
Компонентите на процесора за заявки Hive включват,
- Генериране на логически план
- Генериране на физически план
- Изпълнение двигател
- Операторите
- СДС и СДС
- Optimizer
- Анализатор
- Семантичен анализатор
- Проверка на типа
19) Споменете какво е дялове в Hive?
Hive организира таблиците в дялове.
- Това е един от начините за разделяне на таблици на различни части въз основа на ключове за дялове.
- Разделянето е полезно, когато таблицата има един или повече ключове за дялове.
- Ключовете за дялове са основни елементи за определяне на това как данните се съхраняват в таблицата.
20) Споменете кога да изберете „Вътрешна таблица“ и „Външна таблица“ в Hive?
В Hive можете да изберете вътрешна таблица,
- Ако данните за обработка са налични в локалната файлова система
- Ако искаме Hive да управлява пълния жизнен цикъл на данните, включително изтриването
Можете да изберете външна маса,
- Ако се обработват данни, налични в HDFS
- Полезно, когато файловете се използват извън Hive
21) Споменете дали можем да наименуваме изглед по същия начин като името на таблица Hive?
Не. Името на изглед трябва да бъде уникално в сравнение с всички други таблици и като изгледи, присъстващи в същата база данни.
22) Споменете какви са изгледите в Hive?
В Hive изгледите са подобни на таблиците. Те се генерират въз основа на изискванията.
- Можем да запазим всякакви данни за набор от резултати като изглед в Hive
- Използването е подобно на изгледите, използвани в SQL
- Всички видове DML операции могат да се извършват върху изглед
23) Обяснете как Hive десериализира и сериализира данните?
Обикновено, докато чете/записва данните, потребителят първо комуникира с inputformat. След това се свързва с четец на записи за четене/запис на запис. За да сериализирате данните, данните отиват в ред. Тук десериализираните персонализирани сърде използват обектен инспектор, за да десериализират данните в полетата.
24) Какво е Buckets в Hive?
- Данните, присъстващи в дяловете, могат да бъдат разделени допълнително на кофи
- Разделянето се извършва въз основа на хеша на определени колони, които са избрани в таблицата.
25) В Hive, как можете да активирате кофи?
В Hive можете да активирате кофи, като използвате следната команда,
set.hive.enforce.bucketing=true;
26) В Hive можете ли да презапишете конфигурацията на Hadoop MapReduce в Hive?
Да, можете да презапишете конфигурацията на Hadoop MapReduce в Hive.
27) Обяснете как можете да промените тип данни в колона в Hive?
Можете да промените тип данни на колона в Hive, като използвате командата,
ALTER TABLE table_name CHANGE column_name column_name new_datatype;
28) Споменете каква е разликата между подреждане по и сортиране по в Hive?
- SORT BY ще сортира данните във всеки редуктор. Можете да използвате произволен брой редуктори за операция СОРТИРАНЕ ПО.
- ORDER BY ще сортира всички данни заедно, които трябва да преминат през един редуктор. По този начин ORDER BY в кошера използва единичен
29) Обяснете кога да използвате explode в Hive?
Разработчиците на Hadoop понякога приемат масив като вход и преобразувайте в отделен ред на таблица. За да преобразувате сложни типове данни в желани таблични формати, Hive използвайте explode.
30) Споменете как можете да спрете запитването на формуляр за дял?
Можете да спрете запитването на формуляр за дял, като използвате клаузата ENABLE OFFLINE с израза ALTER TABLE.
Тези въпроси за интервю също ще ви помогнат във вашия viva(orals). Обърнете се към нашите Уроци по Hive за допълнително предимство във вашето интервю.
Много е полезно……..полезно……..полезно за подготовка за интервю, както и за самоподготовка.
Благодаря ви! Много е полезно!
Мисля, че може би можете да добавите някои въпроси относно „изкривяването на данните“, тъй като обикновено ме караха да отговоря на тези въпроси, когато бях интервюиращ.
моля, добавете въпроси за интервю, които сте задали