13 главных вопросов и ответов на собеседовании по Apache Storm
Вопросы для собеседования
Вот вопросы и ответы на собеседовании Apache Storm для новичков, а также для опытных кандидатов-разработчиков, желающих получить работу своей мечты.
Бесплатная загрузка PDF-файла: Вопросы для собеседования по Apache Storm
1) Объясните, что такое Apache Storm? Каковы компоненты Storm?
Apache Storm — это распределенная система вычислений в реальном времени с открытым исходным кодом, используемая для обработки анализа больших данных в реальном времени. В отличие от Hadoop Пакетная обработка, Apache Storm предназначен для обработки в реальном времени и может использоваться с любым языком программирования.
Компоненты Apache Storm включают в себя
- Нимб: Он работает как трекер заданий Hadoop. Он распределяет код по кластеру, загружает вычисления для выполнения, распределяет исполнителей по кластеру, отслеживает вычисления и перераспределяет исполнителей по мере необходимости.
- Работник зоопарка: Используется как посредник для связи с Грозовым скоплением.
- Научный руководитель: Взаимодействует с Nimbus через Zookeeper, в зависимости от сигналов, полученных от Nimbus, выполняет процесс.
2) Почему Apache Storm является лучшим выбором для обработки в реальном времени?
- Простота в эксплуатации: Операционный шторм тихий, легкий
- Очень быстро: Он может обрабатывать 100 сообщений в секунду на узел.
- Отказоустойчивой: Он автоматически обнаруживает неисправность и перезапускает функциональные атрибуты.
- Надежность: Он гарантирует, что каждая единица данных будет выполнена хотя бы один раз или ровно один раз.
- Масштабируемость: Он работает через кластер машин
3) Объясните, как поток данных передается в Apache Storm?
В Apache Storm данные представляют собой поток, состоящий из трех компонентов. Носик, Болт и Кортеж
- Носик: Носик — источник данных в Storm.
- Болт: Болт обрабатывает эти данные
- Кортеж: Данные передаются как кортеж
4) Укажите, в чем разница между Apache Hbase и Storm?
Апач Шторм | апач hbase |
|
|
5) Объясните, как можно оптимизировать файлы журналов с помощью Apache Storm?
Для чтения файлов журналов вы можете настроить носик и выдавать построчно при чтении журнала. Затем выходные данные можно назначить болту для анализа.
6) Объясните, что такое потоки и группировка потоков в Apache Storm?
В Apache Storm поток называется группой или неограниченной последовательностью кортежей, а группировка потоков определяет, как поток должен быть разделен между задачами болта.
7) Перечислить различные группы потоков в Apache Storm?
- Случайная группировка
- Группировка полей
- Глобальная группировка
- Все группировки
- Нет группировки
- Прямая группировка
- Локальная группировка
8) Упомяните, какую пользу штормовые приложения могут принести в сфере финансовых услуг?
В сфере финансовых услуг Storm может помочь предотвратить
- Мошенничество с ценными бумагами
- Маршрутизация заказов
- Цены
- Нарушения соответствия
9) Объясните, что такое Topology_Message_Timeout_secs в Apache Storm?
Максимальное количество времени, отведенное топологии для полной обработки сообщения, выпущенного потоком. Если сообщение не подтверждено в заданный период времени, Apache Storm не сможет передать сообщение в поток.
10) Объясните, как сообщение полностью обрабатывается в Apache Storm?
Позвонив в следующийКортеж процедуру или метод в Spout, Storm запрашивает кортеж из Spout. Носик использует НосикВыходКоллектор дано в открытый метод для выгрузки кортежа в один из его выходных потоков. При выгрузке кортежа носик выделяет «идентификатор сообщения», который будет использоваться для распознавания кортежа позже. После этого кортеж отправляется в потребляющие болты, а Storm берет на себя отслеживание создаваемого дерева сообщений.
Если Storm уверен, что кортеж обработан тщательно, он может вызвать метод ACK процедура возникновения носик задача с идентификатором сообщения, который Spout передал Storm.
11) Объясните, как записать вывод в файл с помощью Storm?
В Spout, когда вы читаете файл, сделайте Объект FileReader in Открыть() метод, как таковой, когда он инициализирует объект чтения для рабочего узла. И используйте этот объект в методе nextTuple().
12) Укажите, в чем разница между Apache Kafka и Apache Storm?
- Апач Кафка: Это распределенная и надежная система обмена сообщениями, которая может обрабатывать огромные объемы данных и обеспечивает передачу сообщений от одной конечной точки к другой.
- Апач Шторм: Это система обработки сообщений в реальном времени, и вы можете редактировать или манипулировать данными в реальном времени. Apache Storm извлекает данные из Kafka и применяет некоторые необходимые манипуляции.
13) Объясните, есть ли какой-либо тайм-аут или ограничение на известные значения полей при использовании группировки полей в Storm?
Группировка полей в Storm использует хеш-функцию мода, чтобы решить, какую задачу отправить кортеж, гарантируя, что какая задача будет обработана в правильном порядке. Для этого вам не нужен кэш. Таким образом, нет тайм-аута или ограничения на известные значения полей.
Эти вопросы на собеседовании также помогут вам в устной речи. Обратитесь к нашим Учебники по Apache для дополнительного преимущества на собеседовании.
Ответ на № 11 неверен. Ответ про чтение из файла, а вопрос про запись в файл.