13 главных вопросов и ответов на собеседовании по Apache Storm

Вопросы для собеседования

Вот вопросы и ответы на собеседовании Apache Storm для новичков, а также для опытных кандидатов-разработчиков, желающих получить работу своей мечты.

Бесплатная загрузка PDF-файла: Вопросы для собеседования по Apache Storm


1) Объясните, что такое Apache Storm? Каковы компоненты Storm?

Apache Storm — это распределенная система вычислений в реальном времени с открытым исходным кодом, используемая для обработки анализа больших данных в реальном времени. В отличие от Hadoop Пакетная обработка, Apache Storm предназначен для обработки в реальном времени и может использоваться с любым языком программирования.

Компоненты Apache Storm включают в себя

  • Нимб: Он работает как трекер заданий Hadoop. Он распределяет код по кластеру, загружает вычисления для выполнения, распределяет исполнителей по кластеру, отслеживает вычисления и перераспределяет исполнителей по мере необходимости.
  • Работник зоопарка: Используется как посредник для связи с Грозовым скоплением.
  • Научный руководитель: Взаимодействует с Nimbus через Zookeeper, в зависимости от сигналов, полученных от Nimbus, выполняет процесс.

2) Почему Apache Storm является лучшим выбором для обработки в реальном времени?

  • Простота в эксплуатации: Операционный шторм тихий, легкий
  • Очень быстро: Он может обрабатывать 100 сообщений в секунду на узел.
  • Отказоустойчивой: Он автоматически обнаруживает неисправность и перезапускает функциональные атрибуты.
  • Надежность: Он гарантирует, что каждая единица данных будет выполнена хотя бы один раз или ровно один раз.
  • Масштабируемость: Он работает через кластер машин

3) Объясните, как поток данных передается в Apache Storm?

В Apache Storm данные представляют собой поток, состоящий из трех компонентов. Носик, Болт и Кортеж

  • Носик: Носик — источник данных в Storm.
  • Болт: Болт обрабатывает эти данные
  • Кортеж: Данные передаются как кортеж

4) Укажите, в чем разница между Apache Hbase и Storm?

                           Апач Шторм                               апач hbase
  • Обеспечивает обработку данных в режиме реального времени.
  • Он обрабатывает данные, но не сохраняет
  • Вы оптимизируете свои данные, поскольку данные обрабатываются в режиме реального времени, чтобы при необходимости можно было выдавать оповещения и действия.
  •  Он предлагает вам чтение обработанных данных с малой задержкой для последующего запроса.
  • Он хранит данные, но не сохраняет

5) Объясните, как можно оптимизировать файлы журналов с помощью Apache Storm?

Для чтения файлов журналов вы можете настроить носик и выдавать построчно при чтении журнала. Затем выходные данные можно назначить болту для анализа.

Вопросы для собеседования по Apache Storm
Вопросы для собеседования по Apache Storm

6) Объясните, что такое потоки и группировка потоков в Apache Storm?

В Apache Storm поток называется группой или неограниченной последовательностью кортежей, а группировка потоков определяет, как поток должен быть разделен между задачами болта.


7) Перечислить различные группы потоков в Apache Storm?

  • Случайная группировка
  • Группировка полей
  • Глобальная группировка
  • Все группировки
  • Нет группировки
  • Прямая группировка
  • Локальная группировка

8) Упомяните, какую пользу штормовые приложения могут принести в сфере финансовых услуг?

В сфере финансовых услуг Storm может помочь предотвратить

  • Мошенничество с ценными бумагами
  • Маршрутизация заказов
  • Цены
  • Нарушения соответствия
Вопросы для собеседования
Вопросы для собеседования

9) Объясните, что такое Topology_Message_Timeout_secs в Apache Storm?

Максимальное количество времени, отведенное топологии для полной обработки сообщения, выпущенного потоком. Если сообщение не подтверждено в заданный период времени, Apache Storm не сможет передать сообщение в поток.


10) Объясните, как сообщение полностью обрабатывается в Apache Storm?

Позвонив в следующийКортеж процедуру или метод в Spout, Storm запрашивает кортеж из Spout. Носик использует НосикВыходКоллектор дано в открытый метод для выгрузки кортежа в один из его выходных потоков. При выгрузке кортежа носик выделяет «идентификатор сообщения», который будет использоваться для распознавания кортежа позже. После этого кортеж отправляется в потребляющие болты, а Storm берет на себя отслеживание создаваемого дерева сообщений.

Если Storm уверен, что кортеж обработан тщательно, он может вызвать метод ACK процедура возникновения носик задача с идентификатором сообщения, который Spout передал Storm.


11) Объясните, как записать вывод в файл с помощью Storm?

В Spout, когда вы читаете файл, сделайте Объект FileReader in Открыть() метод, как таковой, когда он инициализирует объект чтения для рабочего узла. И используйте этот объект в методе nextTuple().


12) Укажите, в чем разница между Apache Kafka и Apache Storm?

  • Апач Кафка: Это распределенная и надежная система обмена сообщениями, которая может обрабатывать огромные объемы данных и обеспечивает передачу сообщений от одной конечной точки к другой.
  • Апач Шторм: Это система обработки сообщений в реальном времени, и вы можете редактировать или манипулировать данными в реальном времени. Apache Storm извлекает данные из Kafka и применяет некоторые необходимые манипуляции.

13) Объясните, есть ли какой-либо тайм-аут или ограничение на известные значения полей при использовании группировки полей в Storm?

Группировка полей в Storm использует хеш-функцию мода, чтобы решить, какую задачу отправить кортеж, гарантируя, что какая задача будет обработана в правильном порядке. Для этого вам не нужен кэш. Таким образом, нет тайм-аута или ограничения на известные значения полей.

Эти вопросы на собеседовании также помогут вам в устной речи. Обратитесь к нашим Учебники по Apache для дополнительного преимущества на собеседовании.

Поделиться

Один комментарий

  1. Аватара Анатолий Агульник говорит:

    Ответ на № 11 неверен. Ответ про чтение из файла, а вопрос про запись в файл.

Оставьте комментарий

Ваш электронный адрес не будет опубликован. Обязательные поля помечены * *