Las 13 mejores preguntas y respuestas de la entrevista de Apache Storm

Preguntas de la entrevista de tormenta

Aquí hay preguntas y respuestas de la entrevista de Apache Storm para principiantes y candidatos a desarrolladores experimentados para obtener el trabajo de sus sueños.

Descarga gratuita de PDF: Preguntas de la entrevista sobre Apache Storm


1) Explique ¿Qué es Apache Storm? ¿Cuáles son los componentes de Storm?

Apache Storm es un sistema de computación en tiempo real distribuido de código abierto que se utiliza para procesar análisis de big data en tiempo real. A diferencia de Hadoop procesamiento por lotes, Apache Storm lo hace para el procesamiento en tiempo real y se puede usar con cualquier lenguaje de programación.

Los componentes de Apache Storm incluyen

  • Nimbo: Funciona como Job Tracker de Hadoop. Distribuye el código en el clúster, carga el cómputo para su ejecución, asigna trabajadores en el clúster y supervisa el cómputo y reasigna a los trabajadores según sea necesario.
  • Guardián del zoológico: Se utiliza como mediador para la comunicación con Storm Cluster.
  • Supervisor: Interactúa con Nimbus a través de Zookeeper, dependiendo de las señales recibidas de Nimbus, ejecuta el proceso.

2) ¿Por qué Apache Storm es la primera opción para el procesamiento en tiempo real?

  • Fácil de operar: Tormenta operativa es tranquila fácil
  • Realmente rápido: Puede procesar 100 mensajes por segundo por nodo
  • Tolerante a fallos: Detecta la falla automáticamente y reinicia los atributos funcionales
  • De confianza: Garantiza que cada unidad de datos se ejecutará al menos una vez o exactamente una vez
  • Escalable: Se ejecuta a través de un grupo de máquinas

3) Explique cómo fluyen los datos en Apache Storm.

En Apache Storm, los datos son un flujo de flujo con tres componentes Caño, Perno y Tupla

  • Canalón: Un spout es una fuente de datos en Storm
  • Tornillo: Un perno procesa estos datos
  • Tupla: Los datos se pasan como tupla

4) Mencione cuál es la diferencia entre Apache Hbase y Storm.

                           Tormenta de Apache                               Base de Apache
  • Proporciona procesamiento de datos en tiempo real.
  • Procesa los datos pero no los almacena.
  • Optimizará sus datos donde los datos se procesan en tiempo real, de modo que se puedan generar alertas y acciones si es necesario
  •  Le ofrece lecturas de baja latencia de los datos procesados ​​para consultarlos más tarde.
  • Almacena los datos pero no almacena

5) Explique cómo puede optimizar los archivos de registro con Apache Storm.

Para leer de los archivos de registro, puede configurar su canalón y emitir por línea a medida que lee el registro. Luego, la salida se puede asignar a un perno para su análisis.

Preguntas de la entrevista de Apache Storm
Preguntas de la entrevista de Apache Storm

6) Explique qué son las secuencias y la agrupación de secuencias en Apache Storm.

En Apache Storm, la secuencia se denomina grupo o secuencia ilimitada de tuplas, mientras que la agrupación de secuencias determina cómo se debe dividir la secuencia entre las tareas del perno.


7) ¿Enumere diferentes agrupaciones de flujo en Apache Storm?

  • Agrupación aleatoria
  • Agrupación de campos
  • Agrupación mundial
  • toda la agrupación
  • Ninguna agrupación
  • Agrupación directa
  • Agrupación local

8) ¿Mencione cómo la aplicación de la tormenta puede ser beneficiosa en los servicios financieros?

En los servicios financieros, Storm puede ser útil para prevenir

  • Fraude de seguridad
  • Enrutamiento de pedidos
  • Precios
  • Violaciones de cumplimiento
Preguntas de la entrevista de tormenta
Preguntas de la entrevista de tormenta

9) Explique qué es Topology_Message_Timeout_secs en Apache Storm.

La cantidad máxima de tiempo asignada a la topología para procesar completamente un mensaje emitido por un spout. Si el mensaje no se reconoce en el marco de tiempo dado, la tormenta Apache fallará el mensaje en el canal.


10) Explique cómo se procesa completamente el mensaje en Apache Storm.

Llamando al siguienteTupla procedimiento o método en Spout, Storm solicita una tupla de Spout. El Spout aprovecha la SpoutputputColector dado en el habiertos método para descargar una tupla a uno de sus flujos de salida. Mientras descarga una tupla, el canalón asigna una "identificación de mensaje" que se utilizará para reconocer la tupla más adelante. Después de eso, la tupla se envía a los pernos de consumo y la tormenta se encarga de rastrear el árbol de mensajes que se produce.

Si la tormenta está segura de que una tupla se procesa a fondo, entonces puede llamar al acuse de recibo procedimiento sobre el origen canalón tarea con la identificación del mensaje que Spout le ha dado a Storm.


11) ¿Explicar cómo escribir la salida en un archivo usando Storm?

En Spout, cuando esté leyendo un archivo, haga Objeto FileReader in Abierto() método, como tal, ese momento inicializa el objeto del lector para el nodo de trabajo. Y usa ese objeto en el método nextTuple().


12) Mencione cuál es la diferencia entre Apache Kafka y Apache Storm.

  • Apache Kafka: Es un sistema de mensajería robusto y distribuido que puede manejar una gran cantidad de datos y permite el paso de mensajes de un punto final a otro.
  • Tormenta apache: Es un sistema de procesamiento de mensajes en tiempo real y puede editar o manipular datos en tiempo real. Apache Storm extrae los datos de Kafka y aplica alguna manipulación requerida.

13) Explique cuando se usa la agrupación de campos en tormenta, ¿hay algún tiempo de espera o límite para los valores de campo conocidos?

La agrupación de campos en Storm utiliza una función hash mod para decidir a qué tarea enviar una tupla, lo que garantiza que la tarea se procesará en el orden correcto. Para eso, no necesitas ningún caché. Por lo tanto, no hay tiempo de espera ni límite para los valores de campo conocidos.

Estas preguntas de la entrevista también te ayudarán en tu viva(oral). Consulte nuestro Tutoriales de Apache para una ventaja adicional en su entrevista.

Compartir

un comentario

  1. Avatar Anatoly Agulnik dice:

    La respuesta para el #11 es incorrecta. La respuesta es sobre leer de un archivo, pero la pregunta es sobre escribir en un archivo.

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *