Las 14 preguntas y respuestas principales de la entrevista de Kafka (2024)

Aquí hay preguntas y respuestas de la entrevista de Kafka para principiantes y candidatos experimentados para obtener el trabajo de sus sueños.


1) Menciona ¿Qué es Apache Kafka?

Apache Kafka es un sistema de mensajería de publicación y suscripción desarrollado por Apache escrito en Scala. Es un servicio de registro distribuido, particionado y replicado.

Descarga gratuita de PDF: Preguntas y respuestas de la entrevista de Kafka


2) Mencione ¿cuál es el método tradicional de transferencia de mensajes?

El método tradicional de transferencia de mensajes incluye dos métodos

  • Cola: En una cola, un grupo de consumidores puede leer un mensaje del servidor y cada mensaje va a uno de ellos.
  • Publicar-Suscribir: En este modelo, los mensajes se transmiten a todos los consumidores.

Kafka atiende a la abstracción de un solo consumidor que generaliza los dos anteriores: el grupo de consumidores.


3) Mencione cuáles son los beneficios de Apache Kafka sobre la técnica tradicional.

Apache Kafka tiene los siguientes beneficios por encima de la técnica de mensajería tradicional

  • Rápido: Un solo bróker de Kafka puede atender a miles de clientes manejando megabytes de lecturas y escrituras por segundo
  • Escalable: Los datos se dividen y optimizan en un grupo de máquinas para permitir datos más grandes
  • Durable: Los mensajes son persistentes y se replican dentro del clúster para evitar la pérdida de datos
  • Distribuido por Diseño: Proporciona garantías de tolerancia a fallas y durabilidad.

4) Mencione ¿cuál es el significado de corredor en Kafka?

En el clúster de Kafka, el término intermediario se usa para hacer referencia al servidor.


5) Mencione cuál es el tamaño máximo del mensaje que puede recibir el servidor Kafka.

El tamaño máximo del mensaje que puede recibir el servidor Kafka es de 1000000 bytes.

Preguntas de la entrevista de Kafka
Preguntas de la entrevista de Kafka

6) Explica qué es Zookeeper en Kafka. ¿Podemos usar Kafka sin Zookeeper?

Zookeeper es un servicio de coordinación de código abierto y alto rendimiento que se utiliza para aplicaciones distribuidas adaptadas por Kafka. No, no es posible pasar por alto a Zookeeper y conectarse directamente al corredor de Kafka. Una vez que Zookeeper está inactivo, no puede atender la solicitud del cliente.

  • Zookeeper se usa básicamente para comunicarse entre diferentes nodos en un clúster
  • En Kafka, se usa para confirmar el desplazamiento, por lo que si el nodo falla en cualquier caso, se puede recuperar del desplazamiento confirmado previamente.
  • Aparte de esto también realiza otras actividades como detección de líder, sincronización distribuida, gestión de configuración, identifica cuando un nuevo nodo se va o se une, el clúster, el estado del nodo en tiempo real, etc.

7) Explique cómo el consumidor consume el mensaje en Kafka.

La transferencia de mensajes en Kafka se realiza mediante sendfile API. Permite la transferencia de bytes desde el socket al disco a través de copias de ahorro de espacio del kernel y llamadas entre el usuario del kernel y el kernel.


8) Explique cómo puede mejorar el rendimiento de un consumidor remoto.

Si el consumidor está ubicado en un centro de datos diferente al del corredor, es posible que deba ajustar el tamaño del búfer del socket para amortizar la larga latencia de la red.

Preguntas de la entrevista de Apache Kafka
Preguntas de la entrevista de Apache Kafka

9) Explique cómo puede obtener mensajes de Kafka exactamente una vez durante la producción de datos.

Durante la producción de datos, para obtener exactamente una vez los mensajes de Kafka, debe seguir dos cosas evitar duplicados durante el consumo de datos y evitando la duplicación durante la producción de datos. Estas son las dos formas de obtener exactamente una semántica durante la producción de datos:

  1. Aproveche un solo escritor por partición, cada vez que obtenga un error de red, verifique el último mensaje en esa partición para ver si su última escritura tuvo éxito
  2. En el mensaje, incluya una clave principal (UUID o algo así) y elimine los duplicados en el consumidor

10) Explique cómo puede reducir la rotación en ISR. ¿Cuándo sale el broker de la ISR?

ISR es un conjunto de réplicas de mensajes que están completamente sincronizados con los líderes, en otras palabras, ISR tiene todos los mensajes que están comprometidos. ISR siempre debe incluir todas las réplicas hasta que haya una falla real. Una réplica se eliminará de ISR si se desvía del líder.


11) ¿Por qué se requiere replicación en Kafka?

La replicación del mensaje en Kafka garantiza que ningún mensaje publicado se pierda y pueda consumirse en caso de error de la máquina, error del programa o actualizaciones de software más comunes.


12) ¿Qué indica si la réplica permanece fuera de ISR durante mucho tiempo?

Si una réplica permanece fuera de ISR durante un tiempo prolongado, indica que el seguidor no puede obtener datos tan rápido como los datos acumulados en el líder.


13) Menciona ¿Qué sucede si la réplica preferida no está en el ISR?

Si la réplica preferida no está en el ISR, el controlador no podrá moverse liderazgo a la réplica preferida.


14) ¿Es posible compensar el mensaje después de producirlo?

No puede hacer eso desde una clase que se comporta como un productor como en la mayoría de los sistemas de colas, su función es disparar y olvidar los mensajes. El intermediario hará el resto del trabajo, como el manejo adecuado de los metadatos con identificadores, compensaciones, etc. Como consumidor del mensaje, puede obtener la compensación de un intermediario de Kafka. Si miras en el consumidor simple clase, notará que obtiene Respuesta de búsqueda múltiple objetos que incluyen compensaciones como una lista. Además de eso, cuando itere el mensaje de Kafka, tendrá MensajeYDesplazamiento objetos que incluyen tanto el desplazamiento como el mensaje enviado.

Estas preguntas de la entrevista también te ayudarán en tu viva(orals)

Compartir

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *