Top 13 des questions et réponses de l'entretien d'Apache Storm

Questions d'entretien chez Storm

Voici les questions et réponses d'entretien avec Apache Storm pour les candidats développeurs débutants et expérimentés pour obtenir l'emploi de leurs rêves.

Téléchargement PDF gratuit : Questions d'entretien avec Apache Storm

1) Expliquez ce qu'est Apache Storm ? Quels sont les composants de Storm ?

Apache Storm est un système de calcul distribué en temps réel open source utilisé pour traiter des analyses de Big Data en temps réel. Contrairement à Hadoop traitement par lots, Apache Storm le fait pour le traitement en temps réel et peut être utilisé avec n'importe quel langage de programmation.

Les composants d'Apache Storm incluent

Nimbus: Il fonctionne comme un Job Tracker d'Hadoop. Il distribue le code sur le cluster, télécharge les calculs pour exécution, répartit les travailleurs sur le cluster, surveille les calculs et réaffecte les travailleurs selon les besoins.
Gardien de zoo : Il est utilisé comme médiateur pour la communication avec le Storm Cluster
Superviseur: Interagit avec Nimbus via Zookeeper, en fonction des signaux reçus du Nimbus, il exécute le processus.

2) Pourquoi Apache Storm est-il le premier choix pour le traitement en temps réel ?

Facile à utiliser: Le fonctionnement de la tempête est simple et silencieux
Très vite : Il peut traiter 100 messages par seconde et par nœud
Tolérance de panne: Il détecte automatiquement le défaut et redémarre les attributs fonctionnels
Fiable: Il garantit que chaque unité de données sera exécutée au moins une fois ou exactement une fois
Scalable: Il s'exécute sur un cluster de machines

3) Expliquez comment les données circulent dans Apache Storm ?

Dans Apache Storm, les données sont un flux avec trois composants Bec, Boulon et tuple

Bec: Un bec est une source de données dans Storm
Boulon: Un boulon traite ces données
Tuple : Les données sont transmises sous forme de Tuple

4) Mentionnez quelle est la différence entre Apache Hbase et Storm ?

Tempête Apache	base de données apache
Il permet le traitement des données en temps réel Il traite les données mais ne les stocke pas Vous rationaliserez vos données là où les données sont traitées en temps réel, afin que des alertes et des actions puissent être déclenchées si nécessaire	Il vous offre des lectures à faible latence des données traitées pour des requêtes ultérieures Il stocke les données mais ne stocke pas

5) Expliquez comment vous pouvez rationaliser les fichiers journaux à l'aide d'Apache Storm ?

Pour lire les fichiers journaux, vous pouvez configurer votre bec et émet par ligne lors de la lecture du journal. La sortie peut ensuite être attribuée à un boulon pour analyse.

Questions d'entretiens chez Apache Storm

6) Expliquez ce qu'est les flux et le regroupement de flux dans Apache Storm ?

Dans Apache Storm, le flux est appelé un groupe ou une séquence illimitée de tuples, tandis que le regroupement de flux détermine la manière dont le flux doit être partitionné entre les tâches du boulon.

7) Répertorier les différents regroupements de flux dans Apache Storm ?

Regroupement aléatoire
Regroupement de champs
Regroupement global
Tous les regroupements
Aucun regroupement
Regroupement direct
Regroupement local

8) Mentionnez en quoi l’application Storm peut être bénéfique dans les services financiers ?

Dans les services financiers, Storm peut être utile pour prévenir

Fraude en valeurs mobilières
Acheminement des commandes
Prix
Violations de conformité

9) Expliquez qu'est-ce que Topology_Message_Timeout_secs dans Apache Storm ?

Temps maximum alloué à la topologie pour traiter entièrement un message émis par un spout. Si le message n'est pas reconnu dans le délai imparti, Apache Storm fera échouer le message sur le bec.

10) Expliquez comment le message est entièrement traité dans Apache Storm ?

En appelant le suivantTuple procédure ou méthode sur le Spout, Storm demande un tuple au Spout. Le bec verseur profite du SpoutoutputCollector donné dans le ouvert méthode pour décharger un tuple vers l’un de ses flux de sortie. Lors de la décharge d'un tuple, le bec alloue un « identifiant de message » qui sera utilisé pour reconnaître le tuple ultérieurement. Après cela, le tuple est envoyé aux boulons consommateurs et Storm se charge de suivre l'arborescence des messages produite.

Si la tempête est sûre qu'un tuple est traité minutieusement, elle peut alors appeler le ack procédure sur l'origine bec tâche avec l'identifiant du message que le Spout a donné au Storm.

11) Expliquez comment écrire la sortie dans un fichier à l'aide de Storm ?

Dans Spout, lorsque vous lisez un fichier, faites Objet FileReader in Ouvrir() méthode, en tant que telle, à ce moment-là, elle initialise l'objet lecteur pour le nœud de travail. Et utilisez cet objet dans la méthode nextTuple().

12) Mentionnez quelle est la différence entre Apache Kafka et Apache Storm ?

Apache Kafka: Il s'agit d'un système de messagerie distribué et robuste qui peut gérer une énorme quantité de données et permettre le passage de messages d'un point final à un autre.
Tempête Apache : Il s'agit d'un système de traitement de messages en temps réel et vous pouvez modifier ou manipuler des données en temps réel. Apache Storm extrait les données de Kafka et applique certaines manipulations requises.

13) Expliquez que lors de l'utilisation du regroupement de champs en cas de tempête, existe-t-il un délai d'attente ou une limite pour les valeurs de champ connues ?

Le regroupement de champs dans Storm utilise une fonction de hachage de mod pour décider à quelle tâche envoyer un tuple, garantissant ainsi quelle tâche sera traitée dans le bon ordre. Pour cela, vous n'avez besoin d'aucun cache. Ainsi, il n’y a pas de délai d’attente ni de limite aux valeurs de champ connues.

Ces questions d'entretien vous aideront également dans votre soutenance (orale). Référez-vous à notre Tutoriels Apache pour un avantage supplémentaire dans votre entretien.

Tu pourrais aimer: