Κορυφαίες 13 ερωτήσεις και απαντήσεις συνέντευξης στο Apache Storm
Ερωτήσεις συνέντευξης Storm
Ακολουθούν ερωτήσεις και απαντήσεις συνέντευξης στο Apache Storm για πρωτοετείς καθώς και έμπειρους υποψήφιους προγραμματιστές για να πάρουν τη δουλειά των ονείρων τους.
Δωρεάν λήψη PDF: Ερωτήσεις συνέντευξης στο Apache Storm
1) Εξηγήστε τι είναι το Apache Storm; Ποια είναι τα συστατικά του Storm;
Το Apache storm είναι ένα κατανεμημένο σύστημα υπολογισμού σε πραγματικό χρόνο ανοιχτού κώδικα που χρησιμοποιείται για την επεξεργασία αναλυτικών δεδομένων μεγάλων δεδομένων σε πραγματικό χρόνο. Διαφορετικός Hadoop μαζική επεξεργασία, το Apache storm κάνει για επεξεργασία σε πραγματικό χρόνο και μπορεί να χρησιμοποιηθεί με οποιαδήποτε γλώσσα προγραμματισμού.
Τα εξαρτήματα του Apache Storm περιλαμβάνουν
- Φωτεινό νέφος: Λειτουργεί ως Hadoop's Job Tracker. Διανέμει κώδικα σε όλο το σύμπλεγμα, ανεβάζει υπολογισμούς για εκτέλεση, κατανέμει εργαζομένους σε όλο το σύμπλεγμα και παρακολουθεί τον υπολογισμό και ανακατανέμει τους εργαζομένους όπως απαιτείται
- Ζωοφύλακας: Χρησιμοποιείται ως μεσολαβητής για την επικοινωνία με το Σμήνος Καταιγίδων
- Επόπτης: Αλληλεπιδρά με το Nimbus μέσω του Zookeeper, ανάλογα με τα σήματα που λαμβάνει από το Nimbus, εκτελεί τη διαδικασία.
2) Γιατί το Apache Storm είναι η πρώτη επιλογή για την επεξεργασία σε πραγματικό χρόνο;
- Εύκολος να λειτουργήσει: Η λειτουργία καταιγίδας είναι ήσυχη εύκολη
- Πραγματικά γρήγορα: Μπορεί να επεξεργαστεί 100 μηνύματα ανά δευτερόλεπτο ανά κόμβο
- Ανεκτικό σε σφάλματα: Ανιχνεύει αυτόματα το σφάλμα και επανεκκινεί τα λειτουργικά χαρακτηριστικά
- Αξιόπιστος: Εγγυάται ότι κάθε μονάδα δεδομένων θα εκτελεστεί τουλάχιστον μία φορά ή ακριβώς μία φορά
- Κλιμακούμενος: Διασχίζει ένα σύμπλεγμα μηχανών
3) Εξηγήστε πώς γίνεται η ροή δεδομένων στο Apache Storm;
Στη καταιγίδα Apache, τα δεδομένα είναι ροή ροής με τρία στοιχεία Στόμιο, Μπουλτ και Πλειάδα
- Στόμιο: Ένα στόμιο είναι μια πηγή δεδομένων στο Storm
- Μπουλόνι: Ένα μπουλόνι επεξεργάζεται αυτά τα δεδομένα
- Πλειάδα: Τα δεδομένα διαβιβάζονται ως πλειάδα
4) Αναφέρετε ποια είναι η διαφορά μεταξύ Apache Hbase και Storm;
Θύελλα Apache | apache hbase |
|
|
5) Εξηγήστε πώς μπορείτε να βελτιστοποιήσετε τα αρχεία καταγραφής χρησιμοποιώντας το Apache storm;
Για να διαβάσετε από τα αρχεία καταγραφής μπορείτε να ρυθμίσετε τις παραμέτρους σας στόμιο και εκπέμπει ανά γραμμή καθώς διαβάζει το αρχείο καταγραφής. Στη συνέχεια, η έξοδος μπορεί να αντιστοιχιστεί σε ένα μπουλόνι για ανάλυση.
6) Εξηγήστε τι είναι τα ρεύματα και η ομαδοποίηση ροών στο Apache storm;
Στο Apache Storm, η ροή αναφέρεται ως μια ομάδα ή μια απεριόριστη ακολουθία Πλειάδων, ενώ η ομαδοποίηση ροής καθορίζει τον τρόπο με τον οποίο η ροή πρέπει να κατανεμηθεί μεταξύ των εργασιών του μπουλονιού.
7) Καταγράψτε τη διαφορετική ομαδοποίηση ροών στο Apache storm;
- Τυχαία ομαδοποίηση
- Ομαδοποίηση πεδίων
- Παγκόσμια ομαδοποίηση
- Όλη η ομαδοποίηση
- Καμία ομαδοποίηση
- Άμεση ομαδοποίηση
- Τοπική ομαδοποίηση
8) Αναφέρετε πώς η εφαρμογή καταιγίδας μπορεί να είναι επωφελής στις χρηματοοικονομικές υπηρεσίες;
Στις χρηματοοικονομικές υπηρεσίες, το Storm μπορεί να βοηθήσει στην πρόληψη
- Απάτη κινητών αξιών
- Δρομολόγηση παραγγελίας
- Τιμοκατάλογος
- Παραβιάσεις συμμόρφωσης
9) Εξηγήστε τι είναι το Topology_Message_Timeout_secs στο Apache Storm;
Ο μέγιστος χρόνος που διατίθεται στην τοπολογία για την πλήρη επεξεργασία ενός μηνύματος που εκπέμπεται από ένα στόμιο. Εάν το μήνυμα δεν αναγνωριστεί σε δεδομένο χρονικό πλαίσιο, η καταιγίδα Apache θα αποτύχει στο μήνυμα στο στόμιο εκροής.
10) Εξηγήστε πώς γίνεται η πλήρης επεξεργασία του μηνύματος στο Apache Storm;
Καλώντας το nextTuple διαδικασία ή μέθοδο στο στόμιο, η Storm ζητά μια πλειάδα από το στόμιο. Το Στόμιο κάνει χρήση του SpoutoutputCollector δίνεται στο ανοίξτε μέθοδος εκφόρτισης μιας πλειάδας σε μια από τις ροές εξόδου της. Κατά την εκφόρτωση μιας πλειάδας, το Στόμιο εκχωρεί ένα "αναγνωριστικό μηνύματος" που θα χρησιμοποιηθεί για την αναγνώριση της πλειάδας αργότερα. Μετά από αυτό, η πλειάδα αποστέλλεται σε μπουλόνια κατανάλωσης και η καταιγίδα αναλαμβάνει την παρακολούθηση του δέντρου των μηνυμάτων που παράγεται.
Εάν η καταιγίδα είναι βέβαιη ότι μια πλειάδα υποβάλλεται σε πλήρη επεξεργασία, τότε μπορεί να καλέσει το ack διαδικασία για την προέλευση Στόμιο εργασία με το αναγνωριστικό μηνύματος που έχει δώσει το Spout στο Storm.
11) Εξηγήστε πώς να γράψετε το Output σε ένα αρχείο χρησιμοποιώντας το Storm;
Στο Spout, όταν διαβάζετε αρχείο, κάντε Αντικείμενο FileReader in Ανοιξε() μέθοδος, έτσι ώστε ο χρόνος να αρχικοποιεί το αντικείμενο ανάγνωσης για τον κόμβο εργάτη. Και χρησιμοποιήστε αυτό το αντικείμενο στη μέθοδο nextTuple().
12) Αναφέρετε ποια είναι η διαφορά μεταξύ του Apache Kafka και του Apache Storm;
- Apache Kafka: Είναι ένα κατανεμημένο και ισχυρό σύστημα ανταλλαγής μηνυμάτων που μπορεί να χειριστεί τεράστιο όγκο δεδομένων και επιτρέπει τη μετάβαση μηνυμάτων από το ένα τελικό σημείο στο άλλο.
- Καταιγίδα Απάτσι: Είναι ένα σύστημα επεξεργασίας μηνυμάτων σε πραγματικό χρόνο και μπορείτε να επεξεργαστείτε ή να χειριστείτε δεδομένα σε πραγματικό χρόνο. Η καταιγίδα Apache αντλεί τα δεδομένα από τον Κάφκα και εφαρμόζει κάποια απαιτούμενη χειραγώγηση.
13) Εξηγήστε όταν χρησιμοποιείτε ομαδοποίηση πεδίων σε καταιγίδα, υπάρχει κάποιο χρονικό όριο ή όριο σε γνωστές τιμές πεδίου;
Η ομαδοποίηση πεδίων στο storm χρησιμοποιεί μια συνάρτηση κατακερματισμού mod για να αποφασίσει ποια εργασία θα στείλει μια πλειάδα, διασφαλίζοντας ποια εργασία θα επεξεργαστεί με τη σωστή σειρά. Για αυτό, δεν χρειάζεστε καμία προσωρινή μνήμη. Επομένως, δεν υπάρχει χρονικό όριο ή όριο σε γνωστές τιμές πεδίου.
Αυτές οι ερωτήσεις συνέντευξης θα βοηθήσουν επίσης στο viva (προφορικά) σας. Αναφερθείτε μας Εκμάθηση Apache για ένα επιπλέον πλεονέκτημα στη συνέντευξή σας.
Η απάντηση για το #11 είναι λανθασμένη. Η απάντηση αφορά την ανάγνωση από ένα αρχείο, αλλά η ερώτηση αφορά την εγγραφή σε ένα αρχείο