13 Pertanyaan dan Jawaban Wawancara Apache Storm Teratas
Pertanyaan Wawancara Badai
Berikut adalah pertanyaan dan jawaban wawancara Apache Storm untuk kandidat pengembang baru dan berpengalaman untuk mendapatkan pekerjaan impian mereka.
Unduh PDF Gratis: Pertanyaan Wawancara Apache Storm
1) Jelaskan apa itu Apache Storm? Apa saja komponen Storm?
Apache storm adalah sistem komputasi real-time terdistribusi open source yang digunakan untuk memproses analisis data besar secara real-time. Berbeda dengan Hadoop pemrosesan batch, Apache storm melakukan pemrosesan real-time dan dapat digunakan dengan bahasa pemrograman apa pun.
Komponen Apache Storm meliputi
- Nimbus: Ia berfungsi sebagai Pelacak Pekerjaan Hadoop. Ini mendistribusikan kode di seluruh cluster, mengunggah komputasi untuk dieksekusi, mengalokasikan pekerja di seluruh cluster dan memantau komputasi dan mengalokasikan kembali pekerja sesuai kebutuhan
- Penjaga kebun binatang: Ini digunakan sebagai mediator untuk komunikasi dengan Storm Cluster
- Pembimbing: Berinteraksi dengan Nimbus melalui Zookeeper, bergantung pada sinyal yang diterima dari Nimbus, ia menjalankan prosesnya.
2) Mengapa Apache Storm menjadi pilihan pertama untuk Pemrosesan Waktu Nyata?
- Mudah dioperasikan: Mengoperasikan badai cukup mudah
- Sangat cepat: Itu dapat memproses 100 pesan per detik per node
- Toleransi Kesalahan: Ini mendeteksi kesalahan secara otomatis dan memulai kembali atribut fungsional
- terpercaya: Ini menjamin bahwa setiap unit data akan dieksekusi setidaknya satu kali atau tepat satu kali
- Dapat diukur: Ini berjalan melintasi sekelompok mesin
3) Jelaskan bagaimana aliran data mengalir di Apache Storm?
Di Apache storm, data adalah aliran aliran dengan tiga komponen Cerat, Baut dan Tupel
- Menyemburkan: Cerat adalah sumber data di Storm
- Baut: Sebuah baut memproses data ini
- Tupel: Data diteruskan sebagai Tuple
4) Sebutkan apa perbedaan antara Apache Hbase dan Storm?
Badai Apache | apache hbase |
|
|
5) Jelaskan bagaimana Anda dapat merampingkan file log menggunakan Apache storm?
Untuk membaca dari file log, Anda dapat mengkonfigurasi file menyemburkan dan memancarkan per baris saat membaca log. Outputnya kemudian dapat ditetapkan ke baut untuk dianalisis.
6) Jelaskan apa itu aliran dan pengelompokan aliran di Apache storm?
Di Apache Storm, aliran disebut sebagai grup atau rangkaian Tupel tak terbatas sementara pengelompokan aliran menentukan bagaimana aliran harus dipartisi di antara tugas-tugas baut.
7) Sebutkan pengelompokan aliran yang berbeda di Apache storm?
- Pengelompokan acak
- Pengelompokan bidang
- Pengelompokan global
- Semua pengelompokan
- Tidak ada pengelompokan
- Pengelompokan langsung
- Pengelompokan lokal
8) Sebutkan bagaimana penerapan storm dapat bermanfaat dalam jasa keuangan?
Di bidang jasa keuangan, Storm dapat membantu dalam pencegahan
- Penipuan sekuritas
- Perutean pesanan
- Harga
- Pelanggaran Kepatuhan
9) Jelaskan apa itu Topology_Message_Timeout_secs di Apache Storm?
Jumlah waktu maksimum yang diberikan kepada topologi untuk sepenuhnya memproses pesan yang dikeluarkan oleh spout. Jika pesan tidak diterima dalam jangka waktu tertentu, Apache storm akan menggagalkan pesan di spout.
10) Jelaskan bagaimana pesan diproses sepenuhnya di Apache Storm?
Dengan menelepon berikutnyaTuple prosedur atau metode pada Spout, Storm meminta tuple dari Spout. Cerat memanfaatkan Kolektor Keluaran Cerat diberikan dalam Buka metode untuk melepaskan tupel ke salah satu aliran keluarannya. Saat mengeluarkan tupel, Menyemburkan mengalokasikan "id pesan" yang akan digunakan untuk mengenali tupel nanti. Setelah itu, tupel dikirim ke baut pemakan, dan storm mengambil alih pelacakan pohon pesan yang dihasilkan.
Jika badai yakin bahwa tupel diproses secara menyeluruh, maka badai dapat memanggil ack prosedur asal Menyemburkan tugas dengan id pesan yang diberikan Spout kepada Storm.
11) Jelaskan cara menulis Output ke dalam file menggunakan Storm?
Di Spout, saat Anda membaca file, buatlah objek FileReader in Membuka() metode, sehingga waktu menginisialisasi objek pembaca untuk node pekerja. Dan gunakan objek itu dalam metode nextTuple().
12) Sebutkan apa perbedaan antara Apache Kafka dan Apache Storm?
- Apache Kafka: Ini adalah sistem pesan terdistribusi dan kuat yang dapat menangani data dalam jumlah besar dan memungkinkan penyampaian pesan dari satu titik akhir ke titik akhir lainnya.
- Badai Apache: Ini adalah sistem pemrosesan pesan waktu nyata, dan Anda dapat mengedit atau memanipulasi data secara waktu nyata. Apache storm mengambil data dari Kafka dan menerapkan beberapa manipulasi yang diperlukan.
13) Jelaskan ketika menggunakan pengelompokan lapangan dalam badai, apakah ada batas waktu atau batasan untuk nilai lapangan yang diketahui?
Pengelompokan bidang di storm menggunakan fungsi hash mod untuk memutuskan tugas mana yang akan dikirim tuple, memastikan tugas mana yang akan diproses dalam urutan yang benar. Untuk itu, Anda tidak memerlukan cache apa pun. Jadi, tidak ada batas waktu atau batasan untuk nilai bidang yang diketahui.
Pertanyaan wawancara ini juga akan membantu dalam viva (lisan) Anda. Rujuk kami Tutorial Apache untuk keunggulan ekstra dalam wawancara Anda.
Jawaban untuk #11 salah. Jawabannya adalah tentang membaca dari suatu file tetapi pertanyaannya adalah tentang menulis ke dalam file