คำถามและคำตอบสัมภาษณ์ Apache Storm 13 อันดับแรก
คำถามสัมภาษณ์พายุ
ต่อไปนี้เป็นคำถามและคำตอบในการสัมภาษณ์ Apache Storm สำหรับนักศึกษาใหม่และผู้สมัครนักพัฒนาที่มีประสบการณ์เพื่อรับงานในฝัน
ดาวน์โหลดไฟล์ PDF ฟรี: คำถามสัมภาษณ์ Apache Storm
1) อธิบายว่า Apache Storm คืออะไร? ส่วนประกอบของ Storm คืออะไร?
Apache Storm เป็นระบบคำนวณแบบเรียลไทม์แบบกระจายโอเพ่นซอร์สที่ใช้สำหรับการประมวลผลการวิเคราะห์ข้อมูลขนาดใหญ่แบบเรียลไทม์ ไม่เหมือน Hadoop การประมวลผลเป็นชุด Apache storm ใช้สำหรับการประมวลผลแบบเรียลไทม์และสามารถใช้กับภาษาการเขียนโปรแกรมใดก็ได้
ส่วนประกอบของ Apache Storm ประกอบด้วย
- เมฆฝน: มันทำงานเหมือน Job Tracker ของ Hadoop โดยกระจายโค้ดทั่วทั้งคลัสเตอร์ อัปโหลดการคำนวณเพื่อดำเนินการ จัดสรรผู้ปฏิบัติงานทั่วทั้งคลัสเตอร์ และตรวจสอบการคำนวณ และจัดสรรผู้ปฏิบัติงานใหม่ตามความจำเป็น
- ผู้ดูแลสวนสัตว์: มันถูกใช้เป็นสื่อกลางในการสื่อสารกับ Storm Cluster
- หัวหน้างาน: โต้ตอบกับ Nimbus ผ่าน Zookeeper โดยขึ้นอยู่กับสัญญาณที่ได้รับจาก Nimbus มันจึงดำเนินการตามกระบวนการ
2) เหตุใด Apache Storm จึงเป็นตัวเลือกแรกสำหรับการประมวลผลแบบเรียลไทม์
- ง่ายต่อการทำงาน: พายุปฏิบัติการก็เงียบง่าย
- เร็วจริง: สามารถประมวลผลข้อความได้ 100 ข้อความต่อวินาทีต่อโหนด
- ทนต่อความผิดพลาด: โดยจะตรวจจับข้อผิดพลาดโดยอัตโนมัติและรีสตาร์ทคุณลักษณะการทำงานอีกครั้ง
- ความน่าเชื่อถือ: รับประกันว่าข้อมูลแต่ละหน่วยจะถูกดำเนินการอย่างน้อยหนึ่งครั้งหรือครั้งเดียว
- ขยายขีดความสามารถ: มันวิ่งข้ามกลุ่มของเครื่องจักร
3) อธิบายว่ากระแสข้อมูลไหลใน Apache Storm อย่างไร
ใน Apache Storm ข้อมูลจะเป็นสตรีมโฟลว์ที่มีองค์ประกอบ 3 ส่วน พวย, โบลท์ ที่ ทูเพิล
- พวย: พวยกาเป็นแหล่งข้อมูลใน Storm
- สายฟ้า: โบลต์จะประมวลผลข้อมูลเหล่านี้
- ทูเปิล: ข้อมูลถูกส่งผ่านเป็น Tuple
4) พูดถึงความแตกต่างระหว่าง Apache Hbase และ Storm คืออะไร?
พายุอาปาเช่ | apache hbase |
|
|
5) อธิบายว่าคุณสามารถปรับปรุงไฟล์บันทึกโดยใช้ Apache storm ได้อย่างไร
หากต้องการอ่านจากไฟล์บันทึกคุณสามารถกำหนดค่าของคุณได้ พวย และปล่อยต่อบรรทัดในขณะที่อ่านบันทึก จากนั้นสามารถกำหนดเอาต์พุตให้กับโบลต์เพื่อการวิเคราะห์ได้
6) อธิบายว่าสตรีมคืออะไรและการจัดกลุ่มสตรีมใน Apache Storm
ใน Apache Storm สตรีมจะถูกเรียกว่ากลุ่มหรือลำดับที่ไม่จำกัดของ Tuples ในขณะที่การจัดกลุ่มสตรีมจะกำหนดว่าสตรีมควรถูกแบ่งพาร์ติชันระหว่างงานของ bolt อย่างไร
7) แสดงรายการการจัดกลุ่มสตรีมที่แตกต่างกันใน Apache storm?
- การจัดกลุ่มแบบสุ่ม
- การจัดกลุ่มฟิลด์
- การจัดกลุ่มทั่วโลก
- การจัดกลุ่มทั้งหมด
- ไม่มีการจัดกลุ่ม
- การจัดกลุ่มโดยตรง
- การจัดกลุ่มท้องถิ่น
8) กล่าวถึงการประยุกต์ใช้ Storm ให้เกิดประโยชน์ในบริการทางการเงินได้อย่างไร
ในบริการทางการเงิน Storm จะมีประโยชน์ในการป้องกัน
- การฉ้อโกงหลักทรัพย์
- เส้นทางการสั่งซื้อ
- ราคา
- การละเมิดการปฏิบัติตามข้อกำหนด
9) อธิบายว่า Topology_Message_Timeout_secs ใน Apache Storm คืออะไร
ระยะเวลาสูงสุดที่จัดสรรให้กับโทโพโลยีเพื่อประมวลผลข้อความที่เผยแพร่โดยพวยกาอย่างเต็มที่ หากข้อความไม่ได้รับการยอมรับในกรอบเวลาที่กำหนด Apache Storm จะทำให้ข้อความบนพวยกาล้มเหลว
10) อธิบายว่าข้อความได้รับการประมวลผลอย่างสมบูรณ์ใน Apache Storm อย่างไร
โดยการโทรไปที่ ต่อไปทูเพิล ขั้นตอนหรือวิธีการบน Spout นั้น Storm จะร้องขอสิ่งอันดับจาก Spout Spout มีประโยชน์ นักสะสมพวยกา ให้ไว้ในไฟล์ เปิด วิธีการปลดประจำการทูเปิลไปยังสตรีมเอาท์พุตอันใดอันหนึ่ง ในขณะที่ทำการปลดปล่อยสิ่งอันดับ พวย จัดสรร "รหัสข้อความ" ที่จะใช้เพื่อจดจำทูเพิลในภายหลัง หลังจากนั้นทูเพิลจะถูกส่งไปยังโบลต์ที่ใช้งาน และสตอร์มจะทำหน้าที่ติดตามแผนผังข้อความที่สร้างขึ้น
หากพายุมั่นใจว่าทูเพิลได้รับการประมวลผลอย่างละเอียด ก็สามารถเรียก แอ๊ ขั้นตอนในการกำเนิด พวย งานที่มีรหัสข้อความที่ Spout มอบให้กับ Storm
11) อธิบายวิธีการเขียน Output ลงในไฟล์โดยใช้ Storm?
ใน Spout เมื่อคุณกำลังอ่านไฟล์ ให้ทำ วัตถุ FileReader in เปิด() วิธีการดังกล่าวจะเริ่มต้นวัตถุตัวอ่านสำหรับโหนดผู้ปฏิบัติงาน และใช้วัตถุนั้นในเมธอด nextTuple()
12) พูดถึงความแตกต่างระหว่าง Apache Kafka และ Apache Storm คืออะไร?
- Apache Kafka: เป็นระบบส่งข้อความแบบกระจายและมีประสิทธิภาพซึ่งสามารถจัดการข้อมูลจำนวนมหาศาลและอนุญาตให้ส่งข้อความจากจุดสิ้นสุดหนึ่งไปยังอีกจุดหนึ่งได้
- อาปาเช่สตอร์ม: เป็นระบบประมวลผลข้อความแบบเรียลไทม์ และคุณสามารถแก้ไขหรือจัดการข้อมูลได้แบบเรียลไทม์ Apache Storm ดึงข้อมูลจาก Kafka และใช้การจัดการที่จำเป็นบางอย่าง
13) อธิบายเมื่อใช้การจัดกลุ่มฟิลด์ใน Storm มีการหมดเวลาหรือจำกัดค่าฟิลด์ที่ทราบหรือไม่
การจัดกลุ่มฟิลด์ใน Storm ใช้ฟังก์ชันแฮช mod เพื่อตัดสินใจว่าจะส่งทูเปิลงานใด เพื่อให้แน่ใจว่างานใดจะได้รับการประมวลผลในลำดับที่ถูกต้อง เพื่อสิ่งนั้น คุณไม่จำเป็นต้องมีแคชใดๆ ดังนั้นจึงไม่มีการหมดเวลาหรือจำกัดค่าฟิลด์ที่ทราบ
คำถามสัมภาษณ์เหล่านี้จะช่วยในวีว่าของคุณ (วาจา) อ้างอิงของเรา บทช่วยสอนของ Apache เพื่อเพิ่มความได้เปรียบในการสัมภาษณ์ของคุณ
คำตอบสำหรับ #11 ไม่ถูกต้อง คำตอบคือเกี่ยวกับการอ่านจากไฟล์ แต่คำถามเกี่ยวกับการเขียนลงในไฟล์