คำถามและคำตอบในการสัมภาษณ์ Ab initio 19 อันดับแรก (2025)
1) พูดถึง Abinitio คืออะไร?
“Abinitio” เป็นคำภาษาละติน แปลว่า “ตั้งแต่เริ่มต้น” Abinitio เป็นเครื่องมือที่ใช้ในการแยก แปลง และโหลดข้อมูล นอกจากนี้ยังใช้สำหรับการวิเคราะห์ข้อมูล การจัดการข้อมูล การประมวลผลแบบแบตช์ และการประมวลผลแบบขนานที่ใช้อินเทอร์เฟซผู้ใช้แบบกราฟิกดาวน์โหลดไฟล์ PDF ฟรี: คำถามและคำตอบการสัมภาษณ์ Ab initio
2) อธิบายว่าสถาปัตยกรรมของ Abinitio คืออะไร?
สถาปัตยกรรมของ Abinitio ประกอบด้วย- GDE (สภาพแวดล้อมการพัฒนากราฟิก)
- ร่วมกันระบบปฏิบัติการ
- สภาพแวดล้อมเมตาขององค์กร (EME)
- ดำเนินการไอที
3) กล่าวถึงบทบาทของระบบความร่วมมือใน Abinitio คืออะไร?
ระบบการทำงานร่วมกันของ Abinitio มีคุณสมบัติต่างๆ เช่น- จัดการและเรียกใช้กราฟ Abinitio และควบคุมกระบวนการ ETL
- จัดเตรียมส่วนขยาย Ab initio ให้กับระบบปฏิบัติการ
- ETL ประมวลผลการตรวจสอบและการดีบัก
- การจัดการข้อมูลเมตาและการโต้ตอบกับ EME
4) อธิบายว่าการวิเคราะห์การพึ่งพาหมายถึงอะไรใน Abinitio
ใน Ab initio การวิเคราะห์การพึ่งพาเป็นกระบวนการที่ EME ตรวจสอบโครงการทั้งหมด และติดตามวิธีการถ่ายโอนและแปลงข้อมูลจากส่วนประกอบหนึ่งไปยังอีกส่วนประกอบ ฟิลด์ต่อฟิลด์ ภายในและระหว่างกราฟ5) อธิบายว่า Abinitio EME ถูกแยกออกจากกันอย่างไร
Abbinition ถูกแบ่งออกเป็นสองส่วนตามหลักเหตุผล- ส่วนการรวมข้อมูล
- ส่วนต่อประสานกับผู้ใช้ (การเข้าถึงข้อมูลเมตาดาต้า)
6) พูดถึงว่าคุณสามารถเชื่อมต่อ EME กับเซิร์ฟเวอร์ Abinitio ได้อย่างไร
การเชื่อมต่อกับ Ab initio Server มีหลายวิธีดังนี้- ตั้งค่า AB_AIR_ROOT
- เข้าสู่ระบบเว็บอินเตอร์เฟส EME - http://serverhost:[serverport]/abinitio
- คุณสามารถเชื่อมต่อกับที่เก็บข้อมูล EME ผ่าน GDE
- ผ่านการสั่งการทางอากาศ
7) แสดงรายการนามสกุลไฟล์ที่ใช้ใน Abinitio?
นามสกุลไฟล์ที่ใช้ใน Abinitio คือ- .mp: เก็บกราฟ Ab เริ่มต้นหรือส่วนประกอบกราฟ
- .mpc: ส่วนประกอบหรือโปรแกรมแบบกำหนดเอง
- .mdc: ชุดข้อมูลหรือส่วนประกอบชุดข้อมูลที่กำหนดเอง
- .dml: ไฟล์ภาษาการจัดการข้อมูลหรือคำจำกัดความประเภทบันทึก
- .xfr: แปลงไฟล์ฟังก์ชัน
- .dat: ไฟล์ข้อมูล (หลายไฟล์หรือไฟล์อนุกรม)
8) ระบุว่านามสกุลไฟล์ .dbc ให้ข้อมูลใดบ้างในการเชื่อมต่อกับฐานข้อมูล
ส่วนขยาย .dbc ให้ข้อมูลแก่ GDE เพื่อเชื่อมต่อกับฐานข้อมูล- ชื่อและหมายเลขเวอร์ชันของฐานข้อมูลที่คุณต้องการเชื่อมต่อ
- ชื่อของคอมพิวเตอร์ที่อินสแตนซ์ฐานข้อมูลหรือเซิร์ฟเวอร์ที่คุณต้องการเชื่อมต่อทำงาน หรือที่ติดตั้งซอฟต์แวร์การเข้าถึงฐานข้อมูลระยะไกล
- ชื่อของเซิร์ฟเวอร์ อินสแตนซ์ฐานข้อมูล หรือผู้ให้บริการที่คุณต้องการลิงก์
9) อธิบายว่าคุณสามารถเรียกใช้กราฟอย่างไม่สิ้นสุดใน Ab initio ได้อย่างไร
หากต้องการรันกราฟอย่างไม่สิ้นสุด สคริปต์ส่วนท้ายของกราฟควรเรียกไฟล์ .ksh ของกราฟ ดังนั้น หากชื่อกราฟคือ abc.mp ดังนั้นในสคริปต์ท้ายสุดของกราฟ ก็ควรจะเรียกไปที่ abc.ksh สิ่งนี้จะทำให้กราฟทำงานอย่างไม่สิ้นสุด10) พูดถึงความแตกต่างระหว่างไฟล์ "Look-up" และ "Look is up" ใน Abinitio?
ไฟล์ค้นหากำหนดไฟล์อนุกรมตั้งแต่หนึ่งไฟล์ขึ้นไป (ไฟล์แบบแฟลต); เป็นไฟล์ฟิสิคัลที่เก็บข้อมูลสำหรับการค้นหา ในขณะที่ Look-up เป็นองค์ประกอบของกราฟ abinitio ซึ่งเราสามารถบันทึกข้อมูลและดึงข้อมูลได้โดยใช้พารามิเตอร์หลัก11) กล่าวถึงความเท่าเทียมประเภทต่างๆ ที่ใช้ใน Abinitio มีอะไรบ้าง
ความเท่าเทียมประเภทต่างๆ ที่ใช้ใน Abinitio ประกอบด้วย- ความเท่าเทียมของส่วนประกอบ: กราฟที่มีหลายกระบวนการดำเนินการพร้อมกันบนข้อมูลที่แยกจากกันจะใช้ความขนาน
- ความเท่าเทียมของข้อมูล: กราฟที่ทำงานกับข้อมูลที่แบ่งออกเป็นส่วนต่างๆ และดำเนินการกับแต่ละส่วนตามลำดับ จะใช้ข้อมูลแบบขนาน
- ความเท่าเทียมของท่อ: กราฟที่เกี่ยวข้องกับองค์ประกอบหลายรายการที่ทำงานพร้อมกันบนข้อมูลเดียวกันจะใช้ไปป์ไลน์แบบขนาน แต่ละส่วนประกอบในไปป์ไลน์จะอ่านอย่างต่อเนื่องจากส่วนประกอบอัพสตรีม ประมวลผลข้อมูล และเขียนไปยังส่วนประกอบดาวน์สตรีม ส่วนประกอบทั้งสองสามารถทำงานแบบขนานได้
12) อธิบายว่า Sort Component ใน Abinitio คืออะไร
Sort Component ใน Abinitio จะเรียงลำดับข้อมูลใหม่ ประกอบด้วยพารามิเตอร์สองตัวคือ "คีย์" และ "Max-core"- คีย์: เป็นหนึ่งในพารามิเตอร์สำหรับองค์ประกอบการเรียงลำดับซึ่งกำหนดลำดับการเปรียบเทียบ
- แม็กซ์คอร์: พารามิเตอร์นี้ควบคุมความถี่ที่คอมโพเนนต์การเรียงลำดับดัมพ์ข้อมูลจากหน่วยความจำไปยังดิสก์
13) พูดถึงองค์ประกอบ dedup-component และองค์ประกอบการจำลองแบบใด
- ส่วนประกอบที่ซ้ำซ้อน: ใช้สำหรับลบบันทึกที่ซ้ำกัน
- ทำซ้ำส่วนประกอบ: โดยจะรวมบันทึกข้อมูลจากอินพุตเข้าเป็นโฟลว์เดียว และเขียนสำเนาของโฟลว์นั้นไปยังพอร์ตเอาต์พุตแต่ละพอร์ต
14) พูดถึงพาร์ติชั่นคืออะไรและส่วนประกอบพาร์ติชั่นประเภทต่าง ๆ ใน Abinitio มีอะไรบ้าง?
ใน Abinitio พาร์ติชันคือกระบวนการแบ่งชุดข้อมูลออกเป็นหลายชุดเพื่อการประมวลผลต่อไป ส่วนประกอบพาร์ติชั่นประเภทต่างๆ ได้แก่- การแบ่งพาร์ติชันโดย Round-Robin: กระจายข้อมูลเท่าๆ กัน เป็นกลุ่มขนาดบล็อก ทั่วทั้งพาร์ติชั่นเอาต์พุต
- แบ่งตามช่วง: คุณสามารถแบ่งข้อมูลระหว่างโหนดเท่าๆ กัน โดยขึ้นอยู่กับชุดของช่วงการแบ่งพาร์ติชันและคีย์
- การแบ่งส่วนตามเปอร์เซ็นต์: ข้อมูลการกระจาย ดังนั้นเอาต์พุตจึงเป็นสัดส่วนกับเศษส่วนของ 100
- การแบ่งพาร์ติชันตามโหลดบาลานซ์: โหลดบาลานซ์แบบไดนามิก
- การแบ่งพาร์ติชันตามนิพจน์: ข้อมูลแบ่งตามนิพจน์ DML
- แบ่งพาร์ติชันตามคีย์: การจัดกลุ่มข้อมูลด้วยคีย์
15) อธิบายว่า SANDBOX คืออะไร
SANDBOX อ้างอิงถึงคอลเลกชันของกราฟและไฟล์ที่เกี่ยวข้องซึ่งบันทึกไว้ในแผนผังไดเร็กทอรีเดียวและทำงานเป็นกลุ่มเพื่อวัตถุประสงค์ในการนำทาง การควบคุมเวอร์ชัน และการย้ายข้อมูล16) อธิบายว่าการแบ่งพาร์ติชันใน Abinitio คืออะไร?
การแบ่งพาร์ติชันเสร็จสิ้นเพื่ออ่านข้อมูลจากโฟลว์หรือการดำเนินการต่างๆ และใช้เพื่อรวมบันทึกข้อมูลจากโฟลว์ที่ต่างกันอีกครั้ง มีองค์ประกอบการแบ่งพาร์ติชันหลายรายการซึ่งรวมถึง Gather, Merge, Interleave และ Concatenation17) แสดงรายการคำสั่งทางอากาศบางส่วนที่ใช้ใน Abintio?
คำสั่งทางอากาศที่ใช้ใน Abinitio ประกอบด้วย- วัตถุอากาศคือ : ใช้เพื่อดูรายการวัตถุในไดเร็กทอรีภายในโปรเจ็กต์
- วัตถุอากาศ RM : ใช้เพื่อลบวัตถุออกจากที่เก็บ
- เวอร์ชันวัตถุอากาศ - verbose : ให้ประวัติเวอร์ชันของออบเจ็กต์
18) พูดถึง Rollup Component คืออะไร?
ส่วนประกอบแบบสะสมช่วยให้ผู้ใช้สามารถจัดกลุ่มเรกคอร์ดตามค่าฟิลด์บางค่าได้ เป็นฟังก์ชันหลายขั้นตอนและประกอบด้วยการเริ่มต้น 2 และ Rollup 319) พูดถึงไวยากรณ์ของ m_dump ใน Abinitio คืออะไร
ไวยากรณ์สำหรับ m_dump ใน Abinitio ใช้เพื่อดูข้อมูลในรูปแบบ multifile จาก Unix prompt คำสั่งสำหรับ m_dump ประกอบด้วย- m_dump a.dml a.dat: คำสั่งนี้จะพิมพ์ข้อมูลตามที่ปรากฏจาก GDE เมื่อเราดูข้อมูลในรูปแบบข้อความที่จัดรูปแบบ
- m_dump a.dml a.dat>b.dat: เอาต์พุตจะถูกเปลี่ยนทิศทางใหม่ใน b.dat และจะทำหน้าที่เป็นไฟล์อนุกรม b.dat ที่สามารถอ้างอิงได้เมื่อจำเป็น