คำถามและคำตอบสัมภาษณ์คลังข้อมูล 50 อันดับแรก
ต่อไปนี้เป็นคำถามและคำตอบในการสัมภาษณ์ Data Warehouse สำหรับผู้สมัครหน้าใหม่และผู้มีประสบการณ์เพื่อให้ได้งานในฝัน
1) คลังข้อมูลคืออะไร?
คลังข้อมูล (DW) เป็นที่เก็บข้อมูลและใช้สำหรับระบบสนับสนุนการตัดสินใจของฝ่ายบริหาร คลังข้อมูลประกอบด้วยข้อมูลที่หลากหลายซึ่งมีเงื่อนไขทางธุรกิจในระดับสูง ณ จุดเวลาเดียว
ในประโยคเดียว เป็นที่เก็บข้อมูลแบบบูรณาการซึ่งสามารถสอบถามและวิเคราะห์ได้
2) คืออะไร ระบบธุรกิจอัจฉริยะ?
ระบบธุรกิจอัจฉริยะเรียกอีกอย่างว่า DSS – ระบบสนับสนุนการตัดสินใจ ซึ่งหมายถึงเทคโนโลยี แอปพลิเคชัน และแนวปฏิบัติสำหรับการรวบรวม การบูรณาการ และการวิเคราะห์ข้อมูลหรือข้อมูลที่เกี่ยวข้องกับธุรกิจ แม้จะช่วยให้เห็นข้อมูลในตัวข้อมูลเองก็ตาม
ดาวน์โหลด PDF ฟรี: คำถามและคำตอบสัมภาษณ์คลังข้อมูล
3) ตารางไดเมนชันคืออะไร?
ตารางมิติคือตารางที่ประกอบด้วยคุณลักษณะของการวัดที่จัดเก็บไว้ในตารางข้อเท็จจริง ตารางนี้ประกอบด้วยลำดับชั้น หมวดหมู่ และตรรกะที่สามารถใช้เพื่อสำรวจในโหนด
4) ตารางข้อเท็จจริงคืออะไร?
ตารางข้อเท็จจริงประกอบด้วยการวัดกระบวนการทางธุรกิจ และประกอบด้วยคีย์ภายนอกสำหรับตารางมิติ
ตัวอย่าง – หากกระบวนการทางธุรกิจคือการผลิตอิฐ
จำนวนอิฐเฉลี่ยที่ผลิตโดยหนึ่งคน/เครื่องจักร – การวัดกระบวนการทางธุรกิจ
5) Datawarehousing มีขั้นตอนอะไรบ้าง?
Datawarehousing มีสี่ขั้นตอน:
- ฐานข้อมูลการดำเนินงานออฟไลน์
- คลังข้อมูลออฟไลน์
- คลังข้อมูลแบบเรียลไทม์
- คลังข้อมูลแบบบูรณาการ
6) การทำเหมืองข้อมูลคืออะไร?
Data Mining ถูกกำหนดให้เป็นกระบวนการวิเคราะห์ข้อมูลในมิติหรือมุมมองต่างๆ แล้วสรุปเป็นข้อมูลที่เป็นประโยชน์ สามารถสอบถามและดึงข้อมูลจากฐานข้อมูลในรูปแบบของตนเองได้
7) OLTP คืออะไร?
OLTP ย่อมาจาก On-Line Transaction Processing และเป็นแอปพลิเคชันที่แก้ไขข้อมูลทุกครั้งที่ได้รับและมีผู้ใช้พร้อมกันจำนวนมาก
8) OLAP คืออะไร?
OLAP ย่อมาจาก Online Analytical Processing และกำหนดให้เป็นระบบที่รวบรวม จัดการ ประมวลผลข้อมูลหลายมิติเพื่อการวิเคราะห์และการจัดการ
9) OLTP และ OLAP แตกต่างกันอย่างไร?
ต่อไปนี้เป็นข้อแตกต่างระหว่าง OLTP และ OLAP:
OLTP | สพป |
ข้อมูลมาจากแหล่งข้อมูลดั้งเดิม | ข้อมูลมาจากแหล่งข้อมูลต่างๆ |
แบบสอบถามง่ายๆโดยผู้ใช้ | แบบสอบถามที่ซับซ้อนตามระบบ |
ฐานข้อมูลขนาดเล็กที่ทำให้เป็นมาตรฐาน | ฐานข้อมูลขนาดใหญ่ที่ไม่ปกติ |
งานทางธุรกิจขั้นพื้นฐาน | งานทางธุรกิจหลายมิติ |
10) ODS คืออะไร?
ODS ย่อมาจาก Operational Data Store และเป็นที่เก็บข้อมูลการปฏิบัติงานแบบเรียลไทม์ แทนที่จะเป็นข้อมูลแนวโน้มระยะยาว
11) อะไรคือความแตกต่างระหว่างมุมมองและมุมมองที่เป็นรูปธรรม?
มุมมองไม่ใช่อะไรเลยนอกจากตารางเสมือนที่รับเอาต์พุตของการสืบค้นและสามารถใช้แทนตารางได้
มุมมองที่เป็นรูปธรรมนั้นเป็นเพียงการเข้าถึงข้อมูลตารางทางอ้อมโดยการจัดเก็บผลลัพธ์ของการสืบค้นไว้ในสคีมาที่แยกต่างหาก
12) ETL คืออะไร?
ETL ย่อมาจาก Extract, Transform และ Load ETL เป็นซอฟต์แวร์ที่ใช้ในการอ่านข้อมูลจากแหล่งข้อมูลที่ระบุและแยกชุดย่อยของข้อมูลที่ต้องการ จากนั้นจะแปลงข้อมูลโดยใช้กฎและตารางการค้นหา และแปลงเป็นสถานะที่ต้องการ
จากนั้นจะใช้ฟังก์ชันโหลดเพื่อโหลดข้อมูลผลลัพธ์ไปยังฐานข้อมูลเป้าหมาย
13) VLDB คืออะไร?
VLDB ย่อมาจาก Very Large Database และขนาดของมันถูกกำหนดให้เป็นฐานข้อมูลมากกว่าหนึ่งเทราไบต์ สิ่งเหล่านี้คือระบบสนับสนุนการตัดสินใจที่ใช้กับเซิร์ฟเวอร์ผู้ใช้จำนวนมาก
14) คลังข้อมูลแบบเรียลไทม์คืออะไร?
คลังข้อมูลแบบเรียลไทม์จะรวบรวมข้อมูลทางธุรกิจทุกครั้งที่เกิดขึ้น เมื่อมีกิจกรรมทางธุรกิจเสร็จสมบูรณ์ ข้อมูลนั้นจะพร้อมใช้งานในโฟลว์และพร้อมใช้งานทันที
15) ตารางรวมคืออะไร?
ตารางรวมคือตารางที่ประกอบด้วยข้อมูลคลังสินค้าที่มีอยู่ซึ่งถูกจัดกลุ่มเป็นมิติระดับหนึ่ง สามารถเรียกข้อมูลจากตารางรวมได้ง่ายกว่าตารางเดิมที่มีจำนวนบันทึกมากกว่า
ตารางนี้จะช่วยลดภาระในเซิร์ฟเวอร์ฐานข้อมูลและเพิ่มประสิทธิภาพของการสืบค้น
16) ตารางข้อเท็จจริงที่ไม่มีข้อเท็จจริงคืออะไร?
ตารางข้อเท็จจริงที่ไม่มีข้อเท็จจริงคือตารางข้อเท็จจริงที่ไม่มีคอลัมน์ข้อเท็จจริงที่เป็นตัวเลขในตารางข้อเท็จจริง
17) เราจะโหลดมิติเวลาได้อย่างไร?
โดยปกติมิติเวลาจะโหลดตามวันที่ที่เป็นไปได้ทั้งหมดในหนึ่งปี และสามารถทำได้ผ่านโปรแกรม ในที่นี้ 100 ปีสามารถแสดงได้หนึ่งแถวต่อวัน
18) ข้อเท็จจริงที่ไม่เติมแต่งคืออะไร?
ข้อเท็จจริงที่ไม่เสพติดถือเป็นข้อเท็จจริงที่ไม่สามารถสรุปได้ในมิติใดๆ ที่มีอยู่ในตารางข้อเท็จจริง หากมีการเปลี่ยนแปลงมิติข้อมูล ข้อเท็จจริงเดียวกันก็อาจมีประโยชน์ได้
19) ข้อเท็จจริงที่สอดคล้องคืออะไร?
ข้อเท็จจริงที่สอดคล้องคือตารางที่สามารถใช้กับศูนย์ข้อมูลหลายแห่งร่วมกับตารางข้อเท็จจริงหลายตารางได้
20) ดาต้ามาร์ทคืออะไร?
Datamart เป็น Datawarehousing เวอร์ชันเฉพาะและมีภาพรวมของข้อมูลการดำเนินงานที่ช่วยให้นักธุรกิจตัดสินใจด้วยการวิเคราะห์แนวโน้มและประสบการณ์ในอดีต ดาต้ามาร์ทช่วยเน้นให้เข้าถึงข้อมูลที่เกี่ยวข้องได้ง่าย
21) Active Datawarehousing คืออะไร?
คลังข้อมูลที่ใช้งานอยู่คือคลังข้อมูลที่ช่วยให้ผู้มีอำนาจตัดสินใจภายในบริษัทหรือองค์กรสามารถจัดการความสัมพันธ์กับลูกค้าได้อย่างมีประสิทธิภาพและประสิทธิผล
22) Datawarehouse และ OLAP แตกต่างกันอย่างไร
คลังข้อมูลเป็นสถานที่ที่จัดเก็บข้อมูลทั้งหมดไว้สำหรับการวิเคราะห์ แต่ OLAP ใช้สำหรับการวิเคราะห์ข้อมูล การจัดการการรวมกลุ่ม การแบ่งพาร์ติชันข้อมูลเป็นข้อมูลระดับย่อย
23) ER Diagram คืออะไร?
แผนภาพ ER ย่อมาจาก แผนภาพ Entity-Relationship ซึ่งแสดงให้เห็นความสัมพันธ์ระหว่างเอนทิตีในฐานข้อมูล แผนภาพนี้แสดงโครงสร้างของแต่ละตารางและความเชื่อมโยงระหว่างตาราง
24) คอลัมน์สำคัญในตารางข้อเท็จจริงและตารางมิติคืออะไร
คีย์ภายนอกของตารางมิติเป็นคีย์หลักของตารางเอนทิตี คีย์ภายนอกของตารางข้อเท็จจริงเป็นคีย์หลักของตารางไดเมนชัน
25) SCD คืออะไร?
SCD ถูกกำหนดให้เป็นมิติที่เปลี่ยนแปลงอย่างช้าๆ และใช้กับกรณีที่บันทึกเปลี่ยนแปลงเมื่อเวลาผ่านไป
26) SCD มีกี่ประเภท?
SCD มีสามประเภทและมีดังต่อไปนี้:
SCD 1 – บันทึกใหม่มาแทนที่บันทึกดั้งเดิม
SCD 2 – มีการเพิ่มบันทึกใหม่ลงในตารางมิติลูกค้าที่มีอยู่
SCD 3 – ข้อมูลต้นฉบับได้รับการแก้ไขเพื่อรวมข้อมูลใหม่
27) BUS Schema คืออะไร
สคีมา BUS ประกอบด้วยชุดมิติที่ได้รับการยืนยันและคำจำกัดความที่เป็นมาตรฐาน หากมีตารางข้อเท็จจริง
28) สตาร์สคีมาคืออะไร?
Star schema เป็นเพียงประเภทของการจัดตารางในลักษณะที่สามารถดึงผลลัพธ์จากฐานข้อมูลได้อย่างรวดเร็วในสภาพแวดล้อมคลังข้อมูล
29) สคีมาเกล็ดหิมะคืออะไร?
สคีมาเกล็ดหิมะซึ่งมีตารางมิติหลักที่สามารถรวมมิติข้อมูลตั้งแต่หนึ่งรายการขึ้นไปได้ ตารางมิติหลักเป็นตารางเดียวที่สามารถรวมเข้ากับตารางข้อเท็จจริงได้
30) มิติหลักคืออะไร?
มิติข้อมูลหลักไม่ใช่อะไรนอกจากตารางไดเมนชันที่ใช้เฉพาะสำหรับตารางข้อเท็จจริงเดี่ยวหรือดาต้ามาร์ต
31) การล้างข้อมูลเรียกว่าอะไร?
ชื่อตัวเองบ่งบอกว่าเป็นคำที่อธิบายตนเอง การทำความสะอาดบันทึก Orphan การละเมิดกฎเกณฑ์ทางธุรกิจ ข้อมูลที่ไม่สอดคล้องกัน และข้อมูลที่ขาดหายไปในฐานข้อมูล
32) เมตาดาต้าคืออะไร?
ข้อมูลเมตาถูกกำหนดให้เป็นข้อมูลเกี่ยวกับข้อมูล ข้อมูลเมตาประกอบด้วยข้อมูล เช่น จำนวนคอลัมน์ที่ใช้ ความกว้างคงที่และความกว้างที่จำกัด การเรียงลำดับฟิลด์ และประเภทข้อมูลของฟิลด์
33) ลูปใน Datawarehousing คืออะไร?
ในคลังข้อมูล มีการวนซ้ำระหว่างตาราง หากมีการวนซ้ำระหว่างตาราง การสร้างคิวรีจะใช้เวลามากขึ้นและจะสร้างความคลุมเครือ แนะนำให้หลีกเลี่ยงการวนซ้ำระหว่างตาราง
34) ตารางไดเมนชันสามารถมีค่าตัวเลขได้หรือไม่?
ใช่ ตารางขนาดสามารถมีค่าตัวเลขได้เนื่องจากเป็นองค์ประกอบเชิงพรรณนาของธุรกิจของเรา
35) คำจำกัดความของ Cube ในคลังข้อมูลคืออะไร?
คิวบ์เป็นตัวแทนเชิงตรรกะของข้อมูลหลายมิติ ขอบของคิวบ์มีสมาชิกของมิติ และเนื้อความของคิวบ์ประกอบด้วยค่าข้อมูล
36) การสร้างแบบจำลองมิติเรียกว่าอะไร?
การสร้างแบบจำลองมิติเป็นแนวคิดที่นักออกแบบคลังข้อมูลสามารถใช้เพื่อสร้างคลังข้อมูลของตนเองได้ โมเดลนี้สามารถเก็บไว้ในตารางได้สองประเภท ได้แก่ ตารางข้อเท็จจริงและตารางไดเมนชัน
ตารางข้อเท็จจริงประกอบด้วยข้อเท็จจริงและหน่วยวัดของธุรกิจ และตารางมิติประกอบด้วยบริบทของหน่วยวัด
37) การสร้างแบบจำลองมิติประเภทใดบ้าง?
ต่อไปนี้คือไฟล์ ประเภทของมิติในคลังข้อมูล:
- มิติที่สอดคล้องกัน
- มิติเอาท์ริกเกอร์
- มิติที่หดตัว
- มิติการสวมบทบาท
- มิติถึงตารางมิติ
- มิติขยะ
- เสื่อมมิติ
- มิติข้อมูลแบบสลับได้
- มิติขั้นตอน
38) คีย์ตัวแทนคืออะไร?
คีย์ตัวแทนเป็นเพียงสิ่งทดแทนคีย์หลักทั่วไปเท่านั้น มันถูกตั้งค่าให้เป็นตัวระบุที่ไม่ซ้ำกันสำหรับแต่ละแถวที่สามารถใช้สำหรับคีย์หลักของตารางได้
39) อะไรคือความแตกต่างระหว่างการสร้างแบบจำลอง ER และการสร้างแบบจำลองมิติ?
การสร้างแบบจำลอง ER จะมีแบบจำลองเชิงตรรกะและทางกายภาพ แต่การสร้างแบบจำลองมิติจะมีแบบจำลองทางกายภาพเท่านั้น
การสร้างแบบจำลอง ER ใช้สำหรับการปรับมาตรฐานการออกแบบฐานข้อมูล OLTP ในขณะที่การสร้างแบบจำลองมิติข้อมูลใช้สำหรับการลดมาตรฐานการออกแบบ ROLAP และ MOLAP
40) ขั้นตอนในการสร้างคลังข้อมูลมีอะไรบ้าง?
ต่อไปนี้เป็นขั้นตอนที่ต้องปฏิบัติตามเพื่อสร้างคลังข้อมูล:
- รวบรวมความต้องการทางธุรกิจ
- การระบุแหล่งที่มาที่จำเป็น
- การระบุข้อเท็จจริง
- การกำหนดมิติข้อมูล
- การกำหนดคุณลักษณะ
- กำหนดมิติและแอตทริบิวต์ใหม่หากจำเป็น
- จัดระเบียบลำดับชั้นของแอตทริบิวต์
- กำหนดความสัมพันธ์
- กำหนดตัวระบุที่ไม่ซ้ำ
41) คลังข้อมูลประเภทต่าง ๆ มีอะไรบ้าง?
ต่อไปนี้เป็นคลังข้อมูลประเภทต่างๆ:
- คลังข้อมูลองค์กร
- เก็บข้อมูลการปฏิบัติงาน
- ข้อมูลมาร์ท
42) จะต้องทำอะไรในขณะที่เริ่มต้นฐานข้อมูล?
จำเป็นต้องดำเนินการต่อไปนี้เพื่อเริ่มฐานข้อมูล:
- เริ่มอินสแตนซ์
- เมานต์ฐานข้อมูล
- เปิดฐานข้อมูล
43) จะต้องทำอย่างไรเมื่อฐานข้อมูลถูกปิด?
จะต้องดำเนินการต่อไปนี้เมื่อฐานข้อมูลถูกปิด:
- ปิดฐานข้อมูล
- ถอดถอนฐานข้อมูล
- ปิดอินสแตนซ์
44) เราสามารถสำรองข้อมูลเมื่อเปิดฐานข้อมูลได้หรือไม่?
ใช่ เราสามารถสำรองข้อมูลทั้งหมดได้เมื่อเปิดฐานข้อมูล
45) อะไรคือการสำรองข้อมูลบางส่วน?
การสำรองข้อมูลบางส่วนในไฟล์ ระบบปฏิบัติการ เป็นการสำรองข้อมูลที่ไม่เพียงพอและสามารถทำได้ในขณะที่เปิดหรือปิดฐานข้อมูล
46) เป้าหมายของ Optimizer คืออะไร?
เป้าหมายของ Optimizer คือการหาวิธีที่มีประสิทธิภาพที่สุดในการดำเนินการ SQL งบ
47) แผนการดำเนินการคืออะไร?
แผนการดำเนินการคือแผนที่ใช้กับเครื่องมือเพิ่มประสิทธิภาพเพื่อเลือกการรวมขั้นตอนต่างๆ
48) Optimizer ใช้แนวทางใดบ้างระหว่างแผนการดำเนินการ?
มีสองวิธี:
- ตามกฎ
- ตามต้นทุน
49) ETL มีเครื่องมืออะไรบ้าง?
ต่อไปนี้เป็นเครื่องมือ ETL ที่ใช้งานได้:
สารสนเทศ
ขั้นข้อมูล
คำพยากรณ์
ช่างสร้างโกดัง
เริ่มต้น
ชุมทางข้อมูล
50) Metadata และพจนานุกรมข้อมูลแตกต่างกันอย่างไร?
ข้อมูลเมตาถูกกำหนดให้เป็นข้อมูลเกี่ยวกับข้อมูล แต่พจนานุกรมข้อมูลมีข้อมูลเกี่ยวกับข้อมูลโปรเจ็กต์ กราฟ คำสั่ง abinito และข้อมูลเซิร์ฟเวอร์
คำถามสัมภาษณ์เหล่านี้จะช่วยในวีว่าของคุณ (วาจา)
ขอขอบคุณสำหรับข้อมูล :)
วิธีติดตั้งซอฟต์แวร์เครื่องมือ datastage etl ใน windows10 ของฉัน
ขอบคุณสำหรับการแบ่งปันข้อมูล
Hii
pls
คลังข้อมูลอธิบายและทฤษฎี
ข้อมูลที่เป็นประโยชน์มาก .. ขอบคุณ :)
ขอบคุณ! มีประโยชน์มาก
ประเภท SCD ไม่ได้อยู่ในลำดับที่ถูกต้อง
ประเภท 0 – มิติคงที่
ไม่อนุญาตให้เปลี่ยนแปลง มิติข้อมูลไม่เคยเปลี่ยนแปลง
ประเภทที่ 1 – ไม่มีประวัติ
อัปเดตบันทึกโดยตรง ไม่มีบันทึกค่าในอดีต มีเพียงสถานะปัจจุบันเท่านั้น
ประเภทที่ 2 – การกำหนดเวอร์ชันแถว
ติดตามการเปลี่ยนแปลงเป็นบันทึกเวอร์ชันพร้อมแฟล็กปัจจุบัน & วันที่ใช้งาน และข้อมูลเมตาอื่น ๆ
ประเภท 3 – คอลัมน์ค่าก่อนหน้า
ติดตามการเปลี่ยนแปลงในแอตทริบิวต์เฉพาะ เพิ่มคอลัมน์เพื่อแสดงค่าก่อนหน้า ซึ่งได้รับการอัปเดตเมื่อมีการเปลี่ยนแปลงเพิ่มเติม
ประเภทที่ 4 – ตารางประวัติ
แสดงค่าปัจจุบันในตารางมิติ แต่ติดตามการเปลี่ยนแปลงทั้งหมดในตารางแยกต่างหาก
ประเภท 6 – ไฮบริด SCD
ใช้เทคนิคจาก SCD ประเภท 1, 2 และ 3 เพื่อติดตามการเปลี่ยนแปลง
ขอบคุณ .. สิ่งนี้มีประโยชน์
มีประโยชน์สำหรับการแก้ไข :)
ขอบคุณ
มีประโยชน์มาก.ในการแบ่งปันสิ่งดีๆให้กับผู้คน.
ฉันต้องการความช่วยเหลือเพื่อหารือเกี่ยวกับคำถามนี้!
ถาม: คุณได้รับการว่าจ้างให้เป็นวิศวกรด้านดาต้าแวร์เฮาส์จากร้านค้าขนาดใหญ่ คุณจะใช้กฎการเชื่อมโยงของการขุดข้อมูลเพื่อเพิ่มยอดขายของร้านค้าขนาดใหญ่ได้อย่างไร?
44. เมื่อเปิดฐานข้อมูลแล้วเราสามารถสำรองข้อมูลได้หรือไม่?
ใช่ เราสามารถสำรองข้อมูลทั้งหมดได้เมื่อเปิดฐานข้อมูล มันถูกเรียกว่าการสำรองข้อมูลร้อน ...
q 37 ไม่ถูกต้อง
สวัสดี ขอบคุณสำหรับการแบ่งปันความคิดของคุณ มีการปรับปรุง..
ดีมากครับท่าน
ขอขอบคุณที่ให้คำถามอันทรงคุณค่าและคำตอบที่เข้าใจง่าย
ขอบคุณมันช่วยฉันได้มาก
มันดีมากจริงๆ ขอบคุณ มันช่วยฉันได้มาก
เข้าใจง่ายครับ ขอบคุณครับ
ขอบคุณมันช่วยฉันได้
ข้อมูลโดยรวมมีประโยชน์มาก ขอบคุณครับ