50 найпопулярніших запитань і відповідей на співбесіді зі сховищем даних
Ось питання та відповіді на співбесіді в Data Warehouse для нових і досвідчених кандидатів, щоб отримати роботу своєї мрії.
1) Що таке сховище даних?
Сховище даних (DW) є сховищем даних і використовується для системи підтримки прийняття управлінських рішень. Сховище даних складається з широкого спектру даних, які мають високий рівень бізнес-умов в один момент часу.
Одним словом, це сховище інтегрованої інформації, яка може бути доступна для запитів і аналізу.
2) Що є Бізнес-аналітика?
Бізнес-аналітика також відома як DSS – система підтримки прийняття рішень, яка відноситься до технологій, програм і практик для збору, інтеграції та аналізу інформації або даних, пов’язаних з бізнесом. Навіть це допомагає побачити дані в самій інформації.
Безкоштовне завантаження PDF: Запитання та відповіді на співбесіді зі сховищем даних
3) Що таке таблиця розмірів?
Таблиця розмірів – це таблиця, яка містить атрибути вимірювань, що зберігаються в таблицях фактів. Ця таблиця складається з ієрархій, категорій і логіки, які можна використовувати для переходу в вузлах.
4) Що таке таблиця фактів?
Таблиця фактів містить вимірювання бізнес-процесів і містить зовнішні ключі для таблиць вимірювань.
Приклад – якщо бізнес-процесом є виробництво цегли
Середня кількість цегли, виробленої однією людиною/машиною – показник бізнес-процесу
5) З яких етапів складається Datawarehousing?
Існує чотири етапи зберігання даних:
- Офлайн-оперативна база даних
- Офлайн-сховище даних
- Сховище даних реального часу
- Інтегроване сховище даних
6) Що таке інтелектуальний аналіз даних?
Інтелектуальний аналіз даних – це процес аналізу даних у різних вимірах або перспективах і узагальнення в корисну інформацію. Можна запитувати та отримувати дані з бази даних у власному форматі.
7) Що таке OLTP?
OLTP скорочено називається On-Line Transaction Processing, і це програма, яка змінює дані щоразу, коли їх отримує, і має велику кількість одночасних користувачів.
8) Що таке OLAP?
OLAP скорочено називається Online Analytical Processing, і це система, яка збирає, керує та обробляє багатовимірні дані для цілей аналізу та керування.
9) Яка різниця між OLTP і OLAP?
Нижче наведено відмінності між OLTP і OLAP.
OLTP | OLAP |
Дані з оригінального джерела даних | Дані з різних джерел даних |
Прості запити користувачів | Складні запити по системі |
Нормалізована невелика база даних | Денормалізована велика база даних |
Фундаментальні бізнес-завдання | Багатовимірні бізнес-завдання |
10) Що таке ODS?
ODS скорочено називається Operational Data Store і є сховищем оперативних даних у реальному часі, а не даних про довгострокові тенденції.
11) Яка різниця між View і Materialized View?
Представлення — це не що інше, як віртуальна таблиця, яка отримує вихідні дані запиту, і її можна використовувати замість таблиць.
Матеріалізоване представлення — це не що інше, як непрямий доступ до даних таблиці шляхом збереження результатів запиту в окремій схемі.
12) Що таке ETL?
ETL скорочено називається Extract, Transform and Load. ETL — це програмне забезпечення, яке використовується для зчитування даних із зазначеного джерела даних і вилучення потрібної підмножини даних. Далі він перетворює дані за допомогою правил і таблиць пошуку та перетворює їх у потрібний стан.
Потім функція завантаження використовується для завантаження отриманих даних у цільову базу даних.
13) Що таке VLDB?
VLDB скорочено називається дуже великою базою даних, а її розмір становить більше одного терабайта бази даних. Це системи підтримки прийняття рішень, які використовуються для обслуговування великої кількості користувачів.
14) Що таке зберігання даних у реальному часі?
Сховище даних у реальному часі фіксує бізнес-дані щоразу, коли вони виникають. Коли бізнес-діяльність буде завершена, ці дані будуть доступні в потоці та стануть доступними для використання миттєво.
15) Що таке агрегатні таблиці?
Зведені таблиці — це таблиці, які містять наявні складські дані, згруповані за певним рівнем вимірів. Отримати дані з агрегованих таблиць легше, ніж із вихідної таблиці, яка містить більше записів.
Ця таблиця зменшує навантаження на сервер бази даних і підвищує продуктивність запиту.
16) Що таке безфактичні таблиці фактів?
Безфактичні таблиці фактів — це таблиці фактів, які не містять числового стовпця фактів у таблиці фактів.
17) Як ми можемо завантажити вимір часу?
Розміри часу зазвичай завантажуються через усі можливі дати в році, і це можна зробити за допомогою програми. Тут 100 років можна представити одним рядком на день.
18) Що таке неадитивні факти?
Факти, що не викликають звикання, називаються фактами, які не можна підсумувати за жодним із параметрів, присутніх у таблиці фактів. Якщо є зміни в розмірах, ті самі факти можуть бути корисними.
19) Що таке підтверджений факт?
Узгоджений факт – це таблиця, яку можна використовувати в кількох вітринах даних у поєднанні з кількома таблицями фактів.
20) Що таке Datamart?
Datamart — це спеціалізована версія Datawarehousing, яка містить знімок оперативних даних, які допомагають бізнесменам приймати рішення на основі аналізу минулих тенденцій і досвіду. Вітрина даних допомагає зробити акцент на легкому доступі до відповідної інформації.
21) Що таке Active Datawarehousing?
Активне сховище даних — це сховище даних, яке дає змогу особам, які приймають рішення в компанії чи організації, ефективно та результативно керувати відносинами з клієнтами.
22) Яка різниця між Datawarehouse та OLAP?
Datawarehouse — це місце, де всі дані зберігаються для аналізу, але OLAP використовується для аналізу даних, керування агрегаціями, поділу інформації на інформацію другорядного рівня.
23) Що таке ER діаграма?
ER-діаграма скорочено називається Entity-Relationship diagram, яка ілюструє взаємозв’язки між сутностями в базі даних. Ця діаграма показує структуру кожної таблиці та зв’язки між таблицями.
24) Які ключові стовпці в таблицях фактів і розмірів?
Зовнішні ключі таблиць розмірності є первинними ключами таблиць сутностей. Зовнішні ключі таблиць фактів є первинними ключами таблиць розмірності.
25) Що таке SCD?
SCD визначається як розміри, що повільно змінюються, і це стосується випадків, коли запис змінюється з часом.
26) Які бувають типи SCD?
Є три типи SCD, і вони такі:
SCD 1 – новий запис замінює оригінальний запис
SCD 2 – новий запис додається до наявної таблиці параметрів клієнта
SCD 3 – вихідні дані змінено, щоб включити нові дані
27) Що таке схема шини?
Схема BUS складається з набору підтверджених розмірів і стандартизованого визначення, якщо є таблиці фактів.
28) Що таке зіркова схема?
Зірчаста схема — це не що інше, як тип організації таблиць таким чином, щоб результат можна було швидко отримати з бази даних у середовищі сховища даних.
29) Що таке схема сніжинки?
Схема сніжинки, яка має первинну таблицю розмірів, до якої можна приєднати один або кілька розмірів. Основна таблиця вимірів — це єдина таблиця, яку можна об’єднати з таблицею фактів.
30) Що таке основний вимір?
Основний вимір — це не що інше, як таблиця вимірів, яка використовується як спеціальна таблиця фактів або ринок даних.
31) Що називається очищенням даних?
Сама назва означає, що це термін, який не потребує пояснень. Очищення невідомих записів, Дані, що порушують бізнес-правила, Неузгоджені дані та відсутня інформація в базі даних.
32) Що таке метадані?
Метадані визначаються як дані про дані. Метадані містять таку інформацію, як кількість використаних стовпців, фіксована ширина та обмежена ширина, порядок полів і типи даних полів.
33) Що таке цикли в Datawarehousing?
У сховищах даних між таблицями існують цикли. Якщо між таблицями є цикл, то генерація запиту займе більше часу, і це створює неоднозначність. Рекомендується уникати петель між таблицями.
34) Чи може таблиця розмірності мати числове значення?
Так, таблиця розмірів може мати числове значення, оскільки це описові елементи нашого бізнесу.
35) Яке визначення Cube у Datawarehousing?
Куби є логічним представленням багатовимірних даних. Ребро куба містить елементи розмірності, а тіло куба містить значення даних.
36) Що називається розмірним моделюванням?
Розмірне моделювання — це концепція, яку можуть використовувати розробники будинків сховища даних для створення власного сховища даних. Цю модель можна зберігати в двох типах таблиць – таблиці фактів і таблиці розмірів.
Таблиця фактів містить факти та показники бізнесу, а таблиця параметрів містить контекст вимірювань.
37) Які існують типи розмірного моделювання?
Далі Типи розмірів у сховищі даних:
- Відповідний вимір
- Розмір аутригера
- Зменшений вимір
- Рольовий вимір
- Розмір до таблиці розмірів
- Сміттєвий вимір
- Вироджений вимір
- Замінний розмір
- Розмір кроку
38) Що таке сурогатний ключ?
Сурогатний ключ є нічим іншим, як заміною природного первинного ключа. Він встановлений як унікальний ідентифікатор для кожного рядка, який можна використовувати як первинний ключ до таблиці.
39) Яка різниця між ER моделюванням і вимірювальним моделюванням?
Моделювання ER матиме логічну та фізичну моделі, але розмірне моделювання матиме лише фізичну модель.
ER Modeling використовується для нормалізації дизайну бази даних OLTP, тоді як Dimensional Modeling використовується для денормалізації дизайну ROLAP і MOLAP.
40) Які кроки необхідно виконати для створення сховища даних?
Нижче наведено кроки, які необхідно виконати, щоб створити datawaerhouse:
- Збір вимог бізнесу
- Визначення необхідних джерел
- Виявлення фактів
- Визначення розмірів
- Визначення атрибутів
- Перевизначте розміри та атрибути, якщо потрібно
- Організуйте ієрархію атрибутів
- Визначте відносини
- Призначте унікальні ідентифікатори
41) Які є різні типи зберігання даних?
Нижче наведено різні типи зберігання даних:
- Корпоративне сховище даних
- Сховище операційних даних
- Data Mart
42) Що потрібно зробити під час запуску бази даних?
Для запуску бази даних необхідно зробити наступне:
- Запустіть екземпляр
- Змонтувати базу даних
- Відкрийте базу даних
43) Що потрібно зробити, коли база даних вимикається?
Під час завершення роботи бази даних необхідно виконати наступне:
- Закрийте базу даних
- Демонтуйте базу даних
- Вимкніть екземпляр
44) Чи можемо ми зробити резервну копію, коли базу даних відкрито?
Так, ми можемо створити повну резервну копію під час відкриття бази даних.
45) Що визначається як часткове резервне копіювання?
Часткове резервне копіювання в операційна система це резервне копіювання, не повне резервне копіювання, і його можна зробити під час відкриття або завершення роботи бази даних.
46) Яка мета Оптимізатора?
Мета Optimizer — знайти найефективніший спосіб виконання SQL заяви.
47) Що таке план виконання?
План виконання – це план, який використовується оптимізатором для вибору комбінації кроків.
48) Які підходи використовує Оптимізатор під час виконання плану?
Існує два підходи:
- На основі правил
- На основі вартості
49) Які інструменти доступні для ETL?
Доступні інструменти ETL:
Інформатика
Стадія даних
оракул
Будівельник складу
Ab Initio
Data Junction
50) Яка різниця між метаданими та словником даних?
Метадані визначаються як дані про дані. Але словник даних містить інформацію про проектну інформацію, графіки, команди abinito та інформацію про сервер.
Ці запитання для співбесіди також допоможуть вам у життєдіяльності (усному)
дякую за інформацію :)
як інсталювати програмне забезпечення datastage etl tool у моїй Windows 10
Дякуємо за обмін інформацією
hii
Pls
пояснення та теорія сховища даних
Дуже корисна інформація .. Дякую :)
дякую дуже корисно.
Типи SCD не в правильній послідовності.
Тип 0 – фіксований розмір
Зміни заборонені, розміри ніколи не змінюються
Тип 1 – немає історії
Оновлення запису безпосередньо, немає запису історичних значень, єдиний поточний стан
Тип 2 – керування версіями рядків
Відстежуйте зміни як записи версії з поточним прапором, активними датами та іншими метаданими
Тип 3 – стовпець «Попереднє значення».
Відстежуйте зміни в певному атрибуті, додайте стовпець, щоб показати попереднє значення, яке оновлюється в міру подальших змін
Тип 4 – Таблиця історії
Показувати поточне значення в таблиці розмірів, але відстежувати всі зміни в окремій таблиці
Тип 6 – гібридний SCD
Використовуйте методи SCD типів 1, 2 і 3 для відстеження змін
Дякую .. Це корисно
Корисно для перегляду :)
Дякую
Це дуже корисно. Ділитися хорошими речами з людьми.
Мені потрібна допомога, щоб обговорити це питання!
Q: Вас найняли інженером з обробки даних у мегамагазині. Як ви можете використовувати правило асоціації інтелектуального аналізу даних, щоб збільшити продажі мегамагазину?
44. Чи можемо ми зробити резервну копію, коли база даних відкрита?
Так, ми можемо створити повну резервну копію під час відкриття бази даних. Це називається гарячим резервним копіюванням…
q 37 є неправильним
Привіт, дякую, що поділилися своїми думками. Він оновлений..
Дуже добре, сер.
Дякуємо за цінні запитання та прості для розуміння відповіді
Дякую, це мені дуже допомогло
Це дуже приємно, дякую, це мені дуже допомагає.
Легко зрозуміти, дякую
Дякую, мені допомогло.
Загалом дуже корисна інформація, дякую