50 лучших вопросов и ответов на собеседовании с хранилищем данных

Вот вопросы и ответы на собеседовании в Data Warehouse для новичков и опытных кандидатов, желающих получить работу своей мечты.

1) Что такое хранилище данных?

Хранилище данных (DW) — это хранилище данных, которое используется для системы поддержки управленческих решений. Хранилище данных состоит из широкого спектра данных, которые имеют высокий уровень бизнес-условий в определенный момент времени.

Одним словом, это хранилище интегрированной информации, которая может быть доступна для запросов и анализа.


2) Что такое Бизнес-аналитика?

Бизнес-аналитика также известна как DSS — система поддержки принятия решений, которая относится к технологиям, приложениям и практикам сбора, интеграции и анализа бизнес-информации или данных. Даже это помогает увидеть данные о самой информации.

Бесплатная загрузка PDF-файла: Вопросы и ответы для собеседования в хранилище данных


3) Что такое таблица размеров?

Таблица измерений — это таблица, содержащая атрибуты измерений, хранящиеся в таблицах фактов. Эта таблица состоит из иерархий, категорий и логики, которые можно использовать для обхода узлов.


4) Что такое таблица фактов?

Таблица фактов содержит измерения бизнес-процессов и внешние ключи для таблиц измерений.

Пример — если бизнес-процесс — производство кирпичей

Среднее количество кирпичей, произведенных одним человеком/машиной – показатель бизнес-процесса


5) Каковы этапы хранения данных?

Существует четыре этапа хранения данных:

Хранилище данных
Хранилище данных
  • Автономная оперативная база данных
  • Автономное хранилище данных
  • Хранилище данных в реальном времени
  • Интегрированное хранилище данных

6) Что такое интеллектуальный анализ данных?

Интеллектуальный анализ данных представляет собой процесс анализа данных в различных измерениях или перспективах и обобщения их в полезную информацию. Можно запрашивать и получать данные из базы данных в собственном формате.


7) Что такое OLTP?

OLTP сокращенно означает «обработка транзакций в режиме онлайн». Это приложение, которое изменяет данные при каждом их получении и имеет большое количество одновременных пользователей.

Вопросы для собеседования по хранилищу данных
Вопросы для собеседования по хранилищу данных

8) Что такое OLAP?

OLAP сокращенно обозначается как онлайн-аналитическая обработка и представляет собой систему, которая собирает, управляет и обрабатывает многомерные данные для целей анализа и управления.


9) В чем разница между OLTP и OLAP?

Ниже приведены различия между OLTP и OLAP:

OLTP OLAP
Данные взяты из исходного источника данных Данные взяты из разных источников данных
Простые запросы пользователей Сложные запросы по системе
Нормализованная небольшая база данных Денормализованная большая база данных
Фундаментальные бизнес-задачи Многомерные бизнес-задачи

10) Что такое ОДС?

ODS сокращенно обозначается как «Хранилище операционных данных» и представляет собой хранилище операционных данных в реальном времени, а не данных о долгосрочных тенденциях.


11) В чем разница между представлением и материализованным представлением?

Представление — это не что иное, как виртуальная таблица, которая принимает выходные данные запроса и может использоваться вместо таблиц.

Материализованное представление — это не что иное, как косвенный доступ к данным таблицы путем сохранения результатов запроса в отдельной схеме.


12) Что такое ETL?

ETL сокращенно обозначается как Extract, Transform и Load. ETL — это программное обеспечение, которое используется для чтения данных из указанного источника данных и извлечения желаемого подмножества данных. Затем он преобразует данные с помощью правил и таблиц поиска и преобразует их в желаемое состояние.

Затем функция загрузки используется для загрузки полученных данных в целевую базу данных.


13) Что такое ВЛДБ?

VLDB сокращенно обозначается как «Очень большая база данных», и ее размер составляет более одного терабайта. Это системы поддержки принятия решений, которые используются для обслуживания большого количества пользователей.


14) Что такое хранилище данных в реальном времени?

Хранилище данных в режиме реального времени фиксирует бизнес-данные всякий раз, когда они происходят. Когда бизнес-деятельность будет завершена, эти данные будут доступны в потоке и мгновенно станут доступны для использования.


15) Что такое сводные таблицы?

Агрегированные таблицы — это таблицы, содержащие существующие данные хранилища, сгруппированные по определенному уровню измерений. Из агрегированных таблиц легче получить данные, чем из исходной таблицы, в которой больше записей.

Эта таблица снижает нагрузку на сервер базы данных и увеличивает производительность запроса.


16) Что такое таблицы фактов без фактов?

Таблицы фактов без фактов — это таблицы фактов, которые не содержат числовой столбец фактов в таблице фактов.


17) Как мы можем загрузить измерение времени?

Временные измерения обычно загружаются через все возможные даты в году, и это можно сделать с помощью программы. Здесь 100 лет можно представить одной строкой в ​​день.


18) Что такое неаддитивные факты?

Говорят, что факты, не вызывающие привыкания, — это факты, которые невозможно суммировать ни по одному из измерений, представленных в таблице фактов. Если есть изменения в размерах, могут быть полезны те же факты.


19) Что такое конформный факт?

Согласованный факт — это таблица, которую можно использовать в нескольких витринах данных в сочетании с несколькими таблицами фактов.


20) Что такое Datamart?

Datamart — это специализированная версия хранилища данных, содержащая моментальный снимок операционных данных, который помогает деловым людям принимать решения на основе анализа прошлых тенденций и опыта. Витрина данных помогает подчеркнуть легкий доступ к соответствующей информации.


21) Что такое активное хранилище данных?

Активное хранилище данных — это хранилище данных, которое позволяет лицам, принимающим решения в компании или организации, эффективно и результативно управлять взаимоотношениями с клиентами.


22) В чем разница между Datawarehouse и OLAP?

Хранилище данных — это место, где все данные хранятся для анализа, но OLAP используется для анализа данных, управления агрегатами, разделения информации на информацию второстепенного уровня.


23) Что такое ER-диаграмма?

Диаграмма ER сокращенно обозначается как диаграмма «сущность-связь», которая иллюстрирует взаимосвязи между объектами в базе данных. На этой диаграмме показана структура каждой таблицы и связи между таблицами.

Диаграмма ER
Диаграмма ER

24) Каковы ключевые столбцы в таблицах фактов и измерений?

Внешние ключи таблиц измерений являются первичными ключами таблиц сущностей. Внешние ключи таблиц фактов являются первичными ключами таблиц измерений.


25) Что такое СКД?

SCD определяется как медленно меняющиеся измерения и применяется к случаям, когда запись изменяется с течением времени.


26) Какие бывают типы ВСС?

Существует три типа SCD, и они следующие:

SCD 1 – новая запись заменяет исходную запись.

SCD 2 – в существующую таблицу аналитики клиентов добавляется новая запись.

SCD 3 – исходные данные изменяются для включения новых данных.


27) Что такое схема шины?

Схема BUS состоит из набора подтвержденных измерений и стандартизированных определений, если есть таблицы фактов.


28) Что такое звездообразная схема?

Звездообразная схема — это не что иное, как тип организации таблиц таким образом, чтобы результат можно было быстро получить из базы данных в среде хранилища данных.

Схема звезды
Схема звезды

29) Что такое схема снежинки?

Схема «снежинка», имеющая таблицу основных измерений, к которой можно присоединить одно или несколько измерений. Основная таблица измерений — единственная таблица, которую можно соединить с таблицей фактов.

Схема снежинки
Схема снежинки

30) Что такое основное измерение?

Основное измерение — это не что иное, как таблица измерений, которая используется как отдельная таблица фактов или витрина данных.


31) Что называется очисткой данных?

Само название подразумевает, что это термин, говорящий сам за себя. Очистка потерянных записей, нарушение бизнес-правил данных, противоречивые данные и недостающая информация в базе данных.


32) Что такое метаданные?

Метаданные определяются как данные о данных. Метаданные содержат такую ​​информацию, как количество используемых столбцов, фиксированную и ограниченную ширину, порядок полей и типы данных полей.


33) Что такое циклы в хранилище данных?

В хранилищах данных между таблицами существуют циклы. Если между таблицами существует цикл, то генерация запроса займет больше времени и создаст неоднозначность. Рекомендуется избегать циклов между таблицами.


34) Может ли таблица измерений иметь числовое значение?

Да, таблица измерений может иметь числовое значение, поскольку она является описательным элементом нашего бизнеса.


35) Каково определение куба в хранилище данных?

Кубы — это логическое представление многомерных данных. Край куба содержит элементы измерения, а тело куба содержит значения данных.


36) Что называется пространственным моделированием?

Размерное моделирование — это концепция, которую могут использовать проектировщики компаний, занимающихся хранилищем данных, для создания собственного хранилища данных. Эту модель можно хранить в двух типах таблиц — таблица фактов и таблица измерений.

Таблица фактов содержит факты и измерения бизнеса, а таблица измерений содержит контекст измерений.


37) Какие существуют виды размерного моделирования?

Ниже приведены Типы измерений в хранилище данных:

  • Соответствующий размер
  • Размер аутригера
  • Уменьшенное измерение
  • Ролевое измерение
  • Таблица размеров
  • Мусорное измерение
  • Вырожденное измерение
  • Сменный размер
  • Размер шага

38) Что такое суррогатный ключ?

Суррогатный ключ — не что иное, как замена естественного первичного ключа. Он настроен как уникальный идентификатор для каждой строки, который можно использовать в качестве первичного ключа к таблице.


39) В чем разница между ER-моделированием и пространственным моделированием?

ER-моделирование будет иметь логическую и физическую модель, а размерное моделирование будет иметь только физическую модель.

ER-моделирование используется для нормализации конструкции базы данных OLTP, тогда как размерное моделирование используется для денормализации конструкции ROLAP и MOLAP.


40) Каковы шаги по созданию хранилища данных?

Ниже приведены шаги, которые необходимо выполнить для создания хранилища данных:

  • Сбор бизнес-требований
  • Определение необходимых источников
  • Выявление фактов
  • Определение размеров
  • Определение атрибутов
  • При необходимости переопределите измерения и атрибуты.
  • Организуйте иерархию атрибутов
  • Определить отношения
  • Назначить уникальные идентификаторы

41) Каковы различные типы хранения данных?

Ниже приведены различные типы хранилищ данных:

  • Корпоративные хранилища данных
  • Оперативное хранилище данных
  • Магазин данных

42) Что нужно сделать при запуске базы данных?

Для запуска базы данных необходимо сделать следующее:

  1. Запустить экземпляр
  2. Подключите базу данных
  3. Открыть базу данных

43) Что нужно делать при отключении базы данных?

При выключении базы данных необходимо выполнить следующие действия:

  1. Закройте базу данных
  2. Отключить базу данных
  3. Завершить работу экземпляра

44) Можем ли мы сделать резервную копию при открытии базы данных?

Да, мы можем сделать полную резервную копию при открытии базы данных.


45) Что такое частичное резервное копирование?

Частичное резервное копирование в операционная система Это резервная копия, отличная от полной резервной копии, и ее можно выполнить, когда база данных открыта или выключена.


46) Какова цель Оптимизатора?

Цель Оптимизатора — найти наиболее эффективный способ выполнения SQL заявления.


47) Что такое план выполнения?

План выполнения — это план, который используется оптимизатором для выбора комбинации шагов.


48) Какие подходы использует Оптимизатор при выполнении плана?

Есть два подхода:

  1. Основанный на правиле
  2. На основе затрат

49) Какие инструменты доступны для ETL?

Ниже приведены доступные инструменты ETL:

информатика
Этап данных
Oracle
Строитель складов
Ab initio
Соединение данных


50) В чем разница между метаданными и словарем данных?

Метаданные определяются как данные о данных. Но словарь данных содержит информацию о проекте, графиках, командах abinito и информации о сервере.

Эти вопросы для собеседования также помогут вам в устной речи.

Поделиться

21 комментариев

  1. Аватара Мейдан Шварц говорит:

    Спасибо за информацию :)

    1. Аватара Арджун говорит:

      как установить программное обеспечение Datastage etl Tool в мою Windows 10

  2. Шив Гаутам говорит:

    Спасибо за распространение информации

    1. Аватара Саи Шринивас говорит:

      НИ
      Pls
      хранилище данных, объяснение и теория

  3. Аватара Экта Сони говорит:

    Очень полезная информация.. Спасибо :)

  4. Аватара Грахи Пармар говорит:

    Типы SCD расположены в неправильной последовательности.
    Тип 0 – фиксированный размер
    Никакие изменения не допускаются, размер никогда не меняется.
    Тип 1 – Без истории
    Обновить запись напрямую, записей исторических значений нет, только текущее состояние
    Тип 2 – Управление версиями строк
    Отслеживайте изменения в виде записей версий с текущим флагом, датами активности и другими метаданными.
    Тип 3 — Столбец предыдущего значения
    Отслеживайте изменения определенного атрибута, добавляйте столбец для отображения предыдущего значения, которое обновляется по мере дальнейших изменений.
    Тип 4 – Таблица истории
    Показывать текущее значение в таблице измерений, но отслеживать все изменения в отдельной таблице.
    Тип 6 – Гибридное ХДС
    Используйте методы SCD типов 1, 2 и 3 для отслеживания изменений.

    1. Шривидья Кришнамурти говорит:

      Спасибо .. Это полезно

  5. Аватара Арпит Джейн говорит:

    Полезно для пересмотра :)

  6. Аватара Индиго говорит:

    Это очень полезно. Делиться с людьми хорошими вещами.

  7. Аватара Мухаммад Абубакар говорит:

    Мне нужна помощь, чтобы обсудить этот вопрос!
    Вопрос: Вас наняли инженером по работе с данными в мегамагазине. Как вы можете использовать правило ассоциации интеллектуального анализа данных, чтобы увеличить продажи в мегамагазине?

  8. Аватара доктор Дарко Петрушич говорит:

    44. Можем ли мы сделать резервную копию при открытии базы данных?

    Да, мы можем сделать полную резервную копию при открытии базы данных. Это называется горячее резервное копирование…

    1. Алекс Сильверман Алекс Сильверман говорит:

      Здравствуйте, спасибо, что поделились своими мыслями. Он обновляется..

  9. Аватара Анжи говорит:

    Очень хорошо, сэр.
    Спасибо за ценные вопросы и понятные ответы.

  10. Аватара прити говорит:

    Это действительно приятно, спасибо. Это мне очень помогает.

  11. Аватара Асрар Алам говорит:

    В целом очень полезная информация, спасибо

Оставьте комментарий

Ваш электронный адрес не будет опубликован. Обязательные поля помечены * *