50-те най-добри въпроса и отговора за интервю за Data Warehouse

Ето въпроси и отговори за интервю за Data Warehouse за по-свежи и опитни кандидати, за да получат мечтаната работа.

1) Какво е Data Warehouse?

Съхранението на данни (DW) е хранилище на данни и се използва за система за подпомагане на управленски решения. Складът за данни се състои от голямо разнообразие от данни, които имат високо ниво на бизнес условия в един момент.

В едно изречение, това е хранилище на интегрирана информация, която може да бъде достъпна за заявки и анализ.


2) Какво е Бизнес разузнаване?

Бизнес разузнаването е известно още като DSS – система за подпомагане на вземането на решения, която се отнася до технологиите, приложението и практиките за събиране, интегриране и анализ на информация или данни, свързани с бизнеса. Дори помага да се видят данните върху самата информация.

Безплатно изтегляне на PDF: Data Warehouse Интервю Въпроси и отговори


3) Какво е таблица с размери?

Таблицата с размери е таблица, която съдържа атрибути на измервания, съхранени в таблици с факти. Тази таблица се състои от йерархии, категории и логика, които могат да се използват за преминаване във възли.


4) Какво е таблица с факти?

Фактическата таблица съдържа измерването на бизнес процесите и съдържа външни ключове за таблиците с измерения.

Пример – Ако бизнес процесът е производство на тухли

Среден брой тухли, произведени от един човек/машина – мярка за бизнес процеса


5) Какви са етапите на Datawarehousing?

Има четири етапа на Datawarehousing:

Склад за данни
Склад за данни
  • Офлайн оперативна база данни
  • Офлайн хранилище за данни
  • Datawarehouse в реално време
  • Интегриран Datawarehouse

6) Какво е извличане на данни?

Извличането на данни е настроено да бъде процес на анализиране на данните в различни измерения или перспективи и обобщаване в полезна информация. Могат да се правят заявки и да се извличат данните от базата данни в техния собствен формат.


7) Какво е OLTP?

OLTP е съкратено като On-Line Transaction Processing и е приложение, което променя данните, когато ги получи, и има голям брой едновременни потребители.

Въпроси за интервю за Data Warehouse
Въпроси за интервю за Data Warehouse

8) Какво е OLAP?

OLAP е съкратено като Online Analytical Processing и е настроен да бъде система, която събира, управлява и обработва многоизмерни данни за целите на анализа и управлението.


9) Каква е разликата между OLTP и OLAP?

Следват разликите между OLTP и OLAP:

OLTP OLAP
Данните са от оригиналния източник на данни Данните са от различни източници на данни
Прости заявки от потребители Комплексни заявки по система
Нормализирана малка база данни Денормализирана голяма база данни
Основни бизнес задачи Многомерни бизнес задачи

10) Какво е ODS?

ODS е съкратено като Operational Data Store и е хранилище на оперативни данни в реално време, а не данни за дългосрочни тенденции.


11) Каква е разликата между изглед и материализиран изглед?

Изгледът не е нищо друго освен виртуална таблица, която взема резултата от заявката и може да се използва вместо таблици.

Материализираният изглед не е нищо друго освен индиректен достъп до данните от таблицата чрез съхраняване на резултатите от заявка в отделна схема.


12) Какво е ETL?

ETL е съкратено като Extract, Transform and Load. ETL е софтуер, който се използва за четене на данни от определен източник на данни и извлича желано подмножество от данни. След това трансформира данните с помощта на правила и справочни таблици и ги преобразува в желано състояние.

След това функцията за зареждане се използва за зареждане на получените данни в целевата база данни.


13) Какво е VLDB?

VLDB е съкратено като Very Large Database и нейният размер е зададен да бъде повече от един терабайт база данни. Това са системи за подпомагане на вземането на решения, които се използват за обслужване на голям брой потребители.


14) Какво е съхраняване на данни в реално време?

Съхранението на данни в реално време улавя бизнес данните, когато се появят. Когато има завършена бизнес дейност, тези данни ще бъдат налични в потока и ще станат достъпни за използване незабавно.


15) Какво представляват обобщените таблици?

Агрегираните таблици са таблиците, които съдържат съществуващите складови данни, които са групирани на определено ниво на измерения. Лесно е да се извлекат данни от агрегираните таблици, отколкото от оригиналната таблица, която има повече записи.

Тази таблица намалява натоварването в сървъра на базата данни и увеличава производителността на заявката.


16) Какво представляват таблици с факти без факти?

Фактологичните таблици без факти са таблицата с факти, която не съдържа числова колона с факти в таблицата с факти.


17) Как можем да заредим измерението време?

Времевите измерения обикновено се зареждат през всички възможни дати в годината и това може да се направи чрез програма. Тук 100 години могат да бъдат представени с един ред на ден.


18) Какво представляват неадитивните факти?

Непристрастяващите факти се наричат ​​​​факти, които не могат да бъдат обобщени за нито едно от измеренията, присъстващи в таблицата с факти. Ако има промени в размерите, същите факти могат да бъдат полезни.


19) Какво е конформиран факт?

Съгласуваният факт е таблица, която може да се използва в множество витрини с данни в комбинация с множество таблици с факти.


20) Какво е Datamart?

Datamart е специализирана версия на Datawarehousing и съдържа моментна снимка на оперативни данни, която помага на бизнесмените да вземат решение с анализа на минали тенденции и опит. Витрината за данни помага да се наблегне на лесния достъп до подходяща информация.


21) Какво е Active Datawarehousing?

Активното хранилище за данни е хранилище за данни, което позволява на лицата, вземащи решения в рамките на компания или организация, да управляват взаимоотношенията с клиенти ефективно и ефикасно.


22) Каква е разликата между Datawarehouse и OLAP?

Datawarehouse е място, където се съхраняват всички данни за анализиране, но OLAP се използва за анализиране на данните, управление на агрегации, разделяне на информация на второстепенно ниво.


23) Какво е ER диаграма?

ER диаграмата е съкратено като Entity-Relationship diagram, която илюстрира взаимовръзките между обектите в базата данни. Тази диаграма показва структурата на всяка таблица и връзките между таблиците.

ER диаграма

24) Кои са ключовите колони в таблиците с факти и измерения?

Външните ключове на таблици с размери са първични ключове на таблици на обекти. Външните ключове на таблиците с факти са първичните ключове на таблиците с измерения.


25) Какво е SCD?

SCD се определя като бавно променящи се измерения и се прилага за случаите, когато записът се променя с течение на времето.


26) Какви са видовете SCD?

Има три вида SCD и те са както следва:

SCD 1 – Новият запис замества оригиналния запис

SCD 2 – Добавя се нов запис към съществуващата таблица с размери на клиента

SCD 3 – Оригиналните данни са модифицирани, за да включват нови данни


27) Какво е BUS схема?

BUS схемата се състои от набор от потвърдени измерения и стандартизирана дефиниция, ако има таблици с факти.


28) Какво е звездна схема?

Звездовидната схема не е нищо друго освен вид организиране на таблиците по такъв начин, че резултатът да може бързо да бъде извлечен от базата данни в средата на хранилището на данни.

Звездна схема

29) Какво е схема на снежинка?

Схема на снежинка, която има основна таблица с размери, към която могат да бъдат присъединени едно или повече измерения. Основната таблица с измерения е единствената таблица, която може да бъде обединена с таблицата на фактите.

Схема на снежинка

30) Какво е основно измерение?

Основното измерение не е нищо друго освен таблица с измерения, която се използва като предназначена за таблица с единични факти или база данни.


31) Какво се нарича почистване на данни?

Самото име предполага, че това е самообясняващ се термин. Почистване на осиротели записи, Данни, нарушаващи бизнес правилата, Непоследователни данни и липсваща информация в база данни.


32) Какво представляват метаданните?

Метаданните се дефинират като данни за данните. Метаданните съдържат информация като брой използвани колони, фиксирана ширина и ограничена ширина, подреждане на полетата и типове данни на полетата.


33) Какво представляват циклите в Datawarehousing?

При съхраняването на данни съществуват цикли между таблиците. Ако има цикъл между таблиците, тогава генерирането на заявка ще отнеме повече време и създава неяснота. Препоръчително е да избягвате цикли между масите.


34) Дали таблицата с размери може да има числова стойност?

Да, таблицата с размери може да има числова стойност, тъй като те са описателните елементи на нашия бизнес.


35) Каква е дефиницията на Cube в Datawarehousing?

Кубовете са логическо представяне на многоизмерни данни. Ръбът на куба има елементите на измерението, а тялото на куба съдържа стойностите на данните.


36) Какво се нарича дименсионално моделиране?

Дименсионалното моделиране е концепция, която може да се използва от дизайнерите на хранилища за данни, за да изградят свои собствени хранилища за данни. Този модел може да се съхранява в два типа таблици – Факти и Таблица с измерения.

Таблицата с факти съдържа факти и измервания на бизнеса, а таблицата с измерения съдържа контекста на измерванията.


37) Какви са видовете дименсионално моделиране?

Следват Видове измерения в Data Warehouse:

  • Съгласувано измерение
  • Размер на аутригера
  • Свито измерение
  • Ролева игра Dimension
  • Таблица от размери към размери
  • Нежелано измерение
  • Изродено измерение
  • Сменяемо измерение
  • Измерение на стъпката

38) Какво е сурогатен ключ?

Сурогатният ключ не е нищо друго освен заместител на естествения първичен ключ. Настроен е да бъде уникален идентификатор за всеки ред, който може да се използва за първичен ключ към таблица.


39) Каква е разликата между ER моделиране и дименсионално моделиране?

ER моделирането ще има логически и физически модел, но дименсионалното моделиране ще има само физически модел.

ER моделирането се използва за нормализиране на дизайна на OLTP базата данни, докато размерното моделиране се използва за денормализиране на ROLAP и MOLAP дизайна.


40) Какви са стъпките за изграждане на склад за данни?

Следват стъпките, които трябва да се следват за изграждане на datawaerhouse:

  • Събиране на бизнес изисквания
  • Идентифициране на необходимите източници
  • Идентифициране на фактите
  • Определяне на размерите
  • Дефиниране на атрибутите
  • Предефинирайте размерите и атрибутите, ако е необходимо
  • Организирайте йерархията на атрибутите
  • Дефиниране на връзки
  • Присвояване на уникални идентификатори

41) Какви са различните видове съхранение на данни?

Следват различните видове Datawarehousing:

  • Корпоративно съхранение на данни
  • Оперативно хранилище на данни
  • Data Mart

42) Какво трябва да се направи при стартиране на базата данни?

За да стартирате базата данни, трябва да направите следното:

  1. Стартирайте екземпляр
  2. Монтирайте базата данни
  3. Отворете базата данни

43) Какво трябва да се направи, когато базата данни се изключи?

Когато базата данни е изключена, трябва да се направи следното:

  1. Затворете базата данни
  2. Демонтирайте базата данни
  3. Изключете екземпляра

44) Можем ли да направим резервно копие, когато базата данни е отворена?

Да, можем да направим пълно архивиране, когато базата данни е отворена.


45) Какво се определя като частично архивиране?

Частично архивиране в an операционната система е резервно копие по-малко от пълно архивиране и може да се направи, докато базата данни е отворена или изключена.


46) Каква е целта на оптимизатора?

Целта на Optimizer е да намери най-ефективния начин за изпълнение на SQL изявления.


47) Какво е план за изпълнение?

Планът за изпълнение е план, който се използва от оптимизатора за избор на комбинация от стъпки.


48) Какви са подходите, използвани от Optimizer по време на плана за изпълнение?

Има два подхода:

  1. Базирано на правила
  2. Въз основа на разходите

49) Какви са наличните инструменти за ETL?

Следват наличните ETL инструменти:

Информатика
Етап на данни
Оракул
Строител на складове
Ab Initio
Data Junction


50) Каква е разликата между метаданни и речник на данни?

Метаданните се дефинират като данни за данните. Но речникът на данните съдържа информация за информацията за проекта, графики, abinito команди и информация за сървъра.

Тези въпроси за интервюто също ще ви помогнат във вашата viva (устна)

Сподели

21 Коментари

  1. въплъщение Мейдан Шварц казва:

    благодаря ти за информацията :)

    1. въплъщение арджун казва:

      как да инсталирам софтуера datastage etl tool в моя windows10

  2. Шив Гаутам казва:

    благодаря за споделената информация

    1. въплъщение саи шринивас казва:

      Hii
      АД
      съхранение на данни обяснява и теория

  3. въплъщение Екта Сони казва:

    Много полезна информация.. Благодаря :)

  4. въплъщение МИР БИЛАЛ казва:

    благодаря много полезно.

  5. въплъщение Грахи Пармар казва:

    Типовете SCD не са в правилната последователност.
    Тип 0 – Фиксирано измерение
    Не са разрешени промени, измерението никога не се променя
    Тип 1 – Без история
    Актуализирайте записа директно, няма запис на исторически стойности, единственото текущо състояние
    Тип 2 – Версии на редове
    Проследявайте промените като записи на версии с текущо знаме и активни дати и други метаданни
    Тип 3 – Колона с предишна стойност
    Проследете промяната на конкретен атрибут, добавете колона, за да покажете предишната стойност, която се актуализира при по-нататъшни промени
    Тип 4 – Историческа таблица
    Показване на текущата стойност в таблицата с размерите, но проследяване на всички промени в отделна таблица
    Тип 6 – Хибриден SCD
    Използвайте техники от SCD типове 1, 2 и 3, за да проследите промяната

    1. Шривидя Кришнамурти казва:

      Благодаря .. Това е полезно

  6. въплъщение Арпит джайн казва:

    Полезно за преразглеждане :)

  7. въплъщение Оцветител казва:

    Много е полезно. За споделяне на хубави неща с хората.

  8. въплъщение Мохамед Абубакар казва:

    Имам нужда от помощ, за да обсъдя този въпрос!
    Въпрос: Вие сте нает като инженер в мегамагазин. Как можете да използвате правилото за асоцииране на извличане на данни, за да увеличите продажбите на мега магазина?

  9. въплъщение д-р Дарко Петрушич казва:

    44. Можем ли да направим резервно копие, когато базата данни е отворена?

    Да, можем да направим пълно архивиране, когато базата данни е отворена. Нарича се горещо архивиране...

    1. Алекс Силвърман Алекс Силвърман казва:

      Здравейте, благодаря, че споделихте мислите си. Актуализиран е..

  10. въплъщение Anji казва:

    Много добре сър.
    Благодарим ви, че предоставихте ценни въпроси и лесни за разбиране отговори

  11. въплъщение Прити казва:

    Наистина е хубаво, благодаря, много ми помага.

  12. въплъщение Payal казва:

    Лесно за разбиране благодаря

  13. въплъщение Асрар Алам казва:

    Като цяло много полезна информация, благодаря

Оставете коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани *