50 nejčastějších otázek a odpovědí na rozhovory o datovém skladu

Zde jsou otázky a odpovědi na pohovory Data Warehouse pro čerstvější i zkušené kandidáty, aby získali svou vysněnou práci.

1) Co je to datový sklad?

Data warehousing (DW) je úložiště dat a používá se pro systém podpory rozhodování managementu. Datový sklad se skládá ze široké škály dat, která mají vysokou úroveň obchodních podmínek v jednom okamžiku.

V jedné větě je to úložiště integrovaných informací, které mohou být dostupné pro dotazy a analýzy.


2) Co je Business Intelligence?

Business Intelligence je také známá jako DSS – Systém podpory rozhodování, který se týká technologií, aplikací a postupů pro sběr, integraci a analýzu informací nebo dat souvisejících s podnikáním. Dokonce pomáhá vidět data na samotných informacích.

Zdarma ke stažení ve formátu PDF: Otázky a odpovědi k rozhovoru s datovým skladem


3) Co je tabulka rozměrů?

Tabulka dimenzí je tabulka, která obsahuje atributy měření uložené v tabulkách faktů. Tato tabulka se skládá z hierarchií, kategorií a logiky, které lze použít k procházení v uzlech.


4) Co je tabulka faktů?

Tabulka faktů obsahuje měření obchodních procesů a obsahuje cizí klíče pro tabulky dimenzí.

Příklad – Pokud je obchodním procesem výroba cihel

Průměrný počet cihel vyrobených jednou osobou/strojem – měřítko obchodního procesu


5) Jaké jsou fáze Datawarehousingu?

Datawarehousing má čtyři fáze:

Datový sklad
Datový sklad
  • Offline provozní databáze
  • Offline datový sklad
  • Datawarehouse v reálném čase
  • Integrovaný datový sklad

6) Co je dolování dat?

Data mining je nastaven jako proces analýzy dat v různých dimenzích nebo perspektivách a jejich shrnutí do užitečných informací. Lze dotazovat a získávat data z databáze v jejich vlastním formátu.


7) Co je OLTP?

OLTP je zkráceně označován jako On-Line Transaction Processing a je to aplikace, která upravuje data, kdykoli jsou přijata a má velký počet současných uživatelů.

Otázky k pohovoru o datovém skladu
Otázky k pohovoru o datovém skladu

8) Co je OLAP?

OLAP je zkráceně označován jako Online Analytical Processing a je nastaven jako systém, který shromažďuje, spravuje a zpracovává vícerozměrná data pro účely analýzy a správy.


9) Jaký je rozdíl mezi OLTP a OLAP?

Níže jsou uvedeny rozdíly mezi OLTP a OLAP:

OLTP OLAP
Data jsou z původního zdroje dat Data jsou z různých zdrojů dat
Jednoduché dotazy uživatelů Složité dotazy podle systému
Normalizovaná malá databáze Denormalizovaná velká databáze
Základní obchodní úkoly Vícerozměrné obchodní úkoly

10) Co je ODS?

ODS se zkráceně označuje jako Operational Data Store a je úložištěm provozních dat v reálném čase spíše než dat dlouhodobých trendů.


11) Jaký je rozdíl mezi View a Materialized View?

Pohled není nic jiného než virtuální tabulka, která přebírá výstup dotazu a lze ji použít místo tabulek.

Materializovaný pohled není nic jiného než nepřímý přístup k datům tabulky uložením výsledků dotazu do samostatného schématu.


12) Co je ETL?

ETL se označuje zkratkou Extract, Transform and Load. ETL je software, který se používá ke čtení dat ze specifikovaného zdroje dat a získávání požadované podmnožiny dat. Dále transformuje data pomocí pravidel a vyhledávacích tabulek a převede je do požadovaného stavu.

Poté se použije funkce load k načtení výsledných dat do cílové databáze.


13) Co je VLDB?

VLDB je zkráceně označována jako Very Large Database a její velikost je nastavena na více než jeden terabajt databáze. Jedná se o systémy pro podporu rozhodování, které slouží k obsluhování velkého počtu uživatelů.


14) Co je to datawarehousing v reálném čase?

Datawarehousing v reálném čase zachycuje obchodní data, kdykoli k nim dojde. Po dokončení obchodní činnosti budou tato data k dispozici v toku a budou okamžitě dostupná pro použití.


15) Co jsou souhrnné tabulky?

Souhrnné tabulky jsou tabulky, které obsahují existující data skladu, která byla seskupena do určité úrovně dimenzí. Je snadné načíst data z agregovaných tabulek než původní tabulka, která má více záznamů.

Tato tabulka snižuje zatížení databázového serveru a zvyšuje výkon dotazu.


16) Co jsou tabulky faktů bez faktů?

Tabulky faktů bez faktů jsou tabulky faktů, které v tabulce faktů neobsahují číselný sloupec faktů.


17) Jak můžeme načíst časovou dimenzi?

Časové dimenze se obvykle načítají přes všechna možná data v roce a lze to provést pomocí programu. Zde může být 100 let znázorněno jedním řádkem za den.


18) Co jsou to neaditivní fakta?

Nenávyková fakta jsou považována za fakta, která nelze shrnout pro žádnou z dimenzí přítomných v tabulce faktů. Pokud dojde ke změnám v rozměrech, mohou být užitečná stejná fakta.


19) Co je konformní skutečnost?

Conformed fact je tabulka, kterou lze použít pro více datových trhů v kombinaci s více tabulkami faktů.


20) Co je Datamart?

Datamart je specializovaná verze Datawarehousingu a obsahuje snímek provozních dat, který pomáhá obchodníkům rozhodnout se pomocí analýzy minulých trendů a zkušeností. Datový trh pomáhá klást důraz na snadný přístup k relevantním informacím.


21) Co je Active Datawarehousing?

Aktivní datový sklad je datový sklad, který umožňuje osobám s rozhodovací pravomocí v rámci společnosti nebo organizace efektivně a efektivně řídit vztahy se zákazníky.


22) Jaký je rozdíl mezi Datawarehouse a OLAP?

Datový sklad je místo, kde jsou všechna data uložena pro analýzu, ale OLAP se používá pro analýzu dat, správu agregací, dělení informací na informace menší úrovně.


23) Co je ER diagram?

ER diagram je zkrácen jako Entity-Relationship diagram, který znázorňuje vzájemné vztahy mezi entitami v databázi. Tento diagram ukazuje strukturu jednotlivých tabulek a vazby mezi tabulkami.

ER diagram
ER diagram

24) Jaké jsou klíčové sloupce v tabulkách Fakta a dimenze?

Cizí klíče tabulek dimenzí jsou primární klíče tabulek entit. Cizí klíče tabulek faktů jsou primární klíče tabulek dimenzí.


25) Co je SCD?

SCD je definováno jako pomalu se měnící rozměry a vztahuje se na případy, kdy se záznam mění v průběhu času.


26) Jaké jsou typy SCD?

Existují tři typy SCD a jsou následující:

SCD 1 – Nový záznam nahrazuje původní záznam

SCD 2 – Do stávající tabulky dimenzí zákazníka je přidán nový záznam

SCD 3 – Původní data jsou upravena tak, aby zahrnovala nová data


27) Co je schéma BUS?

Schéma BUS se skládá ze sady potvrzených dimenzí a standardizované definice, pokud existují tabulky faktů.


28) Co je hvězdné schéma?

Hvězdicové schéma není nic jiného než typ organizace tabulek takovým způsobem, že výsledek lze rychle získat z databáze v prostředí datového skladu.

Hvězdné schéma
Hvězdné schéma

29) Co je schéma sněhové vločky?

Schéma sněhové vločky, které má primární tabulku dimenzí, ke které lze připojit jednu nebo více dimenzí. Primární tabulka dimenzí je jediná tabulka, kterou lze spojit s tabulkou faktů.

Schéma sněhové vločky
Schéma sněhové vločky

30) Co je základní dimenze?

Základní dimenze není nic jiného než tabulka dimenzí, která se používá jako vyhrazená pro tabulku s jedním faktem nebo datamart.


31) Co se nazývá čištění dat?

Samotný název naznačuje, že se jedná o samovysvětlující termín. Čištění osiřelých záznamů, Data porušující obchodní pravidla, Nekonzistentní data a chybějící informace v databázi.


32) Co jsou to metadata?

Metadata jsou definována jako data o datech. Metadata obsahují informace, jako je počet použitých sloupců, pevná šířka a omezená šířka, řazení polí a datové typy polí.


33) Co jsou smyčky v Datawarehousingu?

V datawarehousingu existují mezi tabulkami smyčky. Pokud je mezi tabulkami smyčka, pak generování dotazu zabere více času a vytváří nejednoznačnost. Doporučuje se vyhnout se smyčkám mezi tabulkami.


34) Může mít tabulka dimenzí číselnou hodnotu?

Ano, tabulka rozměrů může mít číselnou hodnotu, protože jde o popisné prvky našeho podnikání.


35) Jaká je definice Cube v Datawarehousingu?

Kostky jsou logickou reprezentací vícerozměrných dat. Hrana krychle má prvky dimenze a tělo krychle obsahuje datové hodnoty.


36) Co se nazývá rozměrové modelování?

Rozměrové modelování je koncept, který mohou použít návrháři datových skladů k vybudování vlastního datového skladu. Tento model lze uložit do dvou typů tabulek – Fakta a Tabulka dimenzí.

Tabulka faktů obsahuje fakta a měření podniku a tabulka dimenzí obsahuje kontext měření.


37) Jaké jsou typy rozměrového modelování?

Následující jsou Typy dimenzí v datovém skladu:

  • Přizpůsobený rozměr
  • Rozměr výložníku
  • Zmenšený rozměr
  • Dimenze hraní rolí
  • Dimension to Dimension Table
  • Nevyžádaná dimenze
  • Degenerovaná dimenze
  • Vyměnitelný rozměr
  • Krok Dimenze

38) Co je náhradní klíč?

Náhradní klíč není nic jiného než náhrada přirozeného primárního klíče. Je nastaven tak, aby byl jedinečným identifikátorem pro každý řádek, který lze použít pro primární klíč k tabulce.


39) Jaký je rozdíl mezi ER modelováním a rozměrovým modelováním?

ER modelování bude mít logický a fyzický model, ale rozměrové modelování bude mít pouze fyzický model.

ER Modeling se používá pro normalizaci návrhu databáze OLTP, zatímco Dimensional Modeling se používá pro denormalizaci návrhu ROLAP a MOLAP.


40) Jaké jsou kroky k vybudování datového skladu?

Při budování datového skladu je třeba dodržet následující kroky:

  • Shromažďování obchodních požadavků
  • Identifikace potřebných zdrojů
  • Identifikace faktů
  • Definování rozměrů
  • Definování atributů
  • V případě potřeby předefinujte rozměry a atributy
  • Uspořádejte hierarchii atributů
  • Definujte vztahy
  • Přiřaďte jedinečné identifikátory

41) Jaké jsou různé typy datawarehosuingu?

Níže jsou uvedeny různé typy Datawarehousingu:

  • Enterprise Datawarehousing
  • Provozní úložiště dat
  • Data Mart

42) Co je potřeba udělat při spouštění databáze?

Pro spuštění databáze je třeba provést následující:

  1. Spusťte instanci
  2. Připojte databázi
  3. Otevřete databázi

43) Co je třeba udělat, když je databáze vypnutá?

Při vypnutí databáze je třeba provést následující:

  1. Zavřete databázi
  2. Odpojte databázi
  3. Vypněte instanci

44) Můžeme provést zálohu při otevření databáze?

Ano, při otevření databáze můžeme provést úplnou zálohu.


45) Co je definováno jako částečná záloha?

A Částečná záloha v an operační systém je záloha krátká než plná záloha a lze ji provést při otevírání nebo vypínání databáze.


46) Co je cílem Optimalizátoru?

Cílem Optimalizátoru je najít nejúčinnější způsob, jak provést SQL prohlášení.


47) Co je exekuční plán?

Plán provádění je plán, který optimalizátor používá k výběru kombinace kroků.


48) Jaké přístupy používá Optimizer při provádění plánu?

Existují dva přístupy:

  1. Na základě pravidel
  2. Na základě nákladů

49) Jaké jsou dostupné nástroje pro ETL?

K dispozici jsou následující nástroje ETL:

Informatika
Datová fáze
Věštec
Stavitel skladu
Ab Initio
Datové spojení


50) Jaký je rozdíl mezi metadaty a datovým slovníkem?

Metadata jsou definována jako data o datech. Datový slovník však obsahuje informace o projektu, grafy, příkazy abinito a informace o serveru.

Tyto otázky na pohovoru také pomohou ve vašem životě (ústních)

Sdílet

21 Komentáře

    1. jak nainstalovat software datastage etl tool do mého windows10

  1. Shiv Gautam říká:

    děkuji za sdílení informací

    1. avatar sai srinivas říká:

      hii
      pls
      datový sklad vysvětlit a thoery

  2. avatar Ekta Soni říká:

    Velmi užitečné informace.. Díky :)

  3. avatar Grahi Parmar říká:

    Typy SCD nejsou ve správném pořadí.
    Typ 0 – Pevný rozměr
    Žádné změny nejsou povoleny, rozměr se nikdy nemění
    Typ 1 – Bez historie
    Aktualizujte záznam přímo, chybí záznam historických hodnot, jediný aktuální stav
    Typ 2 – Řádkové verzování
    Sledujte změny jako záznamy verze s aktuálním příznakem a aktivními daty a dalšími metadaty
    Typ 3 – sloupec Předchozí hodnota
    Sledujte změnu konkrétního atributu, přidejte sloupec pro zobrazení předchozí hodnoty, která se aktualizuje, když dojde k dalším změnám
    Typ 4 – Tabulka historie
    Zobrazit aktuální hodnotu v tabulce rozměrů, ale sledovat všechny změny v samostatné tabulce
    Typ 6 – Hybridní SCD
    Ke sledování změn použijte techniky z SCD typů 1, 2 a 3

    1. Srividya Krishnamoorthy říká:

      Díky .. To je užitečné

  4. Je to velmi užitečné. Sdílet s lidmi dobré věci.

  5. avatar Muhammad Abubakar říká:

    Potřebuji pomoc s diskusí o této otázce!
    Otázka: Jste najatý jako datový inženýr domu ve velkém obchodě. Jak můžete použít asociační pravidlo dolování dat ke zvýšení prodeje mega obchodu?

  6. avatar doktor Darko Petrusic říká:

    44. Můžeme provést zálohu při otevření databáze?

    Ano, při otevření databáze můžeme provést úplnou zálohu. Říká se tomu horké zálohování…

    1. Alex Silverman Alex Silverman říká:

      Dobrý den, děkujeme za sdílení vašich názorů. Je aktualizován..

  7. Velmi dobrý pane.
    Děkujeme za cenné otázky a srozumitelné odpovědi

  8. avatar přiti říká:

    Je to moc hezké díky moc mi to pomáhá.

  9. avatar Asrar Alam říká:

    Celkově velmi užitečné informace, děkuji

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *