50 nejčastějších otázek a odpovědí na rozhovory o datovém skladu
Zde jsou otázky a odpovědi na pohovory Data Warehouse pro čerstvější i zkušené kandidáty, aby získali svou vysněnou práci.
1) Co je to datový sklad?
Data warehousing (DW) je úložiště dat a používá se pro systém podpory rozhodování managementu. Datový sklad se skládá ze široké škály dat, která mají vysokou úroveň obchodních podmínek v jednom okamžiku.
V jedné větě je to úložiště integrovaných informací, které mohou být dostupné pro dotazy a analýzy.
2) Co je Business Intelligence?
Business Intelligence je také známá jako DSS – Systém podpory rozhodování, který se týká technologií, aplikací a postupů pro sběr, integraci a analýzu informací nebo dat souvisejících s podnikáním. Dokonce pomáhá vidět data na samotných informacích.
Zdarma ke stažení ve formátu PDF: Otázky a odpovědi k rozhovoru s datovým skladem
3) Co je tabulka rozměrů?
Tabulka dimenzí je tabulka, která obsahuje atributy měření uložené v tabulkách faktů. Tato tabulka se skládá z hierarchií, kategorií a logiky, které lze použít k procházení v uzlech.
4) Co je tabulka faktů?
Tabulka faktů obsahuje měření obchodních procesů a obsahuje cizí klíče pro tabulky dimenzí.
Příklad – Pokud je obchodním procesem výroba cihel
Průměrný počet cihel vyrobených jednou osobou/strojem – měřítko obchodního procesu
5) Jaké jsou fáze Datawarehousingu?
Datawarehousing má čtyři fáze:

- Offline provozní databáze
- Offline datový sklad
- Datawarehouse v reálném čase
- Integrovaný datový sklad
6) Co je dolování dat?
Data mining je nastaven jako proces analýzy dat v různých dimenzích nebo perspektivách a jejich shrnutí do užitečných informací. Lze dotazovat a získávat data z databáze v jejich vlastním formátu.
7) Co je OLTP?
OLTP je zkráceně označován jako On-Line Transaction Processing a je to aplikace, která upravuje data, kdykoli jsou přijata a má velký počet současných uživatelů.

8) Co je OLAP?
OLAP je zkráceně označován jako Online Analytical Processing a je nastaven jako systém, který shromažďuje, spravuje a zpracovává vícerozměrná data pro účely analýzy a správy.
9) Jaký je rozdíl mezi OLTP a OLAP?
Níže jsou uvedeny rozdíly mezi OLTP a OLAP:
OLTP | OLAP |
---|---|
Data jsou z původního zdroje dat | Data jsou z různých zdrojů dat |
Jednoduché dotazy uživatelů | Složité dotazy podle systému |
Normalizovaná malá databáze | Denormalizovaná velká databáze |
Základní obchodní úkoly | Vícerozměrné obchodní úkoly |
10) Co je ODS?
ODS se zkráceně označuje jako Operational Data Store a je úložištěm provozních dat v reálném čase spíše než dat dlouhodobých trendů.
11) Jaký je rozdíl mezi View a Materialized View?
Pohled není nic jiného než virtuální tabulka, která přebírá výstup dotazu a lze ji použít místo tabulek.
Materializovaný pohled není nic jiného než nepřímý přístup k datům tabulky uložením výsledků dotazu do samostatného schématu.
12) Co je ETL?
ETL se označuje zkratkou Extract, Transform and Load. ETL je software, který se používá ke čtení dat ze specifikovaného zdroje dat a získávání požadované podmnožiny dat. Dále transformuje data pomocí pravidel a vyhledávacích tabulek a převede je do požadovaného stavu.
Poté se použije funkce load k načtení výsledných dat do cílové databáze.
13) Co je VLDB?
VLDB je zkráceně označována jako Very Large Database a její velikost je nastavena na více než jeden terabajt databáze. Jedná se o systémy pro podporu rozhodování, které slouží k obsluhování velkého počtu uživatelů.
14) Co je to datawarehousing v reálném čase?
Datawarehousing v reálném čase zachycuje obchodní data, kdykoli k nim dojde. Po dokončení obchodní činnosti budou tato data k dispozici v toku a budou okamžitě dostupná pro použití.
15) Co jsou souhrnné tabulky?
Souhrnné tabulky jsou tabulky, které obsahují existující data skladu, která byla seskupena do určité úrovně dimenzí. Je snadné načíst data z agregovaných tabulek než původní tabulka, která má více záznamů.
Tato tabulka snižuje zatížení databázového serveru a zvyšuje výkon dotazu.
16) Co jsou tabulky faktů bez faktů?
Tabulky faktů bez faktů jsou tabulky faktů, které v tabulce faktů neobsahují číselný sloupec faktů.
17) Jak můžeme načíst časovou dimenzi?
Časové dimenze se obvykle načítají přes všechna možná data v roce a lze to provést pomocí programu. Zde může být 100 let znázorněno jedním řádkem za den.
18) Co jsou to neaditivní fakta?
Nenávyková fakta jsou považována za fakta, která nelze shrnout pro žádnou z dimenzí přítomných v tabulce faktů. Pokud dojde ke změnám v rozměrech, mohou být užitečná stejná fakta.
19) Co je konformní skutečnost?
Conformed fact je tabulka, kterou lze použít pro více datových trhů v kombinaci s více tabulkami faktů.
20) Co je Datamart?
Datamart je specializovaná verze Datawarehousingu a obsahuje snímek provozních dat, který pomáhá obchodníkům rozhodnout se pomocí analýzy minulých trendů a zkušeností. Datový trh pomáhá klást důraz na snadný přístup k relevantním informacím.
21) Co je Active Datawarehousing?
Aktivní datový sklad je datový sklad, který umožňuje osobám s rozhodovací pravomocí v rámci společnosti nebo organizace efektivně a efektivně řídit vztahy se zákazníky.
22) Jaký je rozdíl mezi Datawarehouse a OLAP?
Datový sklad je místo, kde jsou všechna data uložena pro analýzu, ale OLAP se používá pro analýzu dat, správu agregací, dělení informací na informace menší úrovně.
23) Co je ER diagram?
ER diagram je zkrácen jako Entity-Relationship diagram, který znázorňuje vzájemné vztahy mezi entitami v databázi. Tento diagram ukazuje strukturu jednotlivých tabulek a vazby mezi tabulkami.

24) Jaké jsou klíčové sloupce v tabulkách Fakta a dimenze?
Cizí klíče tabulek dimenzí jsou primární klíče tabulek entit. Cizí klíče tabulek faktů jsou primární klíče tabulek dimenzí.
25) Co je SCD?
SCD je definováno jako pomalu se měnící rozměry a vztahuje se na případy, kdy se záznam mění v průběhu času.
26) Jaké jsou typy SCD?
Existují tři typy SCD a jsou následující:
SCD 1 – Nový záznam nahrazuje původní záznam
SCD 2 – Do stávající tabulky dimenzí zákazníka je přidán nový záznam
SCD 3 – Původní data jsou upravena tak, aby zahrnovala nová data
27) Co je schéma BUS?
Schéma BUS se skládá ze sady potvrzených dimenzí a standardizované definice, pokud existují tabulky faktů.
28) Co je hvězdné schéma?
Hvězdicové schéma není nic jiného než typ organizace tabulek takovým způsobem, že výsledek lze rychle získat z databáze v prostředí datového skladu.

29) Co je schéma sněhové vločky?
Schéma sněhové vločky, které má primární tabulku dimenzí, ke které lze připojit jednu nebo více dimenzí. Primární tabulka dimenzí je jediná tabulka, kterou lze spojit s tabulkou faktů.

30) Co je základní dimenze?
Základní dimenze není nic jiného než tabulka dimenzí, která se používá jako vyhrazená pro tabulku s jedním faktem nebo datamart.
31) Co se nazývá čištění dat?
Samotný název naznačuje, že se jedná o samovysvětlující termín. Čištění osiřelých záznamů, Data porušující obchodní pravidla, Nekonzistentní data a chybějící informace v databázi.
32) Co jsou to metadata?
Metadata jsou definována jako data o datech. Metadata obsahují informace, jako je počet použitých sloupců, pevná šířka a omezená šířka, řazení polí a datové typy polí.
33) Co jsou smyčky v Datawarehousingu?
V datawarehousingu existují mezi tabulkami smyčky. Pokud je mezi tabulkami smyčka, pak generování dotazu zabere více času a vytváří nejednoznačnost. Doporučuje se vyhnout se smyčkám mezi tabulkami.
34) Může mít tabulka dimenzí číselnou hodnotu?
Ano, tabulka rozměrů může mít číselnou hodnotu, protože jde o popisné prvky našeho podnikání.
35) Jaká je definice Cube v Datawarehousingu?
Kostky jsou logickou reprezentací vícerozměrných dat. Hrana krychle má prvky dimenze a tělo krychle obsahuje datové hodnoty.
36) Co se nazývá rozměrové modelování?
Rozměrové modelování je koncept, který mohou použít návrháři datových skladů k vybudování vlastního datového skladu. Tento model lze uložit do dvou typů tabulek – Fakta a Tabulka dimenzí.
Tabulka faktů obsahuje fakta a měření podniku a tabulka dimenzí obsahuje kontext měření.
37) Jaké jsou typy rozměrového modelování?
Následující jsou Typy dimenzí v datovém skladu:
- Přizpůsobený rozměr
- Rozměr výložníku
- Zmenšený rozměr
- Dimenze hraní rolí
- Dimension to Dimension Table
- Nevyžádaná dimenze
- Degenerovaná dimenze
- Vyměnitelný rozměr
- Krok Dimenze
38) Co je náhradní klíč?
Náhradní klíč není nic jiného než náhrada přirozeného primárního klíče. Je nastaven tak, aby byl jedinečným identifikátorem pro každý řádek, který lze použít pro primární klíč k tabulce.
39) Jaký je rozdíl mezi ER modelováním a rozměrovým modelováním?
ER modelování bude mít logický a fyzický model, ale rozměrové modelování bude mít pouze fyzický model.
ER Modeling se používá pro normalizaci návrhu databáze OLTP, zatímco Dimensional Modeling se používá pro denormalizaci návrhu ROLAP a MOLAP.
40) Jaké jsou kroky k vybudování datového skladu?
Při budování datového skladu je třeba dodržet následující kroky:
- Shromažďování obchodních požadavků
- Identifikace potřebných zdrojů
- Identifikace faktů
- Definování rozměrů
- Definování atributů
- V případě potřeby předefinujte rozměry a atributy
- Uspořádejte hierarchii atributů
- Definujte vztahy
- Přiřaďte jedinečné identifikátory
41) Jaké jsou různé typy datawarehosuingu?
Níže jsou uvedeny různé typy Datawarehousingu:
- Enterprise Datawarehousing
- Provozní úložiště dat
- Data Mart
42) Co je potřeba udělat při spouštění databáze?
Pro spuštění databáze je třeba provést následující:
- Spusťte instanci
- Připojte databázi
- Otevřete databázi
43) Co je třeba udělat, když je databáze vypnutá?
Při vypnutí databáze je třeba provést následující:
- Zavřete databázi
- Odpojte databázi
- Vypněte instanci
44) Můžeme provést zálohu při otevření databáze?
Ano, při otevření databáze můžeme provést úplnou zálohu.
45) Co je definováno jako částečná záloha?
A Částečná záloha v an operační systém je záloha krátká než plná záloha a lze ji provést při otevírání nebo vypínání databáze.
46) Co je cílem Optimalizátoru?
Cílem Optimalizátoru je najít nejúčinnější způsob, jak provést SQL prohlášení.
47) Co je exekuční plán?
Plán provádění je plán, který optimalizátor používá k výběru kombinace kroků.
48) Jaké přístupy používá Optimizer při provádění plánu?
Existují dva přístupy:
- Na základě pravidel
- Na základě nákladů
49) Jaké jsou dostupné nástroje pro ETL?
K dispozici jsou následující nástroje ETL:
Informatika
Datová fáze
Věštec
Stavitel skladu
Ab Initio
Datové spojení
50) Jaký je rozdíl mezi metadaty a datovým slovníkem?
Metadata jsou definována jako data o datech. Datový slovník však obsahuje informace o projektu, grafy, příkazy abinito a informace o serveru.
Tyto otázky na pohovoru také pomohou ve vašem životě (ústních)
Děkuji za informace :)
jak nainstalovat software datastage etl tool do mého windows10
děkuji za sdílení informací
hii
pls
datový sklad vysvětlit a thoery
Velmi užitečné informace.. Díky :)
Dík! velmi nápomocný.
Typy SCD nejsou ve správném pořadí.
Typ 0 – Pevný rozměr
Žádné změny nejsou povoleny, rozměr se nikdy nemění
Typ 1 – Bez historie
Aktualizujte záznam přímo, chybí záznam historických hodnot, jediný aktuální stav
Typ 2 – Řádkové verzování
Sledujte změny jako záznamy verze s aktuálním příznakem a aktivními daty a dalšími metadaty
Typ 3 – sloupec Předchozí hodnota
Sledujte změnu konkrétního atributu, přidejte sloupec pro zobrazení předchozí hodnoty, která se aktualizuje, když dojde k dalším změnám
Typ 4 – Tabulka historie
Zobrazit aktuální hodnotu v tabulce rozměrů, ale sledovat všechny změny v samostatné tabulce
Typ 6 – Hybridní SCD
Ke sledování změn použijte techniky z SCD typů 1, 2 a 3
Díky .. To je užitečné
Užitečné při revizi :)
Díky
Je to velmi užitečné. Sdílet s lidmi dobré věci.
Potřebuji pomoc s diskusí o této otázce!
Otázka: Jste najatý jako datový inženýr domu ve velkém obchodě. Jak můžete použít asociační pravidlo dolování dat ke zvýšení prodeje mega obchodu?
44. Můžeme provést zálohu při otevření databáze?
Ano, při otevření databáze můžeme provést úplnou zálohu. Říká se tomu horké zálohování…
q 37 je nesprávné
Dobrý den, děkujeme za sdílení vašich názorů. Je aktualizován..
Velmi dobrý pane.
Děkujeme za cenné otázky a srozumitelné odpovědi
Díky, moc mi to pomohlo
Je to moc hezké díky moc mi to pomáhá.
Snadno pochopitelné děkuji
Děkuji, pomohlo mi to.
Celkově velmi užitečné informace, děkuji