19 nejčastějších otázek a odpovědí na pohovory od začátku (2024)
1) Uveďte, co je Abintio?
„Abinitio“ je latinské slovo, které znamená „od počátku“. Abinitio je nástroj používaný k extrahování, transformaci a načítání dat. Používá se také pro analýzu dat, manipulaci s daty, dávkové zpracování a paralelní zpracování založené na grafickém uživatelském rozhraní.Zdarma ke stažení ve formátu PDF: Otázky a odpovědi pro rozhovory Ab initio
2) Vysvětlete, jaká je architektura Abinitio?
Architektura Abinitio zahrnuje- GDE (Graphical Development Environment)
- Co-operační systém
- Podnikové metaprostředí (EME)
- Chování-IT
3) Uveďte, jakou roli hraje Co-operating system v Abinitio?
Spolupracující systém Abinitio poskytuje funkce jako- Spravujte a spouštějte graf Abinitio a kontrolujte procesy ETL
- Poskytněte operačnímu systému rozšíření Ab initio
- Monitorování a ladění ETL procesů
- Správa metadat a interakce s EME
4) Vysvětlete, co znamená analýza závislostí v Abinitio?
V Ab initio je analýza závislostí proces, jehož prostřednictvím EME zcela prozkoumá projekt a sleduje, jak jsou data přenášena a transformována – z komponent na komponentu, pole po poli, v rámci grafů a mezi nimi.5) Vysvětlete, jak je Abintio EME segregováno?
Abinition je logicky rozdělen do dvou segmentů- Část integrace dat
- Uživatelské rozhraní (přístup k informacím metadat)
6) Uveďte, jak můžete připojit EME k Abinitio Server?
Chcete-li se připojit k Ab initio Server, existuje několik způsobů, jako je- Nastavit AB_AIR_ROOT
- Přihlaste se do webového rozhraní EME – http://serverhost:[serverport]/abinitio
- Prostřednictvím GDE se můžete připojit k EME datovému úložišti
- Prostřednictvím vzdušného velení
7) Vyjmenujte přípony souborů používané v Abinitio?
Přípony souborů používané v Abinitio jsou- .mp: Ukládá Ab initio graf nebo komponentu grafu
- .mpc: Vlastní součást nebo program
- .mdc: datová sada nebo komponenta vlastní datové sady
- .dml: Definice souboru jazyka pro manipulaci s daty nebo typu záznamu
- .xfr: Soubor funkce transformace
- .dat: Datový soubor (vícenásobný nebo sériový soubor)
8) Uveďte, jaké informace poskytuje přípona souboru .dbc pro připojení k databázi?
Přípona .dbc poskytuje GDE informace pro připojení k databázi- Název a číslo verze databáze, ke které se chcete připojit
- Název počítače, na kterém běží instance databáze nebo server, ke kterému se chcete připojit, nebo na kterém je nainstalován software pro vzdálený přístup k databázi
- Název serveru, instance databáze nebo poskytovatele, ke kterému se chcete připojit
9) Vysvětlete, jak můžete v Ab initio spustit nekonečně graf?
Chcete-li provádět graf nekonečně, měl by skript konce grafu volat soubor .ksh grafu. Pokud je tedy název grafu abc.mp, pak by v koncovém skriptu grafu měl volat abc.ksh. Tím bude graf běžet donekonečna.10) Uveďte, jaký je rozdíl mezi souborem „Look-up“ a „Look is up“ v Abinitio?
Vyhledávací soubor definuje jeden nebo více sériových souborů (Flat Files); je to fyzický soubor, kde jsou uložena data pro vyhledávání. Zatímco Look-up je součástí abinitio grafu, kde můžeme ukládat data a získávat je pomocí klíčového parametru.11) Uveďte, jaké jsou různé typy paralelismu používané v Abinitio?
Různé typy paralelismu používané v Abintio zahrnují- Paralelismus komponent: Graf s více procesy probíhajícími současně na samostatných datech využívá paralelismus
- Datový paralelismus: Graf, který pracuje s daty rozdělenými do segmentů a pracuje s každým segmentem, používá paralelismus dat.
- Rovnoběžnost potrubí: Graf, který se zabývá více komponentami spouštěnými současně na stejných datech, využívá paralelismus potrubí. Každá komponenta v kanálu nepřetržitě čte z nadřazených komponent, zpracovává data a zapisuje do navazujících komponent. Obě komponenty mohou pracovat paralelně.
12) Vysvětlete, co je třídicí komponenta v Abinitio?
Komponenta řazení v Abinitio znovu uspořádá data. Skládá se ze dvou parametrů „Key“ a „Max-core“.- Klíč: Je to jeden z parametrů pro komponentu řazení, který určuje pořadí řazení
- Maximální jádro: Tento parametr řídí, jak často komponenta řazení ukládá data z paměti na disk
13) Uveďte, co dělá dedup-komponenta a replikační komponenta?
- Dedukovaná složka: Slouží k odstranění duplicitních záznamů
- Replikovat komponentu: Kombinuje datové záznamy ze vstupů do jednoho toku a zapisuje kopii tohoto toku do každého ze svých výstupních portů
14) Uveďte, co je to oddíl a jaké jsou různé typy komponent oddílu v Abinitio?
V Abinitio je oddíl procesem rozdělování datových sad do více sad pro další zpracování. Různé typy součástí oddílu zahrnuje- Rozdělení podle Round-Robin: Distribuce dat rovnoměrně, v blocích velikosti bloku, mezi výstupní oddíly
- Rozdělení podle rozsahu: Data můžete rozdělit rovnoměrně mezi uzly na základě sady rozdělovacích rozsahů a klíče
- Rozdělení podle procent: Distribuční data, takže výstup je úměrný zlomkům 100
- Rozdělení podle rovnováhy zatížení: Dynamické vyvažování zátěže
- Oddíl podle výrazu: Rozdělení dat podle DML výrazu
- Rozdělení podle klíče: Seskupování dat podle klíče
15) Vysvětlete, co je SANDBOX?
SANDBOX se odkazuje na kolekci grafů a souvisejících souborů, které jsou uloženy v jediném adresářovém stromu a chová se jako skupina pro účely navigace, správy verzí a migrace.16) Vysvětlete, co je de-partition v Abinitio?
Rozdělení se provádí za účelem čtení dat z více toků nebo operací a používá se k opětovnému spojení datových záznamů z různých toků. K dispozici je několik komponent pro oddělování, které zahrnují Gather, Merge, Interleave a Concatenation.17) Vyjmenujte některé vzdušné příkazy používané v Abintio?
Letecký příkaz používaný v Abinitio zahrnuje- vzdušný objekt Is : Používá se k zobrazení výpisů objektů v adresáři uvnitř projektu
- vzdušný objekt rm : Používá se k odstranění objektu z úložiště
- verze vzdušného objektu – podrobné : Poskytuje historii verzí objektu.
18) Uveďte, co je Rollup Component?
Roll-up komponenta umožňuje uživatelům seskupovat záznamy podle určitých hodnot polí. Jedná se o vícestupňovou funkci a skládá se z inicializace 2 a Rollup 3.19) Uveďte, jaká je syntaxe pro m_dump v Abinitio?
Syntaxe pro m_dump v Abinitio se používá k prohlížení dat v multifile z unixového promptu. Příkaz pro m_dump zahrnuje- m_dump a.dml a.dat: Tento příkaz vytiskne data tak, jak se projevují z GDE, když si data prohlížíme ve formátovaném textu
- m_dump a.dml a.dat>b.dat: Výstup je přesměrován do b.dat a bude fungovat jako sériový soubor.b.dat, na který lze v případě potřeby odkazovat.