Top 50 vragen en antwoorden over datawarehouse-interviews
Hier zijn Data Warehouse-interviewvragen en antwoorden voor zowel nieuwere als ervaren kandidaten om hun droombaan te krijgen.
1) Wat is datawarehouse?
Datawarehousing (DW) is de opslagplaats van gegevens en wordt gebruikt voor managementbeslissingsondersteunende systemen. Datawarehouse bestaat uit een grote verscheidenheid aan gegevens met een hoog niveau van zakelijke omstandigheden op een enkel moment.
In één zin is het een opslagplaats van geïntegreerde informatie die beschikbaar kan zijn voor vragen en analyses.
2) Wat is Bedrijfsinformatie?
Business Intelligence is ook bekend als DSS – Decision support system dat verwijst naar de technologieën, toepassingen en praktijken voor het verzamelen, integreren en analyseren van bedrijfsgerelateerde informatie of gegevens. Het helpt zelfs om de gegevens op de informatie zelf te zien.
Gratis pdf-download: vragen en antwoorden over datawarehouse-interviews
3) Wat is dimensietabel?
Dimensietabel is een tabel die attributen van metingen bevat die zijn opgeslagen in feitentabellen. Deze tabel bestaat uit hiërarchieën, categorieën en logica die kunnen worden gebruikt om knooppunten te doorlopen.
4) Wat is de feitentabel?
De feitentabel bevat de meting van bedrijfsprocessen en bevat externe sleutels voor de dimensietabellen.
Voorbeeld – Als het bedrijfsproces de productie van bakstenen omvat
Gemiddeld aantal stenen geproduceerd door één persoon/machine – maatstaf voor het bedrijfsproces
5) Wat zijn de fasen van Datawarehousing?
Er zijn vier fasen van Datawarehousing:
- Offline operationele database
- Offline datawarehouse
- Realtime datawarehouse
- Geïntegreerd datawarehouse
6) Wat is datamining?
Datamining is een proces waarbij de gegevens in verschillende dimensies of perspectieven worden geanalyseerd en samengevat tot bruikbare informatie. Kan de gegevens in hun eigen formaat uit de database opvragen en ophalen.
7) Wat is OLTP?
OLTP wordt afgekort als On-Line Transaction Processing en het is een applicatie die de gegevens wijzigt wanneer deze worden ontvangen en een groot aantal gelijktijdige gebruikers heeft.
8) Wat is OLAP?
OLAP wordt afgekort als Online Analytical Processing en is bedoeld als een systeem dat multidimensionale gegevens verzamelt, beheert en verwerkt voor analyse- en beheerdoeleinden.
9) Wat is het verschil tussen OLTP en OLAP?
Hieronder volgen de verschillen tussen OLTP en OLAP:
OLTP | OLAP |
Gegevens zijn afkomstig uit de oorspronkelijke gegevensbron | Gegevens zijn afkomstig uit verschillende gegevensbronnen |
Eenvoudige vragen van gebruikers | Complexe zoekopdrachten per systeem |
Genormaliseerde kleine database | Gedenormaliseerde grote database |
Fundamentele zakelijke taken | Multidimensionale zakelijke taken |
10) Wat is ODS?
ODS wordt afgekort als Operational Data Store en is een opslagplaats van realtime operationele gegevens in plaats van trendgegevens op de lange termijn.
11) Wat is het verschil tussen weergave en gematerialiseerde weergave?
Een weergave is niets anders dan een virtuele tabel die de uitvoer van de query opneemt en kan worden gebruikt in plaats van tabellen.
Een gematerialiseerde weergave is niets anders dan een indirecte toegang tot de tabelgegevens door de resultaten van een query in een afzonderlijk schema op te slaan.
12) Wat is ETL?
ETL wordt afgekort als Extract, Transform en Load. ETL is software die wordt gebruikt om de gegevens uit de opgegeven gegevensbron te lezen en een gewenste subset van gegevens te extraheren. Vervolgens transformeert het de gegevens met behulp van regels en opzoektabellen en converteert het naar de gewenste staat.
Vervolgens wordt de laadfunctie gebruikt om de resulterende gegevens naar de doeldatabase te laden.
13) Wat is VLDB?
VLDB wordt afgekort als Very Large Database en de omvang ervan is ingesteld op meer dan één terabyte database. Dit zijn beslissingsondersteunende systemen die worden gebruikt om een groot aantal gebruikers te bedienen.
14) Wat is realtime datawarehousing?
Realtime datawarehousing legt de bedrijfsgegevens vast wanneer deze zich voordoen. Wanneer er bedrijfsactiviteiten zijn voltooid, zullen die gegevens beschikbaar zijn in de stroom en onmiddellijk beschikbaar zijn voor gebruik.
15) Wat zijn aggregatietabellen?
Geaggregeerde tabellen zijn de tabellen die de bestaande magazijngegevens bevatten die zijn gegroepeerd op een bepaald dimensieniveau. Het is gemakkelijk om gegevens uit de geaggregeerde tabellen op te halen dan uit de oorspronkelijke tabel, die meer records bevat.
Deze tabel vermindert de belasting van de databaseserver en verhoogt de prestaties van de query.
16) Wat zijn feitloze feitentabellen?
Feitloze feitentabellen zijn de feitentabel die geen numerieke feitenkolom in de feitentabel bevat.
17) Hoe kunnen we de tijdsdimensie laden?
Tijddimensies worden meestal via alle mogelijke datums in een jaar geladen en dit kan via een programma worden gedaan. Hier kan 100 jaar worden weergegeven met één rij per dag.
18) Wat zijn niet-additieve feiten?
Van niet-verslavende feiten wordt gezegd dat ze feiten zijn die niet kunnen worden samengevat voor een van de dimensies in de feitentabel. Als er veranderingen in de afmetingen optreden, kunnen dezelfde feiten nuttig zijn.
19) Wat is een conform feit?
Conformed Fact is een tabel die kan worden gebruikt in meerdere datamarts in combinatie met de meerdere feitentabellen.
20) Wat is Datamart?
Een Datamart is een gespecialiseerde versie van Datawarehousing en bevat een momentopname van operationele gegevens die zakenmensen helpt bij het nemen van beslissingen op basis van de analyse van trends en ervaringen uit het verleden. Een datamart helpt de nadruk te leggen op gemakkelijke toegang tot relevante informatie.
21) Wat is actieve datawarehousing?
Een actief datawarehouse is een datawarehouse waarmee beslissers binnen een bedrijf of organisatie klantrelaties effectief en efficiënt kunnen beheren.
22) Wat is het verschil tussen Datawarehouse en OLAP?
Datawarehouse is een plaats waar alle gegevens worden opgeslagen voor analyse, maar OLAP wordt gebruikt voor het analyseren van de gegevens, het beheren van aggregaties en het opdelen van informatie in informatie op klein niveau.
23) Wat is ER-diagram?
ER-diagram wordt afgekort als Entiteit-relatiediagram dat de onderlinge relaties tussen de entiteiten in de database illustreert. Dit diagram toont de structuur van elke tabel en de koppelingen tussen de tabellen.
24) Wat zijn de belangrijkste kolommen in feiten- en dimensietabellen?
Externe sleutels van dimensietabellen zijn primaire sleutels van entiteitstabellen. Externe sleutels van feitentabellen zijn de primaire sleutels van de dimensietabellen.
25) Wat is SCD?
SCD wordt gedefinieerd als langzaam veranderende dimensies, en is van toepassing op de gevallen waarin records in de loop van de tijd veranderen.
26) Wat zijn de soorten SCD?
Er zijn drie soorten SCD en deze zijn als volgt:
SCD 1 – Het nieuwe record vervangt het originele record
SCD 2 – Er wordt een nieuw record toegevoegd aan de bestaande klantdimensietabel
SCD 3 – Originele gegevens worden gewijzigd om nieuwe gegevens op te nemen
27) Wat is BUS-schema?
BUS-schema bestaat uit een reeks bevestigde dimensies en een gestandaardiseerde definitie als er feitentabellen zijn.
28) Wat is een sterrenschema?
Sterschema is niets anders dan een manier om de tabellen zo te organiseren dat het resultaat snel uit de database kan worden opgehaald in de datawarehouse-omgeving.
29) Wat is het Sneeuwvlokschema?
Sneeuwvlokschema met een primaire dimensietabel waaraan een of meer dimensies kunnen worden gekoppeld. De primaire dimensietabel is de enige tabel die kan worden samengevoegd met de feitentabel.
30) Wat is een kerndimensie?
Kerndimensie is niets anders dan een dimensietabel die wordt gebruikt als speciaal voor een enkele feitentabel of datamart.
31) Wat wordt gegevensopschoning genoemd?
De naam zelf impliceert dat het een voor zichzelf sprekende term is. Opschonen van weesgegevens, gegevens die de bedrijfsregels schenden, inconsistente gegevens en ontbrekende informatie in een database.
32) Wat zijn metadata?
Metadata worden gedefinieerd als gegevens over de gegevens. De metadata bevat informatie zoals het aantal gebruikte kolommen, de vaste breedte en de beperkte breedte, de volgorde van de velden en de gegevenstypen van de velden.
33) Wat zijn lussen in Datawarehousing?
Bij datawarehousing bestaan er lussen tussen de tabellen. Als er een lus is tussen de tabellen, zal het genereren van de query meer tijd in beslag nemen en ontstaat er onduidelijkheid. Het wordt aanbevolen om een lus tussen de tafels te vermijden.
34) Of de dimensietabel een numerieke waarde kan hebben?
Ja, de dimensietabel kan een numerieke waarde hebben, omdat dit de beschrijvende elementen van ons bedrijf zijn.
35) Wat is de definitie van Cube in Datawarehousing?
Kubussen zijn een logische weergave van multidimensionale gegevens. De rand van de kubus bevat de dimensieleden, en het hoofdgedeelte van de kubus bevat de gegevenswaarden.
36) Wat wordt dimensionaal modelleren genoemd?
Dimensional Modeling is een concept dat door ontwerpers van datawarehouses kan worden gebruikt om hun eigen datawarehouse te bouwen. Dit model kan in twee soorten tabellen worden opgeslagen: Feiten- en Dimensietabel.
De feitentabel bevat feiten en metingen van het bedrijf en de dimensietabel bevat de context van metingen.
37) Wat zijn de soorten dimensionaal modelleren?
Hieronder volgen de Soorten dimensies in Data Warehouse:
- Conforme dimensie
- Afmetingen stempel
- Gekrompen dimensie
- Rollenspeldimensie
- Afmeting tot afmetingstabel
- Junk-dimensie
- gedegenereerde dimensie
- Verwisselbare dimensie
- Stap afmeting
38) Wat is een surrogaatsleutel?
Surrogaatsleutel is niets anders dan een vervanging voor de natuurlijke primaire sleutel. Het is ingesteld als een unieke id voor elke rij die kan worden gebruikt voor de primaire sleutel van een tabel.
39) Wat is het verschil tussen ER-modellering en dimensionaal modelleren?
ER-modellering zal een logisch en fysiek model hebben, maar dimensionale modellering zal alleen een fysiek model hebben.
ER-modellering wordt gebruikt voor het normaliseren van het OLTP-databaseontwerp, terwijl Dimensionale modellering wordt gebruikt voor het de-normaliseren van het ROLAP- en MOLAP-ontwerp.
40) Wat zijn de stappen om het datawarehouse te bouwen?
Hieronder volgen de stappen die moeten worden gevolgd om het datawarehouse te bouwen:
- Zakelijke vereisten verzamelen
- Het identificeren van de benodigde bronnen
- De feiten identificeren
- De afmetingen definiëren
- De attributen definiëren
- Definieer de afmetingen en attributen indien nodig opnieuw
- De kenmerkhiërarchie ordenen
- Definieer relaties
- Unieke ID's toewijzen
41) Wat zijn de verschillende soorten datawarehousing?
Hieronder volgen de verschillende soorten datawarehousing:
- Enterprise datawarehousing
- Operationele gegevensopslag
- Datamart
42) Wat moet er gedaan worden tijdens het starten van de database?
Het volgende moet worden gedaan om de database te starten:
- Start een exemplaar
- Mount de database
- Open de database
43) Wat moet er gebeuren als de database wordt afgesloten?
Het volgende moet worden gedaan wanneer de database wordt afgesloten:
- Sluit de databank
- Ontkoppel de database
- Sluit het exemplaar af
44) Kunnen we een back-up maken wanneer de database wordt geopend?
Ja, we kunnen een volledige back-up maken wanneer de database wordt geopend.
45) Wat wordt gedefinieerd als gedeeltelijke back-up?
Een gedeeltelijke back-up in een besturingssysteem is een back-up in plaats van een volledige back-up en kan worden uitgevoerd terwijl de database wordt geopend of afgesloten.
46) Wat is het doel van Optimizer?
Het doel van Optimizer is om de meest efficiënte manier te vinden om de SQL stellingen.
47) Wat is een uitvoeringsplan?
Uitvoeringsplan is een plan waarmee de optimizer de combinatie van de stappen kan selecteren.
48) Welke benaderingen gebruikt Optimizer tijdens het uitvoeringsplan?
Er zijn twee benaderingen:
- Op regels gebaseerd
- Op kosten gebaseerd
49) Welke tools zijn er beschikbaar voor ETL?
Hieronder volgen de beschikbare ETL-tools:
Informatica
Gegevensfase
Oracle
Magazijnbouwer
Ab Initio
Dataknooppunt
50) Wat is het verschil tussen metadata en datadictionary?
Metadata worden gedefinieerd als gegevens over de gegevens. Maar de Data Dictionary bevat de informatie over de projectinformatie, grafieken, abinito-opdrachten en serverinformatie.
Deze interviewvragen zullen ook helpen bij je viva (oralen)
bedankt voor de informatie :)
hoe ik datastage etl tool-software in mijn Windows10 installeer
bedankt voor het delen van de informatie
hii
pls
data ware house uitleg en theorie
Zeer nuttige informatie .. Bedankt :)
Bedankt! erg behulpzaam.
SCD-typen staan niet in de juiste volgorde.
Type 0 – Vaste afmeting
Geen wijzigingen toegestaan, afmetingen veranderen nooit
Type 1 – Geen geschiedenis
Update record direct, er is geen record van historische waarden, de enige huidige staat
Type 2 – Rijversiebeheer
Houd wijzigingen bij als versierecords met huidige vlag- en actieve datums en andere metagegevens
Type 3 – Vorige waardekolom
Houd wijzigingen in een specifiek attribuut bij, voeg een kolom toe om de vorige waarde weer te geven, die wordt bijgewerkt als er verdere wijzigingen plaatsvinden
Type 4 – Geschiedenistabel
Toon de huidige waarde in de dimensietabel, maar houd alle wijzigingen bij in een aparte tabel
Type 6 – Hybride SCD
Gebruik technieken uit SCD-typen 1, 2 en 3 om veranderingen bij te houden
Bedankt. Dit is nuttig
Handig bij het herzien :)
Bedankt
Het is erg nuttig om goede dingen met mensen te delen.
Ik heb hulp nodig om deze vraag te bespreken!
Vraag: Je wordt aangenomen als dataware house engineer bij een megawinkel. Hoe kunt u de associatieregel van datamining gebruiken om de verkoop van de megawinkel te vergroten?
44. Kunnen we een back-up maken wanneer de database wordt geopend?
Ja, we kunnen een volledige back-up maken wanneer de database wordt geopend. Het heet hot backup...
v 37 is onjuist
Hallo, bedankt voor het delen van uw gedachten. Het is bijgewerkt..
Heel goed meneer.
Bedankt voor het stellen van waardevolle vragen en gemakkelijk te begrijpen antwoorden
Bedankt, het heeft mij veel geholpen
Het is echt leuk, bedankt. Het helpt me veel.
Makkelijk te begrijpen, bedankt
Bedankt, het heeft mij geholpen.
Over het algemeen zeer nuttige informatie, bedankt