Top 50 Data Warehouse-interviewspørgsmål og -svar
Her er Data Warehouse-interviewspørgsmål og svar til både friskere og erfarne kandidater til at få deres drømmejob.
1) Hvad er Data Warehouse?
Data warehousing (DW) er et datalager, og det bruges til ledelsesbeslutningsstøttesystem. Data warehouse består af en bred vifte af data, der har et højt niveau af forretningsbetingelser på et enkelt tidspunkt.
I en enkelt sætning er det et lager af integreret information, som kan være tilgængelig for forespørgsler og analyse.
2) Hvad er Business Intelligence?
Business Intelligence er også kendt som DSS – Beslutningsstøttesystem, som refererer til teknologierne, applikationen og praksisserne til indsamling, integration og analyse af forretningsrelaterede oplysninger eller data. Selv hjælper det at se dataene på selve informationen.
Gratis PDF-download: Data Warehouse Interview Spørgsmål & Svar
3) Hvad er dimensionstabel?
Dimensionstabel er en tabel, der indeholder attributter for målinger, der er gemt i faktatabeller. Denne tabel består af hierarkier, kategorier og logik, der kan bruges til at krydse i noder.
4) Hvad er faktatabel?
Faktatabel indeholder måling af forretningsprocesser, og den indeholder fremmednøgler til dimensionstabellerne.
Eksempel – Hvis forretningsprocessen er fremstilling af mursten
Gennemsnitligt antal mursten produceret af én person/maskine – mål for forretningsprocessen
5) Hvad er stadierne af Datawarehousing?
Der er fire stadier af datawarehousing:
- Offline operationel database
- Offline datavarehus
- Real Time Datawarehouse
- Integreret Datawarehouse
6) Hvad er Data Mining?
Data Mining er sat til at være en proces med at analysere data i forskellige dimensioner eller perspektiver og opsummere til en nyttig information. Kan forespørges og hentes data fra databasen i deres eget format.
7) Hvad er OLTP?
OLTP er forkortet som On-Line Transaction Processing, og det er et program, der ændrer dataene, når det modtages, og som har et stort antal samtidige brugere.
8) Hvad er OLAP?
OLAP er forkortet til Online Analytical Processing, og det er sat til at være et system, der indsamler, administrerer, behandler multidimensionelle data til analyse- og ledelsesformål.
9) Hvad er forskellen mellem OLTP og OLAP?
Følgende er forskellene mellem OLTP og OLAP:
OLTP | OLAP |
---|---|
Data er fra den oprindelige datakilde | Data er fra forskellige datakilder |
Simple forespørgsler fra brugere | Komplekse forespørgsler efter system |
Normaliseret lille database | De-normaliseret stor database |
Grundlæggende erhvervsopgaver | Multidimensionelle forretningsopgaver |
10) Hvad er ODS?
ODS er forkortet som Operational Data Store, og det er et lager af realtids operationelle data snarere end langsigtede trenddata.
11) Hvad er forskellen mellem View og Materialized View?
En visning er intet andet end en virtuel tabel, som tager outputtet fra forespørgslen, og den kan bruges i stedet for tabeller.
En materialiseret visning er intet andet end en indirekte adgang til tabeldataene ved at gemme resultaterne af en forespørgsel i et separat skema.
12) Hvad er ETL?
ETL er forkortet til Extract, Transform og Load. ETL er en software, som bruges til at læse dataene fra den angivne datakilde og udtrække en ønsket delmængde af data. Dernæst transformerer den dataene ved hjælp af regler og opslagstabeller og konverterer dem til en ønsket tilstand.
Derefter bruges load-funktionen til at indlæse de resulterende data til måldatabasen.
13) Hvad er VLDB?
VLDB er forkortet til Very Large Database, og dens størrelse er sat til at være mere end én terabyte database. Disse er beslutningsstøttesystemer, som bruges til at servere et stort antal brugere.
14) Hvad er datawarehousing i realtid?
Datawarehousing i realtid fanger forretningsdataene, når de opstår. Når der er forretningsaktivitet bliver afsluttet, vil disse data være tilgængelige i flowet og blive tilgængelige til brug med det samme.
15) Hvad er aggregerede tabeller?
Samlede tabeller er de tabeller, der indeholder de eksisterende lagerdata, som er blevet grupperet til et bestemt dimensionsniveau. Det er nemt at hente data fra de aggregerede tabeller end den originale tabel, som har flere poster.
Denne tabel reducerer belastningen i databaseserveren og øger forespørgslens ydeevne.
16) Hvad er faktaløse faktatabeller?
En faktatabel uden fakta er faktatabellen, som ikke indeholder numerisk faktakolonne i faktatabellen.
17) Hvordan kan vi indlæse tidsdimensionen?
Tidsdimensioner indlæses normalt gennem alle mulige datoer på et år, og det kan gøres gennem et program. Her kan 100 år repræsenteres med en række pr. dag.
18) Hvad er ikke-additive fakta?
Ikke-vanedannende fakta siges at være fakta, der ikke kan opsummeres for nogen af dimensionerne i faktatabellen. Hvis der er ændringer i dimensionerne, kan de samme fakta være nyttige.
19) Hvad er konform fakta?
Overensstemmende fakta er en tabel, som kan bruges på tværs af flere data marts kombineret med de multiple faktatabeller.
20) Hvad er Datamart?
En Datamart er en specialiseret version af Datawarehousing, og den indeholder et øjebliksbillede af operationelle data, der hjælper forretningsfolk med at beslutte sig med analyse af tidligere tendenser og erfaringer. En datamart er med til at lægge vægt på nem adgang til relevant information.
21) Hvad er Active Datawarehousing?
Et aktivt datawarehouse er et datawarehouse, der gør det muligt for beslutningstagere i en virksomhed eller organisation at administrere kunderelationer effektivt og effektivt.
22) Hvad er forskellen mellem Datawarehouse og OLAP?
Datawarehouse er et sted, hvor hele data gemmes til analyse, men OLAP bruges til at analysere dataene, administrere aggregeringer, informationsopdeling i mindre niveau information.
23) Hvad er ER Diagram?
ER-diagram er forkortet som Entity-Relationship diagram, som illustrerer sammenhængen mellem enhederne i databasen. Dette diagram viser strukturen af hver tabell og forbindelserne mellem tabellerne.
24) Hvad er nøglekolonnerne i fakta- og dimensionstabeller?
Fremmednøgler til dimensionstabeller er primære nøgler til entitetstabeller. Fremmednøgler til faktatabeller er de primære nøgler til dimensionstabellerne.
25) Hvad er SCD?
SCD er defineret som langsomt skiftende dimensioner, og det gælder for de tilfælde, hvor rekorden ændrer sig over tid.
26) Hvad er typerne af SCD?
Der er tre typer SCD, og de er som følger:
SCD 1 – Den nye plade erstatter den originale plade
SCD 2 – En ny post tilføjes til den eksisterende kundedimensionstabel
SCD 3 – En original data er ændret til at inkludere nye data
27) Hvad er BUS-skema?
BUS-skema består af en suite af bekræftet dimension og standardiseret definition, hvis der er en faktatabeller.
28) Hvad er stjerneskema?
Stjerneskema er intet andet end en form for organisering af tabellerne på en sådan måde, at resultatet hurtigt kan hentes fra databasen i datavarehusmiljøet.
29) Hvad er Snowflake Schema?
Snefnug-skema, som har en primær dimensionstabel, hvortil en eller flere dimensioner kan forbindes. Den primære dimensionstabel er den eneste tabel, der kan forbindes med faktatabellen.
30) Hvad er en kernedimension?
Kernedimension er intet andet end en dimensionstabel, der bruges som dedikeret til en enkelt faktatabel eller datamart.
31) Hvad kaldes datarensning?
Selve navnet antyder, at det er et selvforklarende udtryk. Rensning af forældreløse poster, Databrud på forretningsregler, Inkonsistente data og manglende information i en database.
32) Hvad er metadata?
Metadata er defineret som data om dataene. Metadataene indeholder information som antal anvendte kolonner, fast bredde og begrænset bredde, rækkefølge af felter og datatyper af felterne.
33) Hvad er loops i Datawarehousing?
I datawarehousing eksisterer der sløjfer mellem tabellerne. Hvis der er en løkke mellem tabellerne, vil forespørgselsgenereringen tage længere tid, og det skaber uklarhed. Det anbefales at undgå sløjfe mellem bordene.
34) Om dimensionstabel kan have numerisk værdi?
Ja, dimensionstabel kan have numerisk værdi, da de er de beskrivende elementer i vores virksomhed.
35) Hvad er definitionen af Cube i Datawarehousing?
Kuber er en logisk repræsentation af multidimensionelle data. Kanten af kuben har dimensionsmedlemmerne, og kubens krop indeholder dataværdierne.
36) Hvad kaldes dimensionsmodellering?
Dimensional Modeling er et koncept, som kan bruges af datawarehusdesignere til at bygge deres eget datawarehouse. Denne model kan opbevares i to typer tabeller – Fakta og Dimensionstabel.
Faktatabel har fakta og målinger af forretningen og dimensionstabellen indeholder sammenhængen med målinger.
37) Hvad er typerne af dimensionsmodellering?
Følgende er Typer af dimensioner i datavarehus:
- Afstemt Dimension
- Udrigger Dimension
- Krympet Dimension
- Rollespilsdimension
- Dimension til dimensionstabel
- Junk Dimension
- Degenereret Dimension
- Udskiftelig dimension
- Trin dimension
38) Hvad er surrogatnøgle?
Surrogatnøgle er intet andet end en erstatning for den naturlige primærnøgle. Den er indstillet til at være en unik identifikator for hver række, der kan bruges til den primære nøgle til en tabel.
39) Hvad er forskellen mellem ER-modellering og dimensionsmodellering?
ER-modellering vil have logisk og fysisk model, men dimensionsmodellering vil kun have fysisk model.
ER-modellering bruges til at normalisere OLTP-databasedesignet, mens dimensionsmodellering bruges til at denormalisere ROLAP- og MOLAP-designet.
40) Hvad er trinene for at bygge datawarehouset?
Følgende er de trin, der skal følges for at bygge datawaerhouse:
- Indsamling af forretningskrav
- Identifikation af de nødvendige kilder
- Identifikation af fakta
- Definition af dimensioner
- At definere egenskaberne
- Omdefiner dimensioner og attributter, hvis det er nødvendigt
- Organiser attributhierarkiet
- Definer relationer
- Tildel unikke identifikatorer
41) Hvad er de forskellige typer af datawarehosuing?
Følgende er de forskellige typer af datawarehousing:
- Enterprise Datawarehousing
- Driftsdatalager
- Data Mart
42) Hvad skal der gøres, mens databasen startes?
Følgende skal gøres for at starte databasen:
- Start en instans
- Monter databasen
- Åbn databasen
43) Hvad skal der gøres, når databasen lukkes ned?
Følgende skal gøres, når databasen lukkes:
- Luk databasen
- Afmonter databasen
- Luk for instansen
44) Kan vi tage backup, når databasen åbnes?
Ja, vi kan tage fuld backup, når databasen åbnes.
45) Hvad defineres som delvis backup?
En delvis backup i en operativsystem er en sikkerhedskopi, der mangler fuld backup, og den kan udføres, mens databasen åbnes eller lukkes ned.
46) Hvad er målet med Optimizer?
Målet med Optimizer er at finde den mest effektive måde at udføre SQL udsagn.
47) Hvad er udførelsesplan?
Udførelsesplan er en plan, som bruges til at optimeringsværktøjet vælger kombinationen af trinene.
48) Hvilke tilgange bruges af Optimizer under eksekveringsplanen?
Der er to tilgange:
- Regel baseret
- Omkostningsbaseret
49) Hvilke værktøjer er tilgængelige for ETL?
Følgende er tilgængelige ETL-værktøjer:
computer
Data Stage
Oracle
Lagerbygger
Ab Initio
Data Junction
50) Hvad er forskellen mellem metadata og dataordbog?
Metadata er defineret som data om dataene. Men dataordbog indeholder information om projektinformation, grafer, abinito-kommandoer og serverinformation.
Disse interviewspørgsmål vil også hjælpe i din viva(orals)
tak for informationen :)
hvordan man installerer datastage etl tool software i min windows10
tak for at dele informationen
hii
pls
data warehouse forklare og thoery
Meget nyttig information .. Tak :)
Tak! meget hjælpsom.
SCD-typerne er ikke i den rigtige rækkefølge.
Type 0 – Fast dimension
Ingen ændringer tilladt, dimension ændres aldrig
Type 1 – Ingen historik
Opdater rekord direkte, der er ingen registrering af historiske værdier, den eneste aktuelle tilstand
Type 2 – Rækkeversionering
Spor ændringer som versionsposter med aktuelle flag & aktive datoer og andre metadata
Type 3 – Forrige værdi-kolonne
Spor ændringer til en specifik attribut, tilføj en kolonne for at vise den tidligere værdi, som opdateres, efterhånden som der sker yderligere ændringer
Type 4 – Historietabel
Vis den aktuelle værdi i dimensionstabellen, men spor alle ændringer i en separat tabel
Type 6 – Hybrid SCD
Brug teknikker fra SCD Type 1, 2 og 3 til at spore ændringer
Tak .. Dette er nyttigt
Nyttigt til revision :)
Tak
Det er meget nyttigt. At dele gode ting til folk.
Jeg har brug for hjælp til at diskutere dette spørgsmål!
Q: Du bliver ansat som dataware-husingeniør af en megabutik. Hvordan kan du bruge associationsreglen for datamining til at øge salget af megabutikken?
44. Kan vi tage backup, når databasen åbnes?
Ja, vi kan tage fuld backup, når databasen åbnes. Det kaldes hot backup...
q 37 er forkert
Hej, tak fordi du deler dine tanker. Den er opdateret..
Meget godt sir.
Tak for at stille værdifulde spørgsmål og letforståelige svar
Tak, det hjalp mig meget
Det er rigtig dejligt tak Det hjælper mig meget.
Let at forstå tak
Tak, det hjalp mig.
Alt i alt meget nyttig information, tak