Top 50 Data Warehouse-intervjufrågor och svar
Här är Data Warehouse-intervjufrågor och svar för fräschare såväl som erfarna kandidater att få sitt drömjobb.
1) Vad är Data Warehouse?
Data warehousing (DW) är lagringsplatsen för en data och den används för Management beslutsstödssystem. Data warehouse består av en mängd olika data som har höga affärsvillkor vid en enda tidpunkt.
I en mening är det ett arkiv med integrerad information som kan vara tillgänglig för frågor och analys.
2) Vad är Business Intelligence?
Business Intelligence är också känt som DSS – Decision Support System som hänvisar till teknologier, applikationer och metoder för insamling, integration och analys av affärsrelaterad information eller data. Till och med hjälper det att se uppgifterna på själva informationen.
Gratis PDF-nedladdning: Data Warehouse-intervjufrågor och svar
3) Vad är dimensionstabell?
Dimensionstabell är en tabell som innehåller attribut för mätningar lagrade i faktatabeller. Denna tabell består av hierarkier, kategorier och logik som kan användas för att korsa i noder.
4) Vad är faktatabell?
Faktatabellen innehåller mätning av affärsprocesser och den innehåller främmande nycklar för dimensionstabellerna.
Exempel – Om affärsprocessen är tillverkning av tegelstenar
Genomsnittligt antal tegelstenar producerade av en person/maskin – mått på affärsprocessen
5) Vilka är stadierna i Datawarehousing?
Det finns fyra steg i Datawarehousing:
- Offline operativ databas
- Offline Data Warehouse
- Realtids Datawarehouse
- Integrerat Datawarehouse
6) Vad är Data Mining?
Data Mining är inställd på att vara en process för att analysera data i olika dimensioner eller perspektiv och sammanfatta till användbar information. Kan efterfrågas och hämtas data från databasen i sitt eget format.
7) Vad är OLTP?
OLTP förkortas som On-Line Transaction Processing, och det är en applikation som modifierar data när den tas emot och har ett stort antal samtidiga användare.
8) Vad är OLAP?
OLAP förkortas till Online Analytical Processing, och det är tänkt att vara ett system som samlar in, hanterar, bearbetar flerdimensionell data för analys och hanteringsändamål.
9) Vad är skillnaden mellan OLTP och OLAP?
Följande är skillnaderna mellan OLTP och OLAP:
OLTP | OLAP |
---|---|
Data kommer från den ursprungliga datakällan | Data kommer från olika datakällor |
Enkla frågor från användare | Komplexa frågor per system |
Normaliserad liten databas | Avnormaliserad stor databas |
Grundläggande affärsuppgifter | Flerdimensionella affärsuppgifter |
10) Vad är ODS?
ODS förkortas som Operational Data Store och det är ett arkiv med realtidsdata snarare än långsiktiga trenddata.
11) Vad är skillnaden mellan View och Materialized View?
En vy är inget annat än en virtuell tabell som tar utdata från frågan och den kan användas i stället för tabeller.
En materialiserad vy är inget annat än en indirekt åtkomst till tabelldata genom att lagra resultaten av en fråga i ett separat schema.
12) Vad är ETL?
ETL förkortas till Extract, Transform och Load. ETL är en programvara som används för att läsa data från den angivna datakällan och extrahera en önskad delmängd av data. Därefter transformerar den data med hjälp av regler och uppslagstabeller och konverterar den till ett önskat tillstånd.
Sedan används laddningsfunktionen för att ladda de resulterande data till måldatabasen.
13) Vad är VLDB?
VLDB förkortas som Very Large Database och dess storlek är inställd på mer än en terabyte databas. Dessa är beslutsstödssystem som används för att servera ett stort antal användare.
14) Vad är datawarehousing i realtid?
Datawarehousing i realtid fångar affärsdata närhelst det inträffar. När det finns en affärsaktivitet slutförs, kommer denna data att vara tillgänglig i flödet och bli tillgänglig för användning direkt.
15) Vad är aggregerade tabeller?
Aggregattabeller är de tabeller som innehåller befintliga lagerdata som har grupperats till en viss dimensionsnivå. Det är lätt att hämta data från de aggregerade tabellerna än den ursprungliga tabellen som har fler poster.
Den här tabellen minskar belastningen på databasservern och ökar prestandan för frågan.
16) Vad är faktalösa faktatabeller?
Faktatabeller utan fakta är faktatabellen som inte innehåller numerisk faktakolumn i faktatabellen.
17) Hur kan vi ladda tidsdimensionen?
Tidsdimensioner laddas vanligtvis genom alla möjliga datum på ett år och det kan göras genom ett program. Här kan 100 år representeras med en rad per dag.
18) Vad är icke-tillsatsfakta?
Icke-beroendeframkallande fakta sägs vara fakta som inte kan summeras för någon av dimensionerna som finns i faktatabellen. Om det finns förändringar i dimensionerna kan samma fakta vara användbara.
19) Vad är konformerat faktum?
Conformed fact är en tabell som kan användas över flera datamarts i kombination med de multipla faktatabellerna.
20) Vad är Datamart?
En Datamart är en specialiserad version av Datawarehousing och den innehåller en ögonblicksbild av operativ data som hjälper affärsmännen att bestämma sig med analys av tidigare trender och erfarenheter. En datamart hjälper till att betona på enkel tillgång till relevant information.
21) Vad är Active Datawarehousing?
Ett aktivt datawarehouse är ett datawarehouse som gör det möjligt för beslutsfattare inom ett företag eller organisation att hantera kundrelationer effektivt och effektivt.
22) Vad är skillnaden mellan Datawarehouse och OLAP?
Datawarehouse är en plats där hela data lagras för analys, men OLAP används för att analysera data, hantera aggregationer, informationspartitionering i mindre nivåinformation.
23) Vad är ER Diagram?
ER-diagram förkortas som Entity-Relationship diagram som illustrerar de inbördes förhållandena mellan enheterna i databasen. Detta diagram visar strukturen för varje tabell och länkarna mellan tabellerna.
24) Vilka är nyckelkolumnerna i fakta- och dimensionstabeller?
Främmande nycklar för dimensionstabeller är primärnycklar för entitetstabeller. Främmande nycklar för faktatabeller är de primära nycklarna i dimensionstabellerna.
25) Vad är SCD?
SCD definieras som långsamt föränderliga dimensioner, och det gäller de fall där posten ändras över tid.
26) Vilka typer av SCD finns?
Det finns tre typer av SCD och de är följande:
SCD 1 – Den nya skivan ersätter den ursprungliga skivan
SCD 2 – En ny post läggs till i den befintliga kunddimensionstabellen
SCD 3 – En originaldata modifieras för att inkludera ny data
27) Vad är BUS Schema?
BUS-schema består av en svit med bekräftad dimension och standardiserad definition om det finns faktatabeller.
28) Vad är stjärnschema?
Stjärnschema är inget annat än en typ av organisering av tabellerna på ett sådant sätt att resultatet snabbt kan hämtas från databasen i datalagermiljön.
29) Vad är Snowflake Schema?
Snowflake-schema som har en primär dimensionstabell till vilken en eller flera dimensioner kan kopplas. Den primära dimensionstabellen är den enda tabellen som kan sammanfogas med faktatabellen.
30) Vad är en kärndimension?
Kärndimensionen är inget annat än en dimensionstabell som används som dedikerad för en enda faktatabell eller datamart.
31) Vad kallas datarensning?
Namnet i sig antyder att det är en självförklarande term. Rensning av föräldralösa poster, Databrott mot affärsregler, Inkonsekventa data och saknad information i en databas.
32) Vad är metadata?
Metadata definieras som data om data. Metadata innehåller information som antal använda kolumner, fix bredd och begränsad bredd, ordning på fält och datatyper för fälten.
33) Vad är loopar i Datawarehousing?
I datawarehousing finns loopar mellan tabellerna. Om det finns en loop mellan tabellerna kommer frågegenereringen att ta längre tid och det skapar oklarheter. Det rekommenderas att undvika slinga mellan borden.
34) Om dimensionstabell kan ha numeriskt värde?
Ja, dimensionstabeller kan ha numeriskt värde eftersom de är de beskrivande delarna av vår verksamhet.
35) Vad är definitionen av Cube i Datawarehousing?
Kuber är en logisk representation av flerdimensionell data. Kanten på kuben har dimensionsmedlemmarna, och kubens kropp innehåller datavärdena.
36) Vad kallas dimensionsmodellering?
Dimensional Modeling är ett koncept som kan användas av datawarehusdesigners för att bygga sitt eget datawarehouse. Denna modell kan lagras i två typer av tabeller – Fakta och Måtttabell.
Faktatabellen har fakta och mått på affärsverksamheten och dimensionstabellen innehåller kontexten för mätningar.
37) Vilka typer av dimensionsmodellering finns?
Följande är Typer av dimensioner i Data Warehouse:
- Anpassad dimension
- Stödbensdimension
- Krympt dimension
- Rollspelsdimension
- Dimension till dimensionstabell
- Skräpdimension
- Degenererad dimension
- Bytbar dimension
- Steg Dimension
38) Vad är surrogatnyckel?
Surrogatnyckel är inget annat än en ersättning för den naturliga primärnyckeln. Den är inställd på att vara en unik identifierare för varje rad som kan användas för primärnyckeln till en tabell.
39) Vad är skillnaden mellan ER-modellering och dimensionsmodellering?
ER-modellering kommer att ha en logisk och fysisk modell, men dimensionell modellering kommer endast att ha en fysisk modell.
ER-modellering används för att normalisera OLTP-databasdesignen medan dimensionsmodellering används för att denormalisera ROLAP- och MOLAP-designen.
40) Vilka är stegen för att bygga datawarehouse?
Följande är stegen som ska följas för att bygga datawaerhouse:
- Samla affärskrav
- Identifiera nödvändiga källor
- Identifiera fakta
- Definiera måtten
- Definiera attributen
- Omdefiniera dimensioner och attribut om det behövs
- Organisera attributhierarkin
- Definiera relationer
- Tilldela unika identifierare
41) Vilka olika typer av datawarehosing finns det?
Följande är de olika typerna av Datawarehousing:
- Enterprise Datawarehousing
- Driftsdatalager
- Data Mart
42) Vad behöver göras när du startar databasen?
Följande måste göras för att starta databasen:
- Starta en instans
- Montera databasen
- Öppna databasen
43) Vad behöver göras när databasen stängs av?
Följande måste göras när databasen stängs av:
- Stäng databasen
- Demontera databasen
- Stäng av instansen
44) Kan vi ta backup när databasen öppnas?
Ja, vi kan ta full backup när databasen öppnas.
45) Vad definieras som partiell säkerhetskopiering?
En partiell backup i en operativsystem är en säkerhetskopia som inte är full backup och den kan göras medan databasen öppnas eller stängs av.
46) Vad är målet med Optimizer?
Målet med Optimizer är att hitta det mest effektiva sättet att utföra SQL uttalanden.
47) Vad är genomförandeplan?
Execution Plan är en plan som används för att optimeraren ska välja kombinationen av stegen.
48) Vilka tillvägagångssätt används av Optimizer under genomförandeplanen?
Det finns två tillvägagångssätt:
- Regelbaserad
- Kostnadsbaserad
49) Vilka verktyg finns tillgängliga för ETL?
Följande är tillgängliga ETL-verktyg:
Informatik
Datastadiet
Oracle
Lagerbyggare
Ab Initio
Data Junction
50) Vad är skillnaden mellan metadata och dataordbok?
Metadata definieras som data om data. Men Data Dictionary innehåller information om projektinformation, grafer, abinito-kommandon och serverinformation.
Dessa intervjufrågor kommer också att hjälpa dig i din viva (orals)
tack för informationen :)
hur man installerar datastage etl tool-programvara i min windows10
tack för att du delar med dig av informationen
HII
vg
data warehouse förklara och thoery
Mycket användbar information .. Tack :)
Tack! mycket hjälpsam.
SCD-typerna är inte i rätt ordning.
Typ 0 – Fast dimension
Inga ändringar tillåtna, dimensionen ändras aldrig
Typ 1 – Ingen historik
Uppdatera posten direkt, det finns ingen registrering av historiska värden, det enda aktuella tillståndet
Typ 2 – Radversionering
Spåra ändringar som versionsposter med aktuell flagga och aktiva datum och annan metadata
Typ 3 – Kolumnen Föregående värde
Spåra ändring av ett specifikt attribut, lägg till en kolumn för att visa föregående värde, som uppdateras när ytterligare ändringar inträffar
Typ 4 – Historiktabell
Visa aktuellt värde i dimensionstabellen men spåra alla ändringar i en separat tabell
Typ 6 – Hybrid SCD
Använd tekniker från SCD-typerna 1, 2 och 3 för att spåra förändringar
Tack .. Detta är användbart
Till hjälp för att revidera :)
Tack
Det är till stor hjälp. Att dela med sig av bra saker för människor.
Jag behöver hjälp att diskutera denna fråga!
F: Du anställs som dataware house-ingenjör av en megabutik. Hur kan du använda associationsregeln för datautvinning för att öka försäljningen av megabutiken?
44. Kan vi ta backup när databasen öppnas?
Ja, vi kan ta full backup när databasen öppnas. Det kallas hot backup...
q 37 är felaktig
Hej, tack för att du delar med dig av dina tankar. Den är uppdaterad..
Mycket bra sir.
Tack för att du ställer värdefulla frågor och lättförståeliga svar
Tack, det hjälpte mig mycket
Det är riktigt trevligt tack Det hjälper mig mycket.
Lätt att förstå tack
Tack, det hjälpte mig.
Sammantaget mycket användbar information, tack