Topp 50 datalagerintervju og spørsmål
Her er Data Warehouse-intervjuspørsmål og svar for ferskere og erfarne kandidater for å få drømmejobben.
1) Hva er datavarehus?
Datavarehus (DW) er depotet for en data, og det brukes til ledelsesbeslutningsstøttesystem. Datavarehus består av et bredt utvalg av data som har høye forretningsbetingelser på et enkelt tidspunkt.
I en enkelt setning er det et oppbevaringssted for integrert informasjon som kan være tilgjengelig for spørsmål og analyser.
2) Hva er Business Intelligence?
Business Intelligence er også kjent som DSS – Decision Support System som refererer til teknologiene, applikasjonen og praksisene for innsamling, integrasjon og analyse av forretningsrelatert informasjon eller data. Til og med hjelper det å se dataene på selve informasjonen.
Gratis PDF-nedlasting: Data Warehouse-intervjuspørsmål og svar
3) Hva er dimensjonstabell?
Dimensjonstabell er en tabell som inneholder attributter for målinger lagret i faktatabeller. Denne tabellen består av hierarkier, kategorier og logikk som kan brukes til å krysse i noder.
4) Hva er faktatabell?
Faktatabell inneholder måling av forretningsprosesser, og den inneholder fremmednøkler for dimensjonstabellene.
Eksempel – Hvis forretningsprosessen er produksjon av murstein
Gjennomsnittlig antall klosser produsert av én person/maskin – mål på forretningsprosessen
5) Hva er stadiene i Datawarehousing?
Det er fire stadier av datavarehusing:
- Offline operasjonell database
- Frakoblet datavarehus
- Sanntids datavarehus
- Integrert datavarehus
6) Hva er Data Mining?
Data Mining er satt til å være en prosess for å analysere data i forskjellige dimensjoner eller perspektiver og oppsummere til nyttig informasjon. Kan spørres og hentes dataene fra databasen i sitt eget format.
7) Hva er OLTP?
OLTP er forkortet som On-Line Transaction Processing, og det er en applikasjon som endrer dataene når den mottas og har et stort antall samtidige brukere.
8) Hva er OLAP?
OLAP er forkortet til Online Analytical Processing, og det er satt til å være et system som samler inn, administrerer, behandler flerdimensjonale data for analyse- og administrasjonsformål.
9) Hva er forskjellen mellom OLTP og OLAP?
Følgende er forskjellene mellom OLTP og OLAP:
OLTP | OLAP |
Data er fra den opprinnelige datakilden | Data er fra ulike datakilder |
Enkle spørsmål fra brukere | Komplekse forespørsler etter system |
Normalisert liten database | Denormalisert stor database |
Grunnleggende forretningsoppgaver | Multidimensjonale forretningsoppgaver |
10) Hva er ODS?
ODS er forkortet som Operational Data Store, og det er et oppbevaringssted for sanntids driftsdata i stedet for langsiktige trenddata.
11) Hva er forskjellen mellom View og Materialized View?
En visning er ikke annet enn en virtuell tabell som tar utdataene fra spørringen, og den kan brukes i stedet for tabeller.
En materialisert visning er ikke annet enn en indirekte tilgang til tabelldataene ved å lagre resultatene av en spørring i et eget skjema.
12) Hva er ETL?
ETL er forkortet til Extract, Transform og Load. ETL er en programvare som brukes til å lese dataene fra den angitte datakilden og trekke ut et ønsket delsett av data. Deretter transformerer den dataene ved hjelp av regler og oppslagstabeller og konverterer dem til en ønsket tilstand.
Deretter brukes lastefunksjonen til å laste de resulterende dataene til måldatabasen.
13) Hva er VLDB?
VLDB er forkortet til Very Large Database og størrelsen er satt til å være mer enn én terabyte database. Dette er beslutningsstøttesystemer som brukes til å servere et stort antall brukere.
14) Hva er datavarehusing i sanntid?
Sanntidsdatavarehusing fanger opp forretningsdata når det skjer. Når det er forretningsaktivitet blir fullført, vil disse dataene være tilgjengelige i flyten og bli tilgjengelige for bruk umiddelbart.
15) Hva er aggregerte tabeller?
Aggregerte tabeller er tabellene som inneholder eksisterende lagerdata som er gruppert til et visst nivå av dimensjoner. Det er enkelt å hente data fra de aggregerte tabellene enn den opprinnelige tabellen som har flere poster.
Denne tabellen reduserer belastningen i databaseserveren og øker ytelsen til spørringen.
16) Hva er faktaløse faktatabeller?
En faktafri faktatabell er faktatabellen som ikke inneholder numerisk faktakolonne i faktatabellen.
17) Hvordan kan vi laste inn tidsdimensjonen?
Tidsdimensjoner lastes vanligvis gjennom alle mulige datoer i et år, og det kan gjøres gjennom et program. Her kan 100 år representeres med én rad per dag.
18) Hva er ikke-additive fakta?
Ikke-avhengighetsskapende fakta sies å være fakta som ikke kan oppsummeres for noen av dimensjonene i faktatabellen. Hvis det er endringer i dimensjonene, kan samme fakta være nyttige.
19) Hva er konformert faktum?
Conformed fact er en tabell som kan brukes på tvers av flere datamars i kombinert med multiple faktatabellene.
20) Hva er Datamart?
En Datamart er en spesialisert versjon av Datawarehousing og den inneholder et øyeblikksbilde av driftsdata som hjelper forretningsfolk til å bestemme seg med analyse av tidligere trender og erfaringer. En datamart bidrar til å legge vekt på enkel tilgang til relevant informasjon.
21) Hva er Active Datawarehousing?
Et aktivt datavarehus er et datavarehus som gjør det mulig for beslutningstakere i en bedrift eller organisasjon å administrere kundeforhold effektivt og effektivt.
22) Hva er forskjellen mellom Datawarehouse og OLAP?
Datawarehouse er et sted hvor hele dataen lagres for analyse, men OLAP brukes til å analysere dataene, administrere aggregeringer, informasjonspartisjonering i mindre informasjon.
23) Hva er ER Diagram?
ER-diagram er forkortet Entity-Relationship diagram som illustrerer sammenhengene mellom enhetene i databasen. Dette diagrammet viser strukturen til hver tabell og koblingene mellom tabellene.
24) Hva er nøkkelkolonnene i fakta- og dimensjonstabeller?
Fremmednøkler til dimensjonstabeller er primærnøkler til enhetstabeller. Fremmednøkler til faktatabeller er hovednøklene til dimensjonstabellene.
25) Hva er SCD?
SCD er definert som sakte skiftende dimensjoner, og det gjelder de tilfeller hvor posten endres over tid.
26) Hva er typene SCD?
Det er tre typer SCD og de er som følger:
SCD 1 – Den nye platen erstatter den opprinnelige platen
SCD 2 – En ny post legges til den eksisterende kundedimensjonstabellen
SCD 3 – En original data er modifisert for å inkludere nye data
27) Hva er BUS Schema?
BUS-skjemaet består av en pakke med bekreftet dimensjon og standardisert definisjon hvis det er faktatabeller.
28) Hva er stjerneskjema?
Stjerneskjema er ikke annet enn en type organisering av tabellene på en slik måte at resultatet raskt kan hentes fra databasen i datavarehusmiljøet.
29) Hva er Snowflake Schema?
Snowflake-skjema som har primær dimensjonstabell som en eller flere dimensjoner kan kobles til. Den primære dimensjonstabellen er den eneste tabellen som kan slås sammen med faktatabellen.
30) Hva er en kjernedimensjon?
Kjernedimensjon er ingenting annet enn en dimensjonstabell som brukes som dedikert for enkelt faktatabell eller datamart.
31) Hva kalles datarydding?
Selve navnet antyder at det er et selvforklarende begrep. Rengjøring av foreldreløse poster, Databrudd på forretningsregler, Inkonsistente data og manglende informasjon i en database.
32) Hva er metadata?
Metadata er definert som data om dataene. Metadataene inneholder informasjon som antall brukte kolonner, fast bredde og begrenset bredde, rekkefølge av felt og datatyper for feltene.
33) Hva er loops i Datawarehousing?
I datavarehus eksisterer løkker mellom tabellene. Hvis det er en sløyfe mellom tabellene, vil spørringsgenereringen ta lengre tid og det skaper tvetydighet. Det anbefales å unngå løkker mellom bordene.
34) Om dimensjonstabell kan ha numerisk verdi?
Ja, dimensjonstabeller kan ha numerisk verdi ettersom de er de beskrivende elementene i virksomheten vår.
35) Hva er definisjonen av Cube i Datawarehousing?
Kuber er logisk representasjon av flerdimensjonale data. Kanten på kuben har dimensjonselementene, og kubens kropp inneholder dataverdiene.
36) Hva kalles dimensjonsmodellering?
Dimensional Modeling er et konsept som kan brukes av datavarehusdesignere til å bygge sitt eget datavarehus. Denne modellen kan lagres i to typer tabeller – Fakta og Dimensjonstabell.
Faktatabellen har fakta og målinger av virksomheten og dimensjonstabellen inneholder konteksten for målinger.
37) Hva er typene dimensjonsmodellering?
Følgende er Typer dimensjoner i datavarehus:
- Tilpasset dimensjon
- Utrigger dimensjon
- Krympet dimensjon
- Rollespilldimensjon
- Dimensjon til dimensjonstabell
- Søppeldimensjon
- Degenerert dimensjon
- Byttbar dimensjon
- Trinndimensjon
38) Hva er surrogatnøkkel?
Surrogatnøkkel er ikke annet enn en erstatning for den naturlige primærnøkkelen. Den er satt til å være en unik identifikator for hver rad som kan brukes for primærnøkkelen til en tabell.
39) Hva er forskjellen mellom ER-modellering og dimensjonsmodellering?
ER-modellering vil ha logisk og fysisk modell, men dimensjonsmodellering vil bare ha fysisk modell.
ER-modellering brukes for å normalisere OLTP-databasedesignet, mens dimensjonsmodellering brukes til å denormalisere ROLAP- og MOLAP-designet.
40) Hva er trinnene for å bygge datavarehuset?
Følgende er trinnene som skal følges for å bygge datavarehuset:
- Samle forretningskrav
- Identifisere nødvendige kilder
- Identifisere fakta
- Definere dimensjonene
- Definere attributtene
- Omdefiner dimensjonene og attributtene om nødvendig
- Organiser attributthierarkiet
- Definer relasjoner
- Tilordne unike identifikatorer
41) Hva er de forskjellige typene datavarehusing?
Følgende er de forskjellige typene datavarehusing:
- Enterprise Datawarehousing
- Driftsdatalager
- Databutikk
42) Hva må gjøres når du starter databasen?
Følgende må gjøres for å starte databasen:
- Start en instans
- Monter databasen
- Åpne databasen
43) Hva må gjøres når databasen stenges?
Følgende må gjøres når databasen stenges:
- Lukk databasen
- Demonter databasen
- Slå av forekomsten
44) Kan vi ta backup når databasen åpnes?
Ja, vi kan ta full backup når databasen åpnes.
45) Hva er definert som delvis sikkerhetskopi?
En delvis sikkerhetskopi i en operativsystem er en sikkerhetskopi som mangler full backup, og den kan gjøres mens databasen åpnes eller slås av.
46) Hva er målet med Optimizer?
Målet med Optimizer er å finne den mest effektive måten å utføre SQL uttalelser.
47) Hva er gjennomføringsplan?
Utførelsesplan er en plan som brukes til optimaliseringen for å velge kombinasjonen av trinnene.
48) Hva er tilnærmingene som brukes av Optimizer under utførelsesplanen?
Det er to tilnærminger:
- Regelbasert
- Kostnadsbasert
49) Hvilke verktøy er tilgjengelige for ETL?
Følgende er tilgjengelige ETL-verktøy:
Informatikk
Datastadiet
Oracle
Lagerbygger
Ab Initio
Data Junction
50) Hva er forskjellen mellom metadata og dataordbok?
Metadata er definert som data om dataene. Men dataordboken inneholder informasjon om prosjektinformasjon, grafer, abinito-kommandoer og serverinformasjon.
Disse intervjuspørsmålene vil også hjelpe i din viva(orals)
takk for informasjonen :)
hvordan installere datastage etl tool-programvare i windows10
takk for at du deler informasjonen
hii
pls
datavarehus forklare og thoery
Veldig nyttig informasjon .. Takk :)
Takk! veldig hjelpsomme.
SCD-typer er ikke i riktig rekkefølge.
Type 0 – Fast dimensjon
Ingen endringer tillatt, dimensjon endres aldri
Type 1 – Ingen historikk
Oppdater posten direkte, det er ingen registrering av historiske verdier, den eneste gjeldende tilstanden
Type 2 – Radversjon
Spor endringer som versjonsposter med gjeldende flagg og aktive datoer og andre metadata
Type 3 – Forrige verdi-kolonne
Spor endring av et spesifikt attributt, legg til en kolonne for å vise den forrige verdien, som oppdateres etter hvert som ytterligere endringer skjer
Type 4 – Historietabell
Vis gjeldende verdi i dimensjonstabellen, men spor alle endringer i en separat tabell
Type 6 – Hybrid SCD
Bruk teknikker fra SCD Type 1, 2 og 3 for å spore endring
Takk .. Dette er nyttig
Nyttig for revisjon :)
Takk
Det er veldig nyttig. Å dele gode ting til folk.
Jeg trenger hjelp til å diskutere dette spørsmålet!
Spørsmål: Du er ansatt som datavarehusingeniør av en megabutikk. Hvordan kan du bruke assosiasjonsregelen for datautvinning for å øke salget av megabutikken?
44. Kan vi ta backup når databasen åpnes?
Ja, vi kan ta full backup når databasen åpnes. Det kalles hot backup ...
q 37 er feil
Hei, takk for at du deler tankene dine. Den er oppdatert..
Veldig bra sir.
Takk for at du gir verdifulle spørsmål og enkle svar
Takk, det hjalp meg mye
Det er veldig hyggelig takk Det hjelper meg mye.
Lett å forstå takk
Takk, det hjalp meg.
Alt i alt veldig nyttig informasjon, takk