Top 50 pitanja i odgovora za intervju za skladište podataka
Evo pitanja i odgovora na intervjuu za skladište podataka za svježije i iskusnije kandidate koji će dobiti posao iz snova.
1) Što je skladište podataka?
Skladištenje podataka (DW) je repozitorij podataka i koristi se za sustav podrške upravljanju odlučivanjem. Skladište podataka sastoji se od širokog spektra podataka koji imaju visoku razinu uvjeta poslovanja u jednom trenutku.
U jednoj rečenici, to je spremište integriranih informacija koje mogu biti dostupne za upite i analizu.
2) Što je Poslovna inteligencija?
Poslovna inteligencija je također poznata kao DSS – Decision Support System koji se odnosi na tehnologije, aplikacije i prakse za prikupljanje, integraciju i analizu poslovnih informacija ili podataka. Čak, pomaže vidjeti podatke na samim informacijama.
Besplatno preuzimanje PDF-a: Pitanja i odgovori za intervju za skladište podataka
3) Što je tablica dimenzija?
Tablica dimenzija je tablica koja sadrži atribute mjerenja pohranjene u tablicama činjenica. Ova se tablica sastoji od hijerarhija, kategorija i logike koja se može koristiti za kretanje u čvorovima.
4) Što je tablica činjenica?
Fact table sadrži mjerenje poslovnih procesa, te sadrži strane ključeve za dimenzijske tablice.
Primjer – ako je poslovni proces proizvodnja opeke
Prosječan broj opeka koje proizvede jedna osoba/stroj – mjera poslovnog procesa
5) Koje su faze Datawarehousing-a?
Postoje četiri faze skladištenja podataka:

- Izvanmrežna operativna baza podataka
- Izvanmrežno skladište podataka
- Skladište podataka u stvarnom vremenu
- Integrirano skladište podataka
6) Što je Data Mining?
Data Mining je postavljen kao proces analize podataka u različitim dimenzijama ili perspektivama i sažimanja u korisnu informaciju. Može se postavljati upit i dohvaćati podatke iz baze podataka u vlastitom formatu.
7) Što je OLTP?
OLTP se skraćeno naziva On-Line Transaction Processing, a radi se o aplikaciji koja mijenja podatke kad god ih primi i ima velik broj istovremenih korisnika.

8) Što je OLAP?
OLAP se skraćeno naziva Online Analytical Processing, a postavljen je kao sustav koji prikuplja, upravlja i obrađuje višedimenzionalne podatke u svrhu analize i upravljanja.
9) Koja je razlika između OLTP i OLAP?
Slijede razlike između OLTP i OLAP:
OLTP | OLAP |
---|---|
Podaci su iz izvornog izvora podataka | Podaci su iz različitih izvora podataka |
Jednostavni upiti korisnika | Složeni upiti po sustavu |
Normalizirana mala baza podataka | Denormalizirana velika baza podataka |
Temeljni poslovni zadaci | Višedimenzionalni poslovni zadaci |
10) Što je ODS?
ODS je skraćeno Operational Data Store i to je spremište operativnih podataka u stvarnom vremenu, a ne podataka o dugoročnom trendu.
11) Koja je razlika između pogleda i materijaliziranog pogleda?
Pogled nije ništa drugo nego virtualna tablica koja preuzima izlaz upita i može se koristiti umjesto tablica.
Materijalizirani pogled nije ništa drugo nego neizravan pristup podacima tablice pohranjivanjem rezultata upita u zasebnu shemu.
12) Što je ETL?
ETL je skraćeno od Extract, Transform and Load. ETL je softver koji se koristi za čitanje podataka iz navedenog izvora podataka i izdvajanje željenog podskupa podataka. Zatim transformira podatke pomoću pravila i tablica pretraživanja i pretvara ih u željeno stanje.
Zatim se koristi funkcija učitavanja za učitavanje dobivenih podataka u ciljnu bazu podataka.
13) Što je VLDB?
VLDB je skraćeno Very Large Database i njegova veličina je postavljena na više od jednog terabajta baze podataka. To su sustavi za podršku odlučivanju koji se koriste za posluživanje velikog broja korisnika.
14) Što je skladištenje podataka u stvarnom vremenu?
Skladištenje podataka u stvarnom vremenu bilježi poslovne podatke kad god se pojave. Kada se poslovna aktivnost dovrši, ti će podaci biti dostupni u toku i odmah dostupni za korištenje.
15) Što su agregatne tablice?
Zbirne tablice su tablice koje sadrže postojeće podatke o skladištu koji su grupirani na određenu razinu dimenzija. Lako je dohvatiti podatke iz agregiranih tablica nego iz originalne tablice koja ima više zapisa.
Ova tablica smanjuje opterećenje poslužitelja baze podataka i povećava izvedbu upita.
16) Što su tablice činjenica bez činjenica?
Tablice činjenica bez činjenica su tablice činjenica koje ne sadrže numerički stupac činjenica u tablici činjenica.
17) Kako možemo učitati vremensku dimenziju?
Vremenske dimenzije se obično učitavaju kroz sve moguće datume u godini i to se može učiniti kroz program. Ovdje se 100 godina može prikazati jednim redom po danu.
18) Što su neaditivne činjenice?
Za činjenice koje ne izazivaju ovisnost kaže se da su činjenice koje se ne mogu sažeti niti za jednu od dimenzija prisutnih u tablici činjenica. Ako postoje promjene u dimenzijama, iste činjenice mogu biti korisne.
19) Što je konformirana činjenica?
Usklađena činjenica je tablica koja se može koristiti u više podatkovnih marti u kombinaciji s višestrukim tablicama činjenica.
20) Što je Datamart?
Datamart je specijalizirana verzija Datawarehousinga i sadrži snimku operativnih podataka koji pomažu poslovnim ljudima da odluče uz analizu prošlih trendova i iskustava. Staza podataka pomaže u naglašavanju jednostavnog pristupa relevantnim informacijama.
21) Što je Active Datawarehousing?
Aktivno skladište podataka je skladište podataka koje donositeljima odluka unutar tvrtke ili organizacije omogućuje učinkovito i učinkovito upravljanje odnosima s klijentima.
22) Koja je razlika između Datawarehousea i OLAP-a?
Datawarehouse je mjesto gdje se cijeli podaci pohranjuju za analizu, ali OLAP se koristi za analizu podataka, upravljanje agregacijama, particioniranje informacija na manje razine informacija.
23) Što je ER dijagram?
ER dijagram je skraćeno Entity-Relationship dijagram koji ilustrira međusobne odnose između entiteta u bazi podataka. Ovaj dijagram prikazuje strukturu svake tablice i veze između tablica.

24) Koji su ključni stupci u tablicama činjenica i dimenzija?
Strani ključevi dimenzijskih tablica primarni su ključevi tablica entiteta. Strani ključevi tablica činjenica su primarni ključevi dimenzijskih tablica.
25) Što je SCD?
SCD se definira kao sporo promjenjive dimenzije, a odnosi se na slučajeve kada se zapis mijenja tijekom vremena.
26) Koje su vrste SCD-a?
Postoje tri vrste SCD-a i to su:
SCD 1 – Novi zapis zamjenjuje izvorni zapis
SCD 2 – novi zapis je dodan u postojeću tablicu dimenzija kupaca
SCD 3 – Izvorni podaci su modificirani kako bi uključili nove podatke
27) Što je BUS shema?
BUS shema sastoji se od paketa potvrđenih dimenzija i standardizirane definicije ako postoje tablice činjenica.
28) Što je zvjezdana shema?
Zvjezdasta shema nije ništa drugo nego vrsta organiziranja tablica na takav način da se rezultat može brzo dohvatiti iz baze podataka u okruženju skladišta podataka.

29) Što je shema pahuljice?
Shema snježne pahuljice koja ima primarnu tablicu dimenzija kojoj se može pridružiti jedna ili više dimenzija. Tablica primarnih dimenzija jedina je tablica koja se može pridružiti tablici činjenica.

30) Što je temeljna dimenzija?
Osnovna dimenzija nije ništa drugo nego tablica dimenzija koja se koristi kao namjenska za tablicu pojedinačnih činjenica ili stambe podataka.
31) Što se zove čišćenje podataka?
Sam naziv implicira da se radi o pojmu koji sam po sebi objašnjava. Čišćenje zapisa siročadi, Podaci koji krše poslovna pravila, Nedosljedni podaci i informacije koje nedostaju u bazi podataka.
32) Što su metapodaci?
Metapodaci se definiraju kao podaci o podacima. Metapodaci sadrže informacije poput broja korištenih stupaca, fiksne širine i ograničene širine, redoslijeda polja i tipova podataka polja.
33) Što su petlje u Datawarehousingu?
U skladištenju podataka postoje petlje između tablica. Ako postoji petlja između tablica, tada će generiranje upita trajati više vremena i stvara dvosmislenost. Savjetuje se izbjegavanje petlji između stolova.
34) Može li tablica dimenzija imati numeričku vrijednost?
Da, dimenzijska tablica može imati numeričku vrijednost jer su to opisni elementi našeg poslovanja.
35) Koja je definicija kocke u skladištenju podataka?
Kocke su logičan prikaz višedimenzionalnih podataka. Rub kocke ima članove dimenzija, a tijelo kocke sadrži vrijednosti podataka.
36) Što se zove dimenzionalno modeliranje?
Dimenzionalno modeliranje je koncept koji dizajneri kuća za skladištenje podataka mogu koristiti za izgradnju vlastitog skladišta podataka. Ovaj model se može pohraniti u dvije vrste tablica – tablicu činjenica i tablicu dimenzija.
Tablica činjenica sadrži činjenice i mjerenja poslovanja, a tablica dimenzija sadrži kontekst mjerenja.
37) Koje su vrste dimenzionalnog modeliranja?
Slijede Vrste dimenzija u skladištu podataka:
- Usklađena dimenzija
- Dimenzija potpora
- Shrunken Dimension
- Dimenzija igranja uloga
- Tablica od dimenzija do dimenzija
- Dimenzija smeća
- Degenerirana dimenzija
- Zamjenjiva dimenzija
- Dimenzija koraka
38) Što je surogat ključ?
Surogat ključ nije ništa drugo nego zamjena za prirodni primarni ključ. Postavljen je kao jedinstveni identifikator za svaki redak koji se može koristiti kao primarni ključ tablice.
39) Koja je razlika između ER modeliranja i dimenzionalnog modeliranja?
ER modeliranje će imati logički i fizički model, ali će dimenzionalno modeliranje imati samo fizički model.
ER modeliranje koristi se za normalizaciju dizajna OLTP baze podataka, dok se dimenzionalno modeliranje koristi za denormalizaciju ROLAP i MOLAP dizajna.
40) Koji su koraci za izgradnju skladišta podataka?
Slijede koraci koje treba slijediti za izgradnju datawaerhouse-a:
- Prikupljanje poslovnih zahtjeva
- Identificiranje potrebnih izvora
- Identificiranje činjenica
- Definiranje dimenzija
- Definiranje atributa
- Po potrebi ponovno definirajte dimenzije i atribute
- Organizirajte hijerarhiju atributa
- Definirajte odnose
- Dodijelite jedinstvene identifikatore
41) Koje su različite vrste skladištenja podataka?
Slijede različite vrste skladištenja podataka:
- Skladištenje podataka u poduzeću
- Operativno skladište podataka
- Data Mart
42) Što treba učiniti prilikom pokretanja baze podataka?
Za pokretanje baze potrebno je učiniti sljedeće:
- Pokrenite instancu
- Montirajte bazu podataka
- Otvorite bazu podataka
43) Što treba učiniti kada se baza podataka ugasi?
Kada se baza podataka isključi, potrebno je učiniti sljedeće:
- Zatvorite bazu podataka
- Demontirajte bazu podataka
- Isključite instancu
44) Možemo li napraviti sigurnosnu kopiju kada je baza podataka otvorena?
Da, možemo napraviti punu sigurnosnu kopiju kada se otvori baza podataka.
45) Što se definira kao djelomična sigurnosna kopija?
Djelomična sigurnosna kopija u operativni sustav je sigurnosna kopija manja od pune sigurnosne kopije i može se napraviti dok je baza podataka otvorena ili isključena.
46) Koji je cilj Optimizatora?
Cilj Optimizera je pronaći najučinkovitiji način za izvršenje SQL izjave.
47) Što je plan izvršenja?
Plan izvršenja je plan koji se koristi optimizatoru za odabir kombinacije koraka.
48) Koje pristupe koristi Optimizer tijekom plana izvršenja?
Postoje dva pristupa:
- Na temelju pravila
- Na temelju troškova
49) Koji su alati dostupni za ETL?
Dostupni su sljedeći ETL alati:
Informatika
Data Stage
Proročanstvo
Graditelj skladišta
Ab Initio
Data Junction
50) Koja je razlika između metapodataka i rječnika podataka?
Metapodaci se definiraju kao podaci o podacima. No, rječnik podataka sadrži informacije o informacijama o projektu, grafikonima, abinito naredbama i informacijama o poslužitelju.
Ova pitanja za intervju također će vam pomoći u vašem životu
hvala na informacijama :)
kako instalirati softver datastage etl tool u moj Windows 10
hvala na dijeljenju informacija
Zdravo, ja
pls
skladište podataka objašnjenje i teorija
Vrlo korisna informacija.. Hvala :)
Hvala! vrlo korisno.
Vrste SCD nisu u ispravnom redoslijedu.
Tip 0 – fiksna dimenzija
Promjene nisu dopuštene, dimenzija se nikada ne mijenja
Tip 1 – Bez povijesti
Ažurirajte zapis izravno, nema zapisa povijesnih vrijednosti, jedino trenutno stanje
Tip 2 – Verzija redaka
Pratite promjene kao zapise verzije s trenutnom zastavom i aktivnim datumima i drugim metapodacima
Vrsta 3 – Stupac prethodne vrijednosti
Pratite promjenu određenog atributa, dodajte stupac za prikaz prethodne vrijednosti, koja se ažurira kako dolazi do daljnjih promjena
Tip 4 – Tablica povijesti
Prikaži trenutnu vrijednost u tablici dimenzija, ali prati sve promjene u zasebnoj tablici
Tip 6 – hibridni SCD
Upotrijebite tehnike SCD tipova 1, 2 i 3 za praćenje promjena
Hvala .. Ovo je od pomoći
Korisno za reviziju :)
Hvala
Vrlo je korisno. Za dijeljenje dobrih stvari s ljudima.
Trebam pomoć da raspravim ovo pitanje!
P: Mega trgovina vas je zaposlila kao inženjera za obradu podataka. Kako možete koristiti pravilo asocijacije rudarenja podataka za povećanje prodaje mega trgovine?
44. Možemo li napraviti sigurnosnu kopiju kada je baza podataka otvorena?
Da, možemo napraviti punu sigurnosnu kopiju kada se otvori baza podataka. To se zove vruća sigurnosna kopija...
q 37 nije točno
Pozdrav, hvala što ste podijelili svoje mišljenje. Ažurirano je..
Vrlo dobro gospodine.
Hvala na vrijednim pitanjima i jednostavnim odgovorima
Hvala, puno mi je pomoglo
Stvarno je lijepo, hvala. Puno mi pomaže.
Lako za razumjeti hvala
Hvala, pomoglo mi je.
Sveukupno vrlo korisne informacije, hvala