Top 50 pitanja i odgovora za intervju za skladište podataka

Evo pitanja i odgovora na intervjuu za skladište podataka za svježije i iskusnije kandidate koji će dobiti posao iz snova.

1) Što je skladište podataka?

Skladištenje podataka (DW) je repozitorij podataka i koristi se za sustav podrške upravljanju odlučivanjem. Skladište podataka sastoji se od širokog spektra podataka koji imaju visoku razinu uvjeta poslovanja u jednom trenutku.

U jednoj rečenici, to je spremište integriranih informacija koje mogu biti dostupne za upite i analizu.


2) Što je Poslovna inteligencija?

Poslovna inteligencija je također poznata kao DSS – Decision Support System koji se odnosi na tehnologije, aplikacije i prakse za prikupljanje, integraciju i analizu poslovnih informacija ili podataka. Čak, pomaže vidjeti podatke na samim informacijama.

Besplatno preuzimanje PDF-a: Pitanja i odgovori za intervju za skladište podataka


3) Što je tablica dimenzija?

Tablica dimenzija je tablica koja sadrži atribute mjerenja pohranjene u tablicama činjenica. Ova se tablica sastoji od hijerarhija, kategorija i logike koja se može koristiti za kretanje u čvorovima.


4) Što je tablica činjenica?

Fact table sadrži mjerenje poslovnih procesa, te sadrži strane ključeve za dimenzijske tablice.

Primjer – ako je poslovni proces proizvodnja opeke

Prosječan broj opeka koje proizvede jedna osoba/stroj – mjera poslovnog procesa


5) Koje su faze Datawarehousing-a?

Postoje četiri faze skladištenja podataka:

Skladište podataka
Skladište podataka
  • Izvanmrežna operativna baza podataka
  • Izvanmrežno skladište podataka
  • Skladište podataka u stvarnom vremenu
  • Integrirano skladište podataka

6) Što je Data Mining?

Data Mining je postavljen kao proces analize podataka u različitim dimenzijama ili perspektivama i sažimanja u korisnu informaciju. Može se postavljati upit i dohvaćati podatke iz baze podataka u vlastitom formatu.


7) Što je OLTP?

OLTP se skraćeno naziva On-Line Transaction Processing, a radi se o aplikaciji koja mijenja podatke kad god ih primi i ima velik broj istovremenih korisnika.

Pitanja za intervju za skladište podataka
Pitanja za intervju za skladište podataka

8) Što je OLAP?

OLAP se skraćeno naziva Online Analytical Processing, a postavljen je kao sustav koji prikuplja, upravlja i obrađuje višedimenzionalne podatke u svrhu analize i upravljanja.


9) Koja je razlika između OLTP i OLAP?

Slijede razlike između OLTP i OLAP:

OLTP OLAP
Podaci su iz izvornog izvora podataka Podaci su iz različitih izvora podataka
Jednostavni upiti korisnika Složeni upiti po sustavu
Normalizirana mala baza podataka Denormalizirana velika baza podataka
Temeljni poslovni zadaci Višedimenzionalni poslovni zadaci

10) Što je ODS?

ODS je skraćeno Operational Data Store i to je spremište operativnih podataka u stvarnom vremenu, a ne podataka o dugoročnom trendu.


11) Koja je razlika između pogleda i materijaliziranog pogleda?

Pogled nije ništa drugo nego virtualna tablica koja preuzima izlaz upita i može se koristiti umjesto tablica.

Materijalizirani pogled nije ništa drugo nego neizravan pristup podacima tablice pohranjivanjem rezultata upita u zasebnu shemu.


12) Što je ETL?

ETL je skraćeno od Extract, Transform and Load. ETL je softver koji se koristi za čitanje podataka iz navedenog izvora podataka i izdvajanje željenog podskupa podataka. Zatim transformira podatke pomoću pravila i tablica pretraživanja i pretvara ih u željeno stanje.

Zatim se koristi funkcija učitavanja za učitavanje dobivenih podataka u ciljnu bazu podataka.


13) Što je VLDB?

VLDB je skraćeno Very Large Database i njegova veličina je postavljena na više od jednog terabajta baze podataka. To su sustavi za podršku odlučivanju koji se koriste za posluživanje velikog broja korisnika.


14) Što je skladištenje podataka u stvarnom vremenu?

Skladištenje podataka u stvarnom vremenu bilježi poslovne podatke kad god se pojave. Kada se poslovna aktivnost dovrši, ti će podaci biti dostupni u toku i odmah dostupni za korištenje.


15) Što su agregatne tablice?

Zbirne tablice su tablice koje sadrže postojeće podatke o skladištu koji su grupirani na određenu razinu dimenzija. Lako je dohvatiti podatke iz agregiranih tablica nego iz originalne tablice koja ima više zapisa.

Ova tablica smanjuje opterećenje poslužitelja baze podataka i povećava izvedbu upita.


16) Što su tablice činjenica bez činjenica?

Tablice činjenica bez činjenica su tablice činjenica koje ne sadrže numerički stupac činjenica u tablici činjenica.


17) Kako možemo učitati vremensku dimenziju?

Vremenske dimenzije se obično učitavaju kroz sve moguće datume u godini i to se može učiniti kroz program. Ovdje se 100 godina može prikazati jednim redom po danu.


18) Što su neaditivne činjenice?

Za činjenice koje ne izazivaju ovisnost kaže se da su činjenice koje se ne mogu sažeti niti za jednu od dimenzija prisutnih u tablici činjenica. Ako postoje promjene u dimenzijama, iste činjenice mogu biti korisne.


19) Što je konformirana činjenica?

Usklađena činjenica je tablica koja se može koristiti u više podatkovnih marti u kombinaciji s višestrukim tablicama činjenica.


20) Što je Datamart?

Datamart je specijalizirana verzija Datawarehousinga i sadrži snimku operativnih podataka koji pomažu poslovnim ljudima da odluče uz analizu prošlih trendova i iskustava. Staza podataka pomaže u naglašavanju jednostavnog pristupa relevantnim informacijama.


21) Što je Active Datawarehousing?

Aktivno skladište podataka je skladište podataka koje donositeljima odluka unutar tvrtke ili organizacije omogućuje učinkovito i učinkovito upravljanje odnosima s klijentima.


22) Koja je razlika između Datawarehousea i OLAP-a?

Datawarehouse je mjesto gdje se cijeli podaci pohranjuju za analizu, ali OLAP se koristi za analizu podataka, upravljanje agregacijama, particioniranje informacija na manje razine informacija.


23) Što je ER dijagram?

ER dijagram je skraćeno Entity-Relationship dijagram koji ilustrira međusobne odnose između entiteta u bazi podataka. Ovaj dijagram prikazuje strukturu svake tablice i veze između tablica.

ER dijagram
ER dijagram

24) Koji su ključni stupci u tablicama činjenica i dimenzija?

Strani ključevi dimenzijskih tablica primarni su ključevi tablica entiteta. Strani ključevi tablica činjenica su primarni ključevi dimenzijskih tablica.


25) Što je SCD?

SCD se definira kao sporo promjenjive dimenzije, a odnosi se na slučajeve kada se zapis mijenja tijekom vremena.


26) Koje su vrste SCD-a?

Postoje tri vrste SCD-a i to su:

SCD 1 – Novi zapis zamjenjuje izvorni zapis

SCD 2 – novi zapis je dodan u postojeću tablicu dimenzija kupaca

SCD 3 – Izvorni podaci su modificirani kako bi uključili nove podatke


27) Što je BUS shema?

BUS shema sastoji se od paketa potvrđenih dimenzija i standardizirane definicije ako postoje tablice činjenica.


28) Što je zvjezdana shema?

Zvjezdasta shema nije ništa drugo nego vrsta organiziranja tablica na takav način da se rezultat može brzo dohvatiti iz baze podataka u okruženju skladišta podataka.

Shema zvijezda
Shema zvijezda

29) Što je shema pahuljice?

Shema snježne pahuljice koja ima primarnu tablicu dimenzija kojoj se može pridružiti jedna ili više dimenzija. Tablica primarnih dimenzija jedina je tablica koja se može pridružiti tablici činjenica.

Shema snježne pahulje
Shema snježne pahulje

30) Što je temeljna dimenzija?

Osnovna dimenzija nije ništa drugo nego tablica dimenzija koja se koristi kao namjenska za tablicu pojedinačnih činjenica ili stambe podataka.


31) Što se zove čišćenje podataka?

Sam naziv implicira da se radi o pojmu koji sam po sebi objašnjava. Čišćenje zapisa siročadi, Podaci koji krše poslovna pravila, Nedosljedni podaci i informacije koje nedostaju u bazi podataka.


32) Što su metapodaci?

Metapodaci se definiraju kao podaci o podacima. Metapodaci sadrže informacije poput broja korištenih stupaca, fiksne širine i ograničene širine, redoslijeda polja i tipova podataka polja.


33) Što su petlje u Datawarehousingu?

U skladištenju podataka postoje petlje između tablica. Ako postoji petlja između tablica, tada će generiranje upita trajati više vremena i stvara dvosmislenost. Savjetuje se izbjegavanje petlji između stolova.


34) Može li tablica dimenzija imati numeričku vrijednost?

Da, dimenzijska tablica može imati numeričku vrijednost jer su to opisni elementi našeg poslovanja.


35) Koja je definicija kocke u skladištenju podataka?

Kocke su logičan prikaz višedimenzionalnih podataka. Rub kocke ima članove dimenzija, a tijelo kocke sadrži vrijednosti podataka.


36) Što se zove dimenzionalno modeliranje?

Dimenzionalno modeliranje je koncept koji dizajneri kuća za skladištenje podataka mogu koristiti za izgradnju vlastitog skladišta podataka. Ovaj model se može pohraniti u dvije vrste tablica – tablicu činjenica i tablicu dimenzija.

Tablica činjenica sadrži činjenice i mjerenja poslovanja, a tablica dimenzija sadrži kontekst mjerenja.


37) Koje su vrste dimenzionalnog modeliranja?

Slijede Vrste dimenzija u skladištu podataka:

  • Usklađena dimenzija
  • Dimenzija potpora
  • Shrunken Dimension
  • Dimenzija igranja uloga
  • Tablica od dimenzija do dimenzija
  • Dimenzija smeća
  • Degenerirana dimenzija
  • Zamjenjiva dimenzija
  • Dimenzija koraka

38) Što je surogat ključ?

Surogat ključ nije ništa drugo nego zamjena za prirodni primarni ključ. Postavljen je kao jedinstveni identifikator za svaki redak koji se može koristiti kao primarni ključ tablice.


39) Koja je razlika između ER modeliranja i dimenzionalnog modeliranja?

ER modeliranje će imati logički i fizički model, ali će dimenzionalno modeliranje imati samo fizički model.

ER modeliranje koristi se za normalizaciju dizajna OLTP baze podataka, dok se dimenzionalno modeliranje koristi za denormalizaciju ROLAP i MOLAP dizajna.


40) Koji su koraci za izgradnju skladišta podataka?

Slijede koraci koje treba slijediti za izgradnju datawaerhouse-a:

  • Prikupljanje poslovnih zahtjeva
  • Identificiranje potrebnih izvora
  • Identificiranje činjenica
  • Definiranje dimenzija
  • Definiranje atributa
  • Po potrebi ponovno definirajte dimenzije i atribute
  • Organizirajte hijerarhiju atributa
  • Definirajte odnose
  • Dodijelite jedinstvene identifikatore

41) Koje su različite vrste skladištenja podataka?

Slijede različite vrste skladištenja podataka:

  • Skladištenje podataka u poduzeću
  • Operativno skladište podataka
  • Data Mart

42) Što treba učiniti prilikom pokretanja baze podataka?

Za pokretanje baze potrebno je učiniti sljedeće:

  1. Pokrenite instancu
  2. Montirajte bazu podataka
  3. Otvorite bazu podataka

43) Što treba učiniti kada se baza podataka ugasi?

Kada se baza podataka isključi, potrebno je učiniti sljedeće:

  1. Zatvorite bazu podataka
  2. Demontirajte bazu podataka
  3. Isključite instancu

44) Možemo li napraviti sigurnosnu kopiju kada je baza podataka otvorena?

Da, možemo napraviti punu sigurnosnu kopiju kada se otvori baza podataka.


45) Što se definira kao djelomična sigurnosna kopija?

Djelomična sigurnosna kopija u operativni sustav je sigurnosna kopija manja od pune sigurnosne kopije i može se napraviti dok je baza podataka otvorena ili isključena.


46) Koji je cilj Optimizatora?

Cilj Optimizera je pronaći najučinkovitiji način za izvršenje SQL izjave.


47) Što je plan izvršenja?

Plan izvršenja je plan koji se koristi optimizatoru za odabir kombinacije koraka.


48) Koje pristupe koristi Optimizer tijekom plana izvršenja?

Postoje dva pristupa:

  1. Na temelju pravila
  2. Na temelju troškova

49) Koji su alati dostupni za ETL?

Dostupni su sljedeći ETL alati:

Informatika
Data Stage
Proročanstvo
Graditelj skladišta
Ab Initio
Data Junction


50) Koja je razlika između metapodataka i rječnika podataka?

Metapodaci se definiraju kao podaci o podacima. No, rječnik podataka sadrži informacije o informacijama o projektu, grafikonima, abinito naredbama i informacijama o poslužitelju.

Ova pitanja za intervju također će vam pomoći u vašem životu

Podijeli

21 Komentari

  1. Avatar Meydan Schwartz kaže:

    hvala na informacijama :)

    1. kako instalirati softver datastage etl tool u moj Windows 10

  2. Shiv Gautam kaže:

    hvala na dijeljenju informacija

    1. Avatar sai srinivas kaže:

      Zdravo, ja
      pls
      skladište podataka objašnjenje i teorija

  3. Avatar Ekta Soni kaže:

    Vrlo korisna informacija.. Hvala :)

  4. Avatar Grahi Parmar kaže:

    Vrste SCD nisu u ispravnom redoslijedu.
    Tip 0 – fiksna dimenzija
    Promjene nisu dopuštene, dimenzija se nikada ne mijenja
    Tip 1 – Bez povijesti
    Ažurirajte zapis izravno, nema zapisa povijesnih vrijednosti, jedino trenutno stanje
    Tip 2 – Verzija redaka
    Pratite promjene kao zapise verzije s trenutnom zastavom i aktivnim datumima i drugim metapodacima
    Vrsta 3 – Stupac prethodne vrijednosti
    Pratite promjenu određenog atributa, dodajte stupac za prikaz prethodne vrijednosti, koja se ažurira kako dolazi do daljnjih promjena
    Tip 4 – Tablica povijesti
    Prikaži trenutnu vrijednost u tablici dimenzija, ali prati sve promjene u zasebnoj tablici
    Tip 6 – hibridni SCD
    Upotrijebite tehnike SCD tipova 1, 2 i 3 za praćenje promjena

    1. Srividya Krishnamoorthy kaže:

      Hvala .. Ovo je od pomoći

  5. Vrlo je korisno. Za dijeljenje dobrih stvari s ljudima.

  6. Avatar Muhammed Abubakar kaže:

    Trebam pomoć da raspravim ovo pitanje!
    P: Mega trgovina vas je zaposlila kao inženjera za obradu podataka. Kako možete koristiti pravilo asocijacije rudarenja podataka za povećanje prodaje mega trgovine?

  7. Avatar dr Darko Petrušić kaže:

    44. Možemo li napraviti sigurnosnu kopiju kada je baza podataka otvorena?

    Da, možemo napraviti punu sigurnosnu kopiju kada se otvori baza podataka. To se zove vruća sigurnosna kopija...

    1. Alex Silverman Alex Silverman kaže:

      Pozdrav, hvala što ste podijelili svoje mišljenje. Ažurirano je..

  8. Vrlo dobro gospodine.
    Hvala na vrijednim pitanjima i jednostavnim odgovorima

  9. Stvarno je lijepo, hvala. Puno mi pomaže.

  10. Avatar Asrar Alam kaže:

    Sveukupno vrlo korisne informacije, hvala

Ostavi odgovor

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena *