Top 50 de întrebări și răspunsuri la interviu pentru depozitul de date

Iată întrebările și răspunsurile la interviu Data Warehouse pentru candidații mai proaspeți, precum și cu experiență, pentru a obține jobul visat.

1) Ce este Data Warehouse?

Data warehousing (DW) este depozitul de date și este utilizat pentru sistemul de suport decizional al managementului. Depozitul de date constă dintr-o mare varietate de date care au un nivel ridicat de condiții de afaceri la un singur moment în timp.

Într-o singură propoziție, este un depozit de informații integrate care pot fi disponibile pentru interogări și analize.


2) Ce este Business Intelligence?

Business Intelligence este cunoscută și sub denumirea de DSS – Decision support system, care se referă la tehnologiile, aplicațiile și practicile pentru colectarea, integrarea și analiza informațiilor sau datelor legate de afaceri. Chiar și, vă ajută să vedeți datele despre informațiile în sine.

Descărcare PDF gratuită: Întrebări și răspunsuri la interviu Data Warehouse


3) Ce este tabelul de dimensiuni?

Tabelul de dimensiuni este un tabel care conține atribute ale măsurătorilor stocate în tabelele de fapte. Acest tabel constă din ierarhii, categorii și logică care pot fi folosite pentru a parcurge în noduri.


4) Ce este Tabelul de fapte?

Tabelul de fapte conține măsurarea proceselor de afaceri și conține chei externe pentru tabelele de dimensiuni.

Exemplu – Dacă procesul de afaceri este fabricarea cărămizilor

Numărul mediu de cărămizi produse de o persoană/mașină – măsură a procesului de afaceri


5) Care sunt etapele Datawarehousing-ului?

Există patru etape ale Datawarehousing:

depozit de date
depozit de date
  • Baza de date operațională offline
  • Depozit de date offline
  • Datawarehouse în timp real
  • Datawarehouse integrat

6) Ce este data mining?

Data Mining este setat să fie un proces de analiză a datelor în diferite dimensiuni sau perspective și de rezumat într-o informație utilă. Pot fi interogate și preluate datele din baza de date în format propriu.


7) Ce este OLTP?

OLTP este abreviat ca On-Line Transaction Processing, și este o aplicație care modifică datele ori de câte ori le primește și are un număr mare de utilizatori simultani.

Întrebări de interviu pentru depozitul de date
Întrebări de interviu pentru depozitul de date

8) Ce este OLAP?

OLAP este abreviat ca procesare analitică online și este setat să fie un sistem care colectează, gestionează, procesează date multidimensionale în scopuri de analiză și management.


9) Care este diferența dintre OLTP și OLAP?

Următoarele sunt diferențele dintre OLTP și OLAP:

OLTP OLAP
Datele provin din sursa originală de date Datele provin din diverse surse de date
Interogări simple ale utilizatorilor Interogări complexe în funcție de sistem
Mic bază de date normalizată Baza de date mare denormalizată
Sarcini fundamentale de afaceri Sarcini de afaceri multidimensionale

10) Ce este ODS?

ODS este abreviat ca Magazin de date operaționale și este un depozit de date operaționale în timp real, mai degrabă decât date despre tendințe pe termen lung.


11) Care este diferența dintre Vedere și Vedere materializată?

O vizualizare nu este altceva decât un tabel virtual care preia rezultatul interogării și poate fi folosit în locul tabelelor.

O vizualizare materializată nu este altceva decât un acces indirect la datele din tabel prin stocarea rezultatelor unei interogări într-o schemă separată.


12) Ce este ETL?

ETL este abreviat ca Extract, Transform and Load. ETL este un software care este utilizat pentru a citi datele din sursa de date specificată și pentru a extrage un subset dorit de date. Apoi, transformă datele folosind reguli și tabele de căutare și le convertește într-o stare dorită.

Apoi, funcția de încărcare este utilizată pentru a încărca datele rezultate în baza de date țintă.


13) Ce este VLDB?

VLDB este abreviat ca bază de date foarte mare și dimensiunea sa este setată să fie mai mult de un terabyte de bază de date. Acestea sunt sisteme de asistență decizională care sunt utilizate pentru a servi un număr mare de utilizatori.


14) Ce este datawarehousing-ul în timp real?

Datawarehousing-ul în timp real captează datele de afaceri ori de câte ori apare. Când activitatea comercială este finalizată, acele date vor fi disponibile în flux și vor deveni disponibile pentru utilizare instantaneu.


15) Ce sunt tabelele agregate?

Tabelele agregate sunt tabelele care conțin datele existente ale depozitului care au fost grupate la un anumit nivel de dimensiuni. Este ușor să preluați date din tabelele agregate decât tabelul original, care are un număr mai mare de înregistrări.

Acest tabel reduce încărcarea în serverul bazei de date și crește performanța interogării.


16) Ce sunt tabelele cu fapte fără fapte?

Un tabel de fapte fără fapte este tabelul de fapte care nu conține coloana de fapte numerice în tabelul de fapte.


17) Cum putem încărca dimensiunea timp?

Dimensiunile de timp sunt de obicei încărcate prin toate datele posibile dintr-un an și se poate face printr-un program. Aici, 100 de ani pot fi reprezentați cu un rând pe zi.


18) Ce sunt faptele non-aditive?

Se spune că faptele care nu generează dependență sunt fapte care nu pot fi rezumate pentru niciuna dintre dimensiunile prezente în tabelul de fapte. Dacă există modificări ale dimensiunilor, aceleași fapte pot fi utile.


19) Ce este un fapt conformat?

Faptul conform este un tabel care poate fi utilizat în mai multe magazine de date în combinație cu tabelele de fapte multiple.


20) Ce este Datamart?

Un Datamart este o versiune specializată a Datawarehousing și conține un instantaneu al datelor operaționale care îi ajută pe oamenii de afaceri să decidă cu analiza tendințelor și experiențelor trecute. Un data mart ajută la accentuarea accesului ușor la informații relevante.


21) Ce este Active Datawarehousing?

Un depozit de date activ este un depozit de date care permite factorilor de decizie din cadrul unei companii sau organizații să gestioneze relațiile cu clienții în mod eficient și eficient.


22) Care este diferența dintre Datawarehouse și OLAP?

Datawarehouse-ul este un loc în care toate datele sunt stocate pentru analiză, dar OLAP este folosit pentru analiza datelor, gestionarea agregărilor, împărțirea informațiilor în informații de nivel minor.


23) Ce este Diagrama ER?

Diagrama ER este abreviată ca diagramă Entitate-Relație care ilustrează interrelațiile dintre entitățile din baza de date. Această diagramă arată structura fiecărui tabel și legăturile dintre tabele.

Diagrama ER

24) Care sunt coloanele cheie din tabelele de fapte și dimensiuni?

Cheile externe ale tabelelor de dimensiuni sunt cheile primare ale tabelelor de entități. Cheile externe ale tabelelor de fapte sunt cheile primare ale tabelelor de dimensiuni.


25) Ce este SCD?

SCD este definit ca dimensiuni care se schimbă lent și se aplică cazurilor în care înregistrarea se modifică în timp.


26) Care sunt tipurile de SCD?

Există trei tipuri de SCD și sunt după cum urmează:

SCD 1 – Noua înregistrare înlocuiește înregistrarea originală

SCD 2 – O înregistrare nouă este adăugată la tabelul de dimensiuni client existent

SCD 3 – O dată originală este modificată pentru a include date noi


27) Ce este BUS Schema?

Schema BUS constă dintr-o suită de dimensiuni confirmate și definiție standardizată dacă există tabele de fapte.


28) Ce este Schema Stelară?

Schema stea nu este altceva decât un tip de organizare a tabelelor în așa fel încât rezultatul să poată fi preluat rapid din baza de date în mediul de depozit de date.

Schema stelelor

29) Ce este Snowflake Schema?

Schema fulg de zăpadă care are un tabel de dimensiuni primare la care pot fi conectate una sau mai multe dimensiuni. Tabelul de dimensiuni primare este singurul tabel care poate fi alăturat cu tabelul de fapte.

Schema fulgilor de nea

30) Ce este o dimensiune de bază?

Dimensiunea de bază nu este altceva decât un tabel de dimensiuni care este folosit ca fiind dedicat pentru un singur tabel de fapte sau datamart.


31) Ce se numește curățarea datelor?

Numele în sine implică faptul că este un termen care se explică de la sine. Curățarea înregistrărilor orfane, regulile de afaceri de încălcare a datelor, date inconsecvente și informații lipsă dintr-o bază de date.


32) Ce sunt metadatele?

Metadatele sunt definite ca date despre date. Metadatele conțin informații precum numărul de coloane utilizate, lățimea fixă ​​și lățimea limitată, ordonarea câmpurilor și tipurile de date ale câmpurilor.


33) Ce sunt buclele în Datawarehousing?

În datawarehousing-ul, există bucle între tabele. Dacă există o buclă între tabele, atunci generarea interogării va dura mai mult timp și va crea ambiguitate. Se recomandă să evitați bucla între mese.


34) Dacă tabelul de dimensiuni poate avea valoare numerică?

Da, tabelul de dimensiuni poate avea valoare numerică, deoarece acestea sunt elementele descriptive ale afacerii noastre.


35) Care este definiția lui Cube în Datawarehousing?

Cuburile sunt reprezentari logice a datelor multidimensionale. Muchia cubului are membrii dimensiunii, iar corpul cubului conține valorile datelor.


36) Ce se numește modelare dimensională?

Modelarea dimensională este un concept care poate fi utilizat de către designerii caselor de dateware pentru a-și construi propriul depozit de date. Acest model poate fi stocat în două tipuri de tabele – Fapte și Tabel de dimensiuni.

Tabelul de fapte conține fapte și măsurători ale afacerii, iar tabelul de dimensiuni conține contextul măsurătorilor.


37) Care sunt tipurile de modelare dimensională?

Următoarele sunt Tipuri de dimensiuni în depozitul de date:

  • Dimensiune conformată
  • Dimensiunea stabilizatorului
  • Dimensiunea restrânsă
  • Dimensiunea jocului de rol
  • Tabel de dimensiuni la dimensiuni
  • Dimensiunea Junk
  • Dimensiunea degenerată
  • Dimensiune schimbabilă
  • Dimensiunea pasului

38) Ce este cheia surogat?

Cheia surogat nu este altceva decât un substitut pentru cheia primară naturală. Este setat să fie un identificator unic pentru fiecare rând care poate fi utilizat pentru cheia primară a unui tabel.


39) Care este diferența dintre modelarea ER și modelarea dimensională?

Modelarea ER va avea model logic și fizic, dar modelarea dimensională va avea doar model fizic.

Modelarea ER este utilizată pentru normalizarea designului bazei de date OLTP, în timp ce modelarea dimensională este utilizată pentru denormalizarea designului ROLAP și MOLAP.


40) Care sunt pașii pentru construirea depozitului de date?

Următorii sunt pașii care trebuie urmați pentru a construi datawaerhouse:

  • Colectarea cerințelor de afaceri
  • Identificarea surselor necesare
  • Identificarea faptelor
  • Definirea dimensiunilor
  • Definirea atributelor
  • Redefiniți dimensiunile și atributele dacă este necesar
  • Organizați ierarhia atributelor
  • Definiți relațiile
  • Atribuiți identificatori unici

41) Care sunt diferitele tipuri de datawarehosuing?

Următoarele sunt diferitele tipuri de Datawarehousing:

  • Enterprise Datawarehousing
  • Magazin de date operaționale
  • Data Mart

42) Ce trebuie făcut la pornirea bazei de date?

Pentru a porni baza de date, trebuie să faceți următoarele:

  1. Porniți o instanță
  2. Montați baza de date
  3. Deschide baza de date

43) Ce trebuie făcut când baza de date este oprită?

Următoarele trebuie făcute atunci când baza de date este oprită:

  1. Închideți baza de date
  2. Demontați baza de date
  3. Închideți instanța

44) Putem face backup atunci când baza de date este deschisă?

Da, putem face backup complet atunci când baza de date este deschisă.


45) Ce este definit ca backup parțial?

O copie de rezervă parțială într-un sistem de operare este o copie de rezervă scurtă față de backup complet și se poate face în timp ce baza de date este deschisă sau oprită.


46) Care este scopul Optimizer?

Scopul Optimizer este de a găsi cea mai eficientă modalitate de a executa SQL declarații.


47) Ce este Planul de Execuție?

Planul de execuție este un plan care este utilizat de optimizator pentru a selecta combinația de pași.


48) Care sunt abordările utilizate de Optimizer în timpul planului de execuție?

Există două abordări:

  1. Bazat pe reguli
  2. Bazat pe costuri

49) Care sunt instrumentele disponibile pentru ETL?

Următoarele sunt instrumentele ETL disponibile:

Informatică
Etapa de date
Oracol
Constructor de depozite
Ab Initio
Data Junction


50) Care este diferența dintre metadate și dicționar de date?

Metadatele sunt definite ca date despre date. Dar, Dicționarul de date conține informații despre informații despre proiect, grafice, comenzi abinito și informații despre server.

Aceste întrebări de interviu vă vor ajuta, de asemenea, în viva (orale)

Distribuie

4 Comentarii

  1. Avatar Meydan Schwartz spune:

    multumesc pentru informatii :)

    1. cum să instalez software-ul instrument datastage etl în Windows 10

  2. Shiv Gautam spune:

    multumesc pentru partajarea informatiilor

    1. Avatar sai srinivas spune:

      hii
      pls
      data ware house explica si thorery

  3. Avatar Ekta Soni spune:

    Informatii foarte utile .. Multumesc :)

  4. Avatar Grahi Parmar spune:

    Tipurile SCD nu sunt în ordinea corectă.
    Tip 0 – Dimensiune fixă
    Nu sunt permise modificări, dimensiunea nu se schimbă niciodată
    Tip 1 – Fără istoric
    Actualizați înregistrarea direct, nu există nicio înregistrare a valorilor istorice, singura stare actuală
    Tip 2 – Versiune pe rând
    Urmăriți modificările ca înregistrări de versiune cu semnalizare curentă și datele active și alte metadate
    Tip 3 – Coloana Valoare anterioară
    Urmăriți modificarea unui anumit atribut, adăugați o coloană pentru a afișa valoarea anterioară, care este actualizată pe măsură ce apar modificări ulterioare
    Tip 4 – Tabel istoric
    Afișați valoarea curentă în tabelul de dimensiuni, dar urmăriți toate modificările într-un tabel separat
    Tip 6 – SCD hibrid
    Utilizați tehnici de la tipurile SCD 1, 2 și 3 pentru a urmări schimbările

    1. Srividya Krishnamoorthy spune:

      Mulțumesc .. Acest lucru este de ajutor

  5. Este foarte util. Pentru a împărtăși oamenilor lucruri bune.

  6. Avatar Muhammad Abubakar spune:

    Am nevoie de ajutor pentru a discuta această întrebare!
    Î: Sunteți angajat ca inginer dataware house de un mega magazin. Cum puteți folosi regula de asociere a minării de date pentru a crește vânzarea mega-magazinului?

  7. Avatar dr Darko Petrusic spune:

    44. Putem face backup atunci când baza de date este deschisă?

    Da, putem face backup complet atunci când baza de date este deschisă. Se numește backup la cald...

    1. Alex Silverman Alex Silverman spune:

      Bună, mulțumesc pentru împărtășirea gândurilor tale. Este actualizat..

  8. Foarte bine domnule.
    Vă mulțumim pentru întrebări valoroase și răspunsuri ușor de înțeles

  9. Multumesc, m-a ajutat foarte mult

  10. Este foarte frumos. Mulțumesc. Mă ajută foarte mult.

  11. Avatar Asrar Alam spune:

    În general informații foarte utile, mulțumesc

Lasă un comentariu

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate *