50 najważniejszych pytań i odpowiedzi na rozmowie kwalifikacyjnej w hurtowni danych
Oto pytania i odpowiedzi dotyczące rozmów kwalifikacyjnych w hurtowni danych dla świeżych i doświadczonych kandydatów, którzy chcą zdobyć wymarzoną pracę.
1) Co to jest hurtownia danych?
Hurtownia danych (DW) to repozytorium danych wykorzystywane w systemie wspomagania decyzji zarządczych. Hurtownia danych składa się z szerokiej gamy danych charakteryzujących się wysokim poziomem warunków biznesowych w jednym momencie.
W jednym zdaniu jest to repozytorium zintegrowanych informacji, które mogą być dostępne do zapytań i analiz.
2) Co to jest Inteligencja biznesowa?
Business Intelligence jest również znany jako DSS – system wspomagania decyzji, który odnosi się do technologii, aplikacji i praktyk gromadzenia, integracji i analizy informacji lub danych związanych z biznesem. Nawet pomocne jest zobaczenie danych w samych informacjach.
Bezpłatne pobieranie w formacie PDF: Pytania i odpowiedzi dotyczące wywiadu w hurtowni danych
3) Co to jest tabela wymiarów?
Tabela wymiarów to tabela zawierająca atrybuty pomiarów zapisane w tabelach faktów. Tabela ta składa się z hierarchii, kategorii i logiki, których można używać do poruszania się po węzłach.
4) Co to jest tabela faktów?
Tabela faktów zawiera pomiar procesów biznesowych oraz zawiera klucze obce dla tabel wymiarów.
Przykład – jeśli procesem biznesowym jest produkcja cegieł
Średnia liczba cegieł wyprodukowanych przez jedną osobę/maszynę – miara procesu biznesowego
5) Jakie są etapy hurtowni danych?
Istnieją cztery etapy hurtowni danych:
- Operacyjna baza danych offline
- Hurtownia danych offline
- Hurtownia danych w czasie rzeczywistym
- Zintegrowana hurtownia danych
6) Co to jest eksploracja danych?
Eksploracja danych to proces analizowania danych w różnych wymiarach lub perspektywach i podsumowywania ich w użyteczną informację. Można odpytywać i pobierać dane z bazy danych w ich własnym formacie.
7) Co to jest OLTP?
OLTP, w skrócie On-Line Transaction Processing, jest aplikacją, która modyfikuje dane po ich otrzymaniu i ma dużą liczbę jednoczesnych użytkowników.
8) Co to jest OLAP?
OLAP jest w skrócie Online Analytical Processing i ma być systemem, który gromadzi, zarządza i przetwarza wielowymiarowe dane do celów analizy i zarządzania.
9) Jaka jest różnica między OLTP i OLAP?
Poniżej przedstawiono różnice między OLTP i OLAP:
OLTP | OLAP |
---|---|
Dane pochodzą z oryginalnego źródła danych | Dane pochodzą z różnych źródeł danych |
Proste zapytania użytkowników | Złożone zapytania systemowe |
Znormalizowana mała baza danych | Zdenormalizowana duża baza danych |
Podstawowe zadania biznesowe | Wielowymiarowe zadania biznesowe |
10) Co to jest ODS?
ODS, w skrócie Operational Data Store, jest repozytorium danych operacyjnych w czasie rzeczywistym, a nie danych o trendach długoterminowych.
11) Jaka jest różnica pomiędzy poglądem a poglądem zmaterializowanym?
Widok to nic innego jak wirtualna tabela, która pobiera wynik zapytania i może być używana zamiast tabel.
Widok zmaterializowany to nic innego jak pośredni dostęp do danych tabeli poprzez zapisanie wyników zapytania w osobnym schemacie.
12) Co to jest ETL?
ETL jest w skrócie wyodrębniany, przekształcany i ładowany. ETL to oprogramowanie służące do odczytu danych z określonego źródła danych i wyodrębnienia żądanego podzbioru danych. Następnie przekształca dane za pomocą reguł i tabel przeglądowych i konwertuje je do pożądanego stanu.
Następnie funkcja ładowania służy do załadowania wynikowych danych do docelowej bazy danych.
13) Co to jest VLDB?
VLDB jest skrótem Very Large Database, a jego rozmiar jest ustawiony na więcej niż jeden terabajt bazy danych. Są to systemy wspomagania decyzji, które służą do obsługi dużej liczby użytkowników.
14) Co to jest hurtownia danych w czasie rzeczywistym?
Hurtownia danych w czasie rzeczywistym przechwytuje dane biznesowe zawsze, gdy się pojawią. Po zakończeniu czynności biznesowej dane te będą dostępne w przepływie i będą natychmiast dostępne do wykorzystania.
15) Co to są tabele zbiorcze?
Tabele zbiorcze to tabele zawierające istniejące dane magazynowe, które zostały pogrupowane według określonego poziomu wymiarów. Pobieranie danych z tabel zagregowanych jest łatwiejsze niż w przypadku oryginalnej tabeli, która zawiera większą liczbę rekordów.
Ta tabela zmniejsza obciążenie serwera bazy danych i zwiększa wydajność zapytania.
16) Co to są tabele faktów pozbawione faktów?
Tabele faktów bez faktów to tabele faktów, które nie zawierają liczbowych kolumn faktów w tabeli faktów.
17) Jak możemy załadować wymiar czasu?
Wymiary czasowe są zazwyczaj ładowane przez wszystkie możliwe daty w roku i można to zrobić za pomocą programu. Tutaj 100 lat można przedstawić za pomocą jednego wiersza dziennie.
18) Czym są fakty nieaddytywne?
Fakty nieuzależniające to fakty, których nie można podsumować w żadnym z wymiarów występujących w tabeli faktów. Jeśli nastąpią zmiany w wymiarach, te same fakty mogą być przydatne.
19) Co to jest fakt zgodny?
Fakt zgodny to tabela, której można używać w wielu zbiorach danych w połączeniu z wieloma tabelami faktów.
20) Co to jest Datamart?
Datamart to wyspecjalizowana wersja Datawarehousing, która zawiera migawkę danych operacyjnych, która pomaga ludziom biznesowym podejmować decyzje na podstawie analizy przeszłych trendów i doświadczeń. Data Mart pomaga kłaść nacisk na łatwy dostęp do istotnych informacji.
21) Co to jest aktywna hurtownia danych?
Aktywna hurtownia danych to hurtownia danych, która umożliwia decydentom w firmie lub organizacji skuteczne i wydajne zarządzanie relacjami z klientami.
22) Jaka jest różnica między hurtownią danych a OLAPem?
Hurtownia danych to miejsce, w którym przechowywane są całe dane w celu analizy, ale OLAP służy do analizowania danych, zarządzania agregacjami i dzielenia informacji na informacje mniejszego poziomu.
23) Co to jest diagram ER?
Diagram ER jest w skrócie diagramem Entity-Relationship, który ilustruje wzajemne powiązania pomiędzy podmiotami w bazie danych. Ten diagram przedstawia strukturę każdej tabeli i powiązania między tabelami.
24) Jakie są kluczowe kolumny w tabelach faktów i wymiarów?
Klucze obce tabel wymiarów są kluczami podstawowymi tabel encji. Klucze obce tabel faktów są kluczami podstawowymi tabel wymiarów.
25) Co to jest SCD?
SCD definiuje się jako wolno zmieniające się wymiary i dotyczy przypadków, w których zapis zmienia się w czasie.
26) Jakie są rodzaje SCD?
Istnieją trzy typy SCD i są one następujące:
SCD 1 – Nowy rekord zastępuje pierwotny rekord
SCD 2 – Do istniejącej tabeli wymiarów klienta dodawany jest nowy rekord
SCD 3 – oryginalne dane są modyfikowane w celu uwzględnienia nowych danych
27) Co to jest schemat magistrali?
Schemat BUS składa się z zestawu potwierdzonych wymiarów i znormalizowanej definicji, jeśli istnieją tabele faktów.
28) Co to jest Schemat Gwiazdy?
Schemat gwiaździsty to nic innego jak sposób uporządkowania tabel w taki sposób, aby wynik można było szybko pobrać z bazy danych w środowisku hurtowni danych.
29) Co to jest schemat płatka śniegu?
Schemat płatka śniegu, który ma podstawową tabelę wymiarów, do której można dołączyć jeden lub więcej wymiarów. Tabela wymiarów podstawowych jest jedyną tabelą, którą można połączyć z tabelą faktów.
30) Co to jest podstawowy wymiar?
Wymiar podstawowy to nic innego jak tabela wymiarów, która jest używana jako dedykowana dla tabeli pojedynczych faktów lub hurtowni danych.
31) Co nazywa się czyszczeniem danych?
Nazwa sama w sobie sugeruje, że jest to termin samoobjaśniający. Czyszczenie rejestrów osieroconych, zasady biznesowe naruszające dane, niespójne dane i brakujące informacje w bazie danych.
32) Co to są metadane?
Metadane definiuje się jako dane o danych. Metadane zawierają informacje takie jak liczba używanych kolumn, stała i ograniczona szerokość, kolejność pól i typy danych pól.
33) Czym są pętle w hurtowni danych?
W hurtowni danych między tabelami istnieją pętle. Jeśli między tabelami występuje pętla, generowanie zapytania zajmie więcej czasu i spowoduje niejednoznaczność. Zaleca się unikać pętli pomiędzy tabelami.
34) Czy tabela wymiarów może mieć wartość liczbową?
Tak, tabela wymiarów może mieć wartość liczbową, gdyż są to elementy opisowe naszej działalności.
35) Jaka jest definicja kostki w hurtowni danych?
Kostki stanowią logiczną reprezentację danych wielowymiarowych. Krawędź sześcianu zawiera elementy wymiarowe, a korpus sześcianu zawiera wartości danych.
36) Co nazywa się modelowaniem wymiarowym?
Modelowanie wymiarowe to koncepcja, którą mogą wykorzystać projektanci hurtowni danych do zbudowania własnej hurtowni danych. Model ten można przechowywać w dwóch typach tabel – Faktów i Tabeli wymiarów.
Tabela faktów zawiera fakty i pomiary biznesowe, a tabela wymiarów zawiera kontekst pomiarów.
37) Jakie są rodzaje modelowania wymiarowego?
Poniżej znajdują się pliki Typy wymiarów w hurtowni danych:
- Zgodny wymiar
- Wymiar wysięgnika
- Skurczony wymiar
- Wymiar odgrywania ról
- Wymiar do tabeli wymiarów
- Śmieciowy wymiar
- zdegenerowany wymiar
- Wymienny wymiar
- Wymiar kroku
38) Co to jest klucz zastępczy?
Klucz zastępczy jest niczym innym jak substytutem naturalnego klucza podstawowego. Jest ustawiony jako unikalny identyfikator dla każdego wiersza, którego można użyć jako klucza podstawowego do tabeli.
39) Jaka jest różnica między modelowaniem ER a modelowaniem wymiarowym?
Modelowanie ER będzie miało model logiczny i fizyczny, ale modelowanie wymiarowe będzie miało tylko model fizyczny.
Modelowanie ER służy do normalizowania projektu bazy danych OLTP, natomiast modelowanie wymiarowe służy do denormalizowania projektu ROLAP i MOLAP.
40) Jakie są kroki w celu zbudowania hurtowni danych?
Poniżej przedstawiono kroki, które należy wykonać, aby zbudować magazyn danych:
- Zbieranie wymagań biznesowych
- Identyfikacja niezbędnych źródeł
- Identyfikacja faktów
- Definiowanie wymiarów
- Definiowanie atrybutów
- W razie potrzeby przedefiniuj wymiary i atrybuty
- Uporządkuj hierarchię atrybutów
- Zdefiniuj relacje
- Przypisz unikalne identyfikatory
41) Jakie są różne rodzaje przechowywania danych?
Poniżej przedstawiono różne typy hurtowni danych:
- Hurtownia danych w przedsiębiorstwie
- Operacyjny magazyn danych
- Magazyn danych
42) Co należy zrobić podczas uruchamiania bazy danych?
Aby uruchomić bazę danych, należy wykonać następujące czynności:
- Uruchom instancję
- Zamontuj bazę danych
- Otwórz bazę danych
43) Co należy zrobić w przypadku wyłączenia bazy danych?
Po zamknięciu bazy danych należy wykonać następujące czynności:
- Zamknij bazę danych
- Odmontuj bazę danych
- Zamknij instancję
44) Czy możemy wykonać kopię zapasową po otwarciu bazy danych?
Tak, możemy wykonać pełną kopię zapasową w momencie otwarcia bazy danych.
45) Co definiuje się jako częściową kopię zapasową?
Częściowa kopia zapasowa w pliku system operacyjny to kopia zapasowa inna niż pełna kopia zapasowa i można ją wykonać podczas otwierania lub zamykania bazy danych.
46) Jaki jest cel Optymalizatora?
Celem Optymalizatora jest znalezienie najbardziej efektywnego sposobu wykonania SQL sprawozdania.
47) Co to jest plan wykonania?
Plan wykonania to plan używany przez optymalizator do wyboru kombinacji kroków.
48) Jakie podejścia stosuje Optimizer podczas realizacji planu?
Istnieją dwa podejścia:
- Oparte na regułach
- Oparta na kosztach
49) Jakie narzędzia są dostępne dla ETL?
Poniżej znajdują się dostępne narzędzia ETL:
Informatyka
Etap danych
wyrocznia
Konstruktor Magazynu
Ab Initio
Złącze danych
50) Jaka jest różnica między metadanymi a słownikiem danych?
Metadane definiuje się jako dane o danych. Jednak słownik danych zawiera informacje o projekcie, wykresy, polecenia abinito i informacje o serwerze.
Te pytania podczas rozmowy kwalifikacyjnej pomogą również w Twoim życiu (ustach)
Dziękuję za informację :)
jak zainstalować oprogramowanie narzędzia datastage etl w moim systemie Windows 10
dzięki za dzielenie informacji
hii
pls
hurtownia danych wyjaśnia i wyjaśnia
Bardzo przydatne informacje.. Dzięki :)
Dzięki! bardzo pomocne.
Typy SCD nie są w prawidłowej kolejności.
Typ 0 – Stały wymiar
Żadne zmiany nie są dozwolone, wymiar nigdy się nie zmienia
Typ 1 – Brak historii
Aktualizuj rekord bezpośrednio, nie ma zapisu wartości historycznych, jedyny aktualny stan
Typ 2 – wersjonowanie wierszy
Śledź zmiany jako rekordy wersji z bieżącą flagą i aktywnymi datami oraz innymi metadanymi
Typ 3 – kolumna Poprzednia wartość
Śledź zmiany w konkretnym atrybucie, dodaj kolumnę, aby pokazać poprzednią wartość, która jest aktualizowana w miarę pojawiania się dalszych zmian
Typ 4 – Tabela historii
Pokaż bieżącą wartość w tabeli wymiarów, ale śledź wszystkie zmiany w osobnej tabeli
Typ 6 – hybrydowy SCD
Wykorzystaj techniki SCD typu 1, 2 i 3, aby śledzić zmiany
Dziękuję.. To jest pomocne
Przydatne przy powtórkach :)
Podziękowania
To bardzo pomocne. Dzielić się z ludźmi dobrymi rzeczami.
Potrzebuję pomocy, aby omówić to pytanie!
P: Zostałeś zatrudniony jako inżynier odpowiedzialny za przetwarzanie danych w wielkim sklepie. Jak wykorzystać zasadę skojarzeń eksploracji danych, aby zwiększyć sprzedaż w mega sklepie?
44. Czy możemy wykonać kopię zapasową po otwarciu bazy danych?
Tak, możemy wykonać pełną kopię zapasową w momencie otwarcia bazy danych. Nazywa się to gorącą kopią zapasową…
q 37 jest nieprawidłowe
Witam, dziękuję za podzielenie się przemyśleniami. Jest aktualizowany..
Bardzo dobrze, proszę pana.
Dziękujemy za dostarczenie cennych pytań i łatwych do zrozumienia odpowiedzi
Dziękuję, bardzo mi pomogło
To naprawdę miłe, dzięki. Bardzo mi pomaga.
Łatwe do zrozumienia, dziękuję
Dziękuję, pomogło mi.
Ogólnie bardzo przydatne informacje, dzięki