Die 50 wichtigsten Fragen und Antworten zum Data Warehouse-Interview

Hier finden Sie Fragen und Antworten zu Data Warehouse-Interviews für neue und erfahrene Kandidaten, die ihren Traumjob bekommen möchten.

1) Was ist Data Warehouse?

Data Warehousing (DW) ist das Repository von Daten und wird für Management-Entscheidungsunterstützungssysteme verwendet. Data Warehouse besteht aus einer Vielzahl von Daten, die zu einem bestimmten Zeitpunkt ein hohes Maß an Geschäftsbedingungen aufweisen.

Kurz gesagt: Es handelt sich um eine Sammlung integrierter Informationen, die für Abfragen und Analysen zur Verfügung stehen.


2) Was ist Business Intelligence?

Business Intelligence wird auch als DSS (Decision Support System) bezeichnet und bezieht sich auf Technologien, Anwendungen und Praktiken zur Erfassung, Integration und Analyse geschäftsbezogener Informationen oder Daten. Es hilft sogar, die Daten in den Informationen selbst zu sehen.

Kostenloser PDF-Download: Fragen und Antworten zum Data Warehouse-Interview


3) Was ist eine Dimensionstabelle?

Eine Dimensionstabelle ist eine Tabelle, die Attribute von Messungen enthält, die in Faktentabellen gespeichert sind. Diese Tabelle besteht aus Hierarchien, Kategorien und Logik, die zum Durchlaufen von Knoten verwendet werden können.


4) Was ist eine Faktentabelle?

Die Faktentabelle enthält die Messung von Geschäftsprozessen und Fremdschlüssel für die Dimensionstabellen.

Beispiel – Wenn der Geschäftsprozess die Herstellung von Ziegeln ist

Durchschnittliche Anzahl der von einer Person/Maschine produzierten Steine ​​– Maß für den Geschäftsprozess


5) Was sind die Phasen des Datawarehousing?

Es gibt vier Phasen des Datawarehousing:

Data Warehouse
Data Warehouse
  • Offline-Betriebsdatenbank
  • Offline-Data Warehouse
  • Echtzeit-Datawarehouse
  • Integriertes Datawarehouse

6) Was ist Data Mining?

Beim Data Mining handelt es sich um einen Prozess, bei dem Daten in verschiedenen Dimensionen oder Perspektiven analysiert und zu nützlichen Informationen zusammengefasst werden. Die Daten können in ihrem eigenen Format aus der Datenbank abgefragt und abgerufen werden.


7) Was ist OLTP?

OLTP wird als Online-Transaktionsverarbeitung abgekürzt und ist eine Anwendung, die die Daten bei jedem Empfang ändert und über eine große Anzahl gleichzeitiger Benutzer verfügt.

Fragen im Vorstellungsgespräch für Data Warehouse
Fragen im Vorstellungsgespräch für Data Warehouse

8) Was ist OLAP?

OLAP wird als Online Analytical Processing abgekürzt und ist ein System, das mehrdimensionale Daten für Analyse- und Verwaltungszwecke sammelt, verwaltet und verarbeitet.


9) Was ist der Unterschied zwischen OLTP und OLAP?

Im Folgenden sind die Unterschiede zwischen OLTP und OLAP aufgeführt:

OLTP OLAP
Die Daten stammen aus der Originaldatenquelle Die Daten stammen aus verschiedenen Datenquellen
Einfache Abfragen durch Benutzer Komplexe Abfragen nach System
Normalisierte kleine Datenbank Denormalisierte große Datenbank
Grundlegende Geschäftsaufgaben Mehrdimensionale Geschäftsaufgaben

10) Was ist ODS?

ODS wird als Operational Data Store abgekürzt und ist ein Repository für Echtzeit-Betriebsdaten und nicht für langfristige Trenddaten.


11) Was ist der Unterschied zwischen Ansicht und materialisierter Ansicht?

Eine Ansicht ist nichts anderes als eine virtuelle Tabelle, die die Ausgabe der Abfrage aufnimmt und anstelle von Tabellen verwendet werden kann.

Eine materialisierte Ansicht ist nichts anderes als ein indirekter Zugriff auf die Tabellendaten durch die Speicherung der Ergebnisse einer Abfrage in einem separaten Schema.


12) Was ist ETL?

ETL wird als Extract, Transform and Load abgekürzt. ETL ist eine Software, die zum Lesen der Daten aus der angegebenen Datenquelle und zum Extrahieren einer gewünschten Teilmenge von Daten verwendet wird. Als nächstes transformiert es die Daten mithilfe von Regeln und Nachschlagetabellen und konvertiert sie in einen gewünschten Zustand.

Anschließend wird die Ladefunktion verwendet, um die resultierenden Daten in die Zieldatenbank zu laden.


13) Was ist VLDB?

VLDB wird als „Very Large Database“ abgekürzt und ist auf eine Datenbankgröße von mehr als einem Terabyte festgelegt. Hierbei handelt es sich um Entscheidungsunterstützungssysteme, mit denen eine große Anzahl von Benutzern bedient wird.


14) Was ist Echtzeit-Datawarehousing?

Echtzeit-Datawarehousing erfasst die Geschäftsdaten, wann immer sie anfallen. Wenn eine Geschäftsaktivität abgeschlossen ist, stehen diese Daten im Fluss zur Verfügung und können sofort verwendet werden.


15) Was sind Aggregattabellen?

Aggregattabellen sind Tabellen, die die vorhandenen Lagerdaten enthalten, die nach bestimmten Dimensionsebenen gruppiert wurden. Es ist einfacher, Daten aus den aggregierten Tabellen abzurufen als aus der Originaltabelle, die mehr Datensätze enthält.

Diese Tabelle reduziert die Belastung des Datenbankservers und erhöht die Leistung der Abfrage.


16) Was sind faktenlose Faktentabellen?

Eine Faktentabelle ohne Fakten ist eine Faktentabelle, die keine numerische Faktenspalte in der Faktentabelle enthält.


17) Wie können wir die Zeitdimension laden?

Zeitdimensionen werden normalerweise über alle möglichen Daten in einem Jahr geladen und können über ein Programm durchgeführt werden. Hier können 100 Jahre mit einer Zeile pro Tag dargestellt werden.


18) Was sind nichtadditive Fakten?

Als nicht süchtig machende Fakten werden Fakten bezeichnet, die für keine der in der Faktentabelle vorhandenen Dimensionen zusammengefasst werden können. Wenn sich die Abmessungen ändern, können dieselben Fakten hilfreich sein.


19) Was ist eine konforme Tatsache?

Konformierte Fakten sind Tabellen, die in Kombination mit mehreren Faktentabellen in mehreren Data Marts verwendet werden können.


20) Was ist Datamart?

Ein Datamart ist eine spezielle Version von Datawarehousing und enthält eine Momentaufnahme der Betriebsdaten, die den Geschäftsleuten durch die Analyse vergangener Trends und Erfahrungen bei der Entscheidungsfindung hilft. Ein Data Mart trägt dazu bei, den Schwerpunkt auf den einfachen Zugriff auf relevante Informationen zu legen.


21) Was ist aktives Datawarehousing?

Ein aktives Datawarehouse ist ein Datawarehouse, das es Entscheidungsträgern innerhalb eines Unternehmens oder einer Organisation ermöglicht, Kundenbeziehungen effektiv und effizient zu verwalten.


22) Was ist der Unterschied zwischen Datawarehouse und OLAP?

Datawarehouse ist ein Ort, an dem die gesamten Daten zur Analyse gespeichert werden. OLAP wird jedoch zum Analysieren der Daten, zum Verwalten von Aggregationen und zur Aufteilung der Informationen in Informationen auf untergeordneter Ebene verwendet.


23) Was ist ein ER-Diagramm?

Das ER-Diagramm wird als Entity-Relationship-Diagramm abgekürzt und veranschaulicht die Wechselbeziehungen zwischen den Entitäten in der Datenbank. Dieses Diagramm zeigt die Struktur der einzelnen Tabellen und die Verknüpfungen zwischen den Tabellen.

ER-Diagramm

24) Was sind die Schlüsselspalten in Fakten- und Dimensionstabellen?

Fremdschlüssel von Dimensionstabellen sind Primärschlüssel von Entitätstabellen. Fremdschlüssel von Faktentabellen sind die Primärschlüssel der Dimensionstabellen.


25) Was ist SCD?

SCD ist definiert als sich langsam ändernde Dimensionen und gilt für Fälle, in denen sich Datensätze im Laufe der Zeit ändern.


26) Welche Arten von SCD gibt es?

Es gibt drei Arten von SCD und diese sind wie folgt:

SCD 1 – Der neue Datensatz ersetzt den ursprünglichen Datensatz

SCD 2 – Ein neuer Datensatz wird zur vorhandenen Kundendimensionstabelle hinzugefügt

SCD 3 – Originaldaten werden geändert, um neue Daten einzuschließen


27) Was ist ein BUS-Schema?

Das BUS-Schema besteht aus einer Reihe bestätigter Dimensionen und standardisierter Definitionen, sofern Faktentabellen vorhanden sind.


28) Was ist Star Schema?

Beim Star-Schema handelt es sich um nichts anderes als eine Art der Organisation der Tabellen, sodass Ergebnisse schnell aus der Datenbank in der Data-Warehouse-Umgebung abgerufen werden können.

Sternschema

29) Was ist das Snowflake-Schema?

Snowflake-Schema mit einer primären Dimensionstabelle, mit der eine oder mehrere Dimensionen verknüpft werden können. Die primäre Dimensionstabelle ist die einzige Tabelle, die mit der Faktentabelle verknüpft werden kann.

Schneeflockenschema

30) Was ist eine Kerndimension?

Die Kerndimension ist nichts anderes als eine Dimensionstabelle, die speziell für einzelne Faktentabellen oder Datamarts verwendet wird.


31) Was nennt man Datenbereinigung?

Der Name selbst impliziert, dass es sich um einen selbsterklärenden Begriff handelt. Bereinigung verwaister Datensätze, Verstoß gegen Geschäftsregeln, inkonsistente Daten und fehlende Informationen in einer Datenbank.


32) Was sind Metadaten?

Metadaten werden als Daten über die Daten definiert. Die Metadaten enthalten Informationen wie die Anzahl der verwendeten Spalten, die feste und begrenzte Breite, die Reihenfolge der Felder und die Datentypen der Felder.


33) Was sind Schleifen im Datawarehousing?

Beim Datawarehousing existieren Schleifen zwischen den Tabellen. Wenn es eine Schleife zwischen den Tabellen gibt, dauert die Abfragegenerierung länger und es entsteht Mehrdeutigkeit. Es wird empfohlen, Schleifen zwischen den Tabellen zu vermeiden.


34) Kann die Dimensionstabelle einen numerischen Wert haben?

Ja, Dimensionstabellen können einen numerischen Wert haben, da sie die beschreibenden Elemente unseres Geschäfts darstellen.


35) Was ist die Definition von Cube im Datawarehousing?

Würfel sind eine logische Darstellung mehrdimensionaler Daten. Die Kante des Würfels enthält die Dimensionselemente und der Körper des Würfels enthält die Datenwerte.


36) Was nennt man dimensionale Modellierung?

Dimensional Modeling ist ein Konzept, das von Dataware-Hausdesignern zum Aufbau ihres eigenen Datawarehouses verwendet werden kann. Dieses Modell kann in zwei Arten von Tabellen gespeichert werden – Fakten- und Dimensionstabelle.

Die Faktentabelle enthält Fakten und Messungen des Unternehmens, und die Dimensionstabelle enthält den Kontext der Messungen.


37) Welche Arten der dimensionalen Modellierung gibt es?

Es folgen die Arten von Dimensionen im Data Warehouse:

  • Angepasste Dimension
  • Auslegerabmessung
  • Geschrumpfte Dimension
  • Rollenspiel-Dimension
  • Dimension-zu-Dimension-Tabelle
  • Junk-Dimension
  • Entartete Dimension
  • Austauschbare Dimension
  • Schrittmaß

38) Was ist ein Ersatzschlüssel?

Der Ersatzschlüssel ist nichts anderes als ein Ersatz für den natürlichen Primärschlüssel. Es wird als eindeutiger Bezeichner für jede Zeile festgelegt, der als Primärschlüssel für eine Tabelle verwendet werden kann.


39) Was ist der Unterschied zwischen ER-Modellierung und dimensionaler Modellierung?

Die ER-Modellierung verfügt über ein logisches und ein physikalisches Modell, die dimensionale Modellierung verfügt jedoch nur über ein physikalisches Modell.

ER-Modellierung wird zur Normalisierung des OLTP-Datenbankdesigns verwendet, während dimensionale Modellierung zur Denormalisierung des ROLAP- und MOLAP-Designs verwendet wird.


40) Was sind die Schritte zum Aufbau des Datawarehouses?

Im Folgenden sind die Schritte aufgeführt, die zum Aufbau des Datenspeichers befolgt werden müssen:

  • Erfassen von Geschäftsanforderungen
  • Identifizieren der notwendigen Quellen
  • Ermittlung der Fakten
  • Definieren der Dimensionen
  • Definieren der Attribute
  • Definieren Sie die Dimensionen und Attribute bei Bedarf neu
  • Organisieren Sie die Attributhierarchie
  • Beziehungen definieren
  • Weisen Sie eindeutige Kennungen zu

41) Welche verschiedenen Arten von Dataware-Housing gibt es?

Im Folgenden sind die verschiedenen Arten von Datawarehousing aufgeführt:

  • Enterprise Datawarehousing
  • Betriebsdatenspeicher
  • Datenmarkt

42) Was muss beim Starten der Datenbank getan werden?

Zum Starten der Datenbank müssen folgende Schritte durchgeführt werden:

  1. Starten Sie eine Instanz
  2. Mounten Sie die Datenbank
  3. Öffnen Sie die Datenbank

43) Was ist zu tun, wenn die Datenbank heruntergefahren wird?

Beim Herunterfahren der Datenbank muss Folgendes durchgeführt werden:

  1. Schließen Sie die Datenbank
  2. Demontieren Sie die Datenbank
  3. Fahren Sie die Instanz herunter

44) Können wir ein Backup erstellen, wenn die Datenbank geöffnet wird?

Ja, wir können eine vollständige Sicherung erstellen, wenn die Datenbank geöffnet wird.


45) Was ist als Teilsicherung definiert?

Eine Teilsicherung in einem Betriebssystem handelt es sich um eine Sicherung, bei der es sich nicht um eine vollständige Sicherung handelt, und sie kann durchgeführt werden, während die Datenbank geöffnet oder heruntergefahren ist.


46) Was ist das Ziel von Optimizer?

Das Ziel von Optimizer besteht darin, den effizientesten Weg zur Ausführung zu finden SQL Aussagen.


47) Was ist ein Ausführungsplan?

Der Ausführungsplan ist ein Plan, mit dem der Optimierer die Kombination der Schritte auswählt.


48) Welche Ansätze verwendet Optimizer während der Ausführungsplanung?

Es gibt zwei Ansätze:

  1. Regelbasiert
  2. Kostenbasiert

49) Welche Tools stehen für ETL zur Verfügung?

Im Folgenden sind die verfügbaren ETL-Tools aufgeführt:

Informatik
Datenphase
Oracle
Lagerbauer
Ab Initio
Datenverbindung


50) Was ist der Unterschied zwischen Metadaten und Datenwörterbuch?

Metadaten werden als Daten über die Daten definiert. Das Datenwörterbuch enthält jedoch Informationen zu Projektinformationen, Diagrammen, Abinito-Befehlen und Serverinformationen.

Diese Interviewfragen helfen auch bei Ihrer mündlichen Prüfung

Teilen

21 Kommentare

  1. Avatar Meydan Schwartz sagt:

    Danke für die Information :)

    1. Wie installiere ich die Datastage-ETL-Tool-Software in meinem Windows 10?

  2. Avatar Shiv Gautam sagt:

    Dank für die gemeinsame Nutzung der Informationen

    1. Avatar Sai Srinivas sagt:

      hii
      pls
      Data Ware House erklären und thoery

  3. Avatar Ekta Soni sagt:

    Sehr nützliche Informationen. Danke :)

  4. Avatar Grahi Parmar sagt:

    SCD-Typen sind nicht in der richtigen Reihenfolge.
    Typ 0 – Feste Bemaßung
    Keine Änderungen erlaubt, die Dimension ändert sich nie
    Typ 1 – Keine Historie
    Datensatz direkt aktualisieren, es gibt keinen Datensatz mit historischen Werten, sondern nur den aktuellen Status
    Typ 2 – Zeilenversionierung
    Verfolgen Sie Änderungen als Versionsdatensätze mit aktuellem Flag, aktiven Daten und anderen Metadaten
    Typ 3 – Spalte „Vorheriger Wert“.
    Verfolgen Sie Änderungen an einem bestimmten Attribut und fügen Sie eine Spalte hinzu, um den vorherigen Wert anzuzeigen, der bei weiteren Änderungen aktualisiert wird
    Typ 4 – Verlaufstabelle
    Zeigen Sie den aktuellen Wert in der Dimensionstabelle an, verfolgen Sie jedoch alle Änderungen in einer separaten Tabelle
    Typ 6 – Hybrid-SCD
    Nutzen Sie Techniken der SCD-Typen 1, 2 und 3, um Veränderungen zu verfolgen

    1. Avatar Srividya Krishnamoorthy sagt:

      Danke. Das ist hilfreich

  5. Es ist sehr hilfreich, den Menschen gute Dinge mitzuteilen.

  6. Avatar Muhammad Abukar sagt:

    Ich brauche Hilfe, um diese Frage zu diskutieren!
    F: Sie werden von einem Mega-Store als Dataware-House-Ingenieur eingestellt. Wie können Sie die Assoziationsregel des Data Mining nutzen, um den Verkauf des Mega-Stores zu steigern?

  7. Avatar Dr. Darko Petrusic sagt:

    44. Können wir beim Öffnen der Datenbank ein Backup erstellen?

    Ja, wir können eine vollständige Sicherung erstellen, wenn die Datenbank geöffnet wird. Man nennt es Hot-Backup …

    1. Alex Silbermann Alex Silbermann sagt:

      Hallo, danke, dass du deine Gedanken geteilt hast. Es ist aktualisiert..

  8. Sehr gut, Herr.
    Vielen Dank für die Bereitstellung wertvoller Fragen und leicht verständlicher Antworten

  9. Es ist wirklich schön, danke. Es hilft mir sehr.

  10. Avatar Asrar Alam sagt:

    Insgesamt sehr nützliche Informationen, Danke

Hinterlassen Sie uns einen Kommentar

E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind MIT * gekennzeichnet. *