Le migliori 50 domande e risposte per l'intervista sul data warehouse
Ecco le domande e le risposte al colloquio di Data Warehouse per i candidati più freschi ed esperti che vogliono ottenere il lavoro dei loro sogni.
1) Cos'è il Data Warehouse?
Il data warehousing (DW) è il repository di dati e viene utilizzato per il sistema di supporto alle decisioni gestionali. Il data warehouse è costituito da un'ampia varietà di dati con un elevato livello di condizioni aziendali in un unico momento.
In una sola frase, è un archivio di informazioni integrate che possono essere disponibili per query e analisi.
2) Cos'è Intelligenza aziendale?
La Business Intelligence è anche conosciuta come DSS – Sistema di supporto alle decisioni che si riferisce alle tecnologie, applicazioni e pratiche per la raccolta, l'integrazione e l'analisi delle informazioni o dei dati relativi al business. Anche, aiuta a vedere i dati sulle informazioni stesse.
Download gratuito del PDF: domande e risposte sull'intervista sul data warehouse
3) Cos'è la tabella dimensionale?
La tabella delle dimensioni è una tabella che contiene gli attributi delle misurazioni archiviate nelle tabelle dei fatti. Questa tabella è composta da gerarchie, categorie e logica che possono essere utilizzate per attraversare i nodi.
4) Cos'è la tabella dei fatti?
La tabella dei fatti contiene la misurazione dei processi aziendali e contiene chiavi esterne per le tabelle delle dimensioni.
Esempio: se il processo aziendale è la produzione di mattoni
Numero medio di mattoni prodotti da una persona/macchina – misura del processo aziendale
5) Quali sono le fasi del Datawarehousing?
Esistono quattro fasi del Datawarehousing:
- Database operativo offline
- Data Warehouse offline
- Datawarehouse in tempo reale
- Datawarehouse integrato
6) Cos'è il Data Mining?
Il Data Mining è destinato a essere un processo di analisi dei dati in diverse dimensioni o prospettive e di sintesi in informazioni utili. È possibile eseguire query e recuperare i dati dal database nel proprio formato.
7) Cos'è l'OLTP?
OLTP è abbreviato come On-Line Transaction Processing ed è un'applicazione che modifica i dati ogni volta che li riceve e ha un gran numero di utenti simultanei.
8) Cos'è l'OLAP?
OLAP è abbreviato in Online Analytical Processing ed è destinato ad essere un sistema che raccoglie, gestisce ed elabora dati multidimensionali per scopi di analisi e gestione.
9) Qual è la differenza tra OLTP e OLAP?
Di seguito sono riportate le differenze tra OLTP e OLAP:
OLTP | OLAP |
---|---|
I dati provengono dall'origine dati originale | I dati provengono da varie origini dati |
Query semplici da parte degli utenti | Query complesse per sistema |
Piccolo database normalizzato | Database di grandi dimensioni denormalizzato |
Compiti aziendali fondamentali | Compiti aziendali multidimensionali |
10) Cos'è l'ODS?
ODS è abbreviato in Operational Data Store ed è un archivio di dati operativi in tempo reale anziché di dati di tendenza a lungo termine.
11) Qual è la differenza tra Vista e Vista materializzata?
Una vista non è altro che una tabella virtuale che prende l'output della query e può essere utilizzata al posto delle tabelle.
Una vista materializzata non è altro che un accesso indiretto ai dati della tabella memorizzando i risultati di una query in uno schema separato.
12) Cos'è l'ETL?
ETL è abbreviato come Estrai, Trasforma e Carica. ETL è un software che viene utilizzato per leggere i dati dall'origine dati specificata ed estrae il sottoinsieme di dati desiderato. Successivamente, trasforma i dati utilizzando regole e tabelle di ricerca e li converte nello stato desiderato.
Quindi, la funzione di caricamento viene utilizzata per caricare i dati risultanti nel database di destinazione.
13) Cos'è il VLDB?
VLDB è abbreviato come Very Large Database e la sua dimensione è impostata per essere superiore a un database da terabyte. Si tratta di sistemi di supporto decisionale utilizzati per servire un gran numero di utenti.
14) Cos'è il datawarehousing in tempo reale?
Il datawarehousing in tempo reale cattura i dati aziendali ogni volta che si verificano. Una volta completata l'attività aziendale, i dati saranno disponibili nel flusso e saranno immediatamente disponibili per l'uso.
15) Cosa sono le tabelle aggregate?
Le tabelle aggregate sono le tabelle che contengono i dati del magazzino esistente che sono stati raggruppati in un determinato livello di dimensioni. È facile recuperare i dati dalle tabelle aggregate rispetto alla tabella originale che ha un numero maggiore di record.
Questa tabella riduce il carico nel server di database e aumenta le prestazioni della query.
16) Cosa sono le tabelle dei fatti prive di fatti?
Una tabella dei fatti priva di fatti è la tabella dei fatti che non contiene colonne di fatti numerici nella tabella dei fatti.
17) Come possiamo caricare la dimensione temporale?
Le dimensioni temporali vengono solitamente caricate attraverso tutte le date possibili in un anno e ciò può essere fatto tramite un programma. Qui 100 anni possono essere rappresentati con una riga al giorno.
18) Cosa sono i fatti non additivi?
Si dice che i fatti che non creano dipendenza sono fatti che non possono essere riassunti per nessuna delle dimensioni presenti nella tabella dei fatti. Se ci sono cambiamenti nelle dimensioni, gli stessi fatti possono essere utili.
19) Cos'è il fatto conforme?
Il fatto conforme è una tabella che può essere utilizzata su più data mart in combinazione con più tabelle dei fatti.
20) Cos'è Datamart?
Un Datamart è una versione specializzata di Datawarehousing e contiene un'istantanea dei dati operativi che aiuta gli uomini d'affari a decidere con l'analisi delle tendenze e delle esperienze passate. Un data mart aiuta a sottolineare il facile accesso alle informazioni rilevanti.
21) Cos'è il Datawarehousing Attivo?
Un datawarehouse attivo è un datawarehouse che consente ai decisori all'interno di un'azienda o organizzazione di gestire le relazioni con i clienti in modo efficace ed efficiente.
22) Qual è la differenza tra Datawarehouse e OLAP?
Il datawarehouse è un luogo in cui tutti i dati vengono archiviati per l'analisi, ma OLAP viene utilizzato per analizzare i dati, gestire le aggregazioni e suddividere le informazioni in informazioni di livello minore.
23) Cos'è il diagramma ER?
Il diagramma ER è abbreviato come diagramma Entità-Relazione che illustra le interrelazioni tra le entità nel database. Questo diagramma mostra la struttura di ciascuna tabella e i collegamenti tra le tabelle.
24) Quali sono le colonne chiave nelle tabelle dei fatti e delle dimensioni?
Le chiavi esterne delle tabelle dimensionali sono chiavi primarie delle tabelle entità. Le chiavi esterne delle tabelle dei fatti sono le chiavi primarie delle tabelle delle dimensioni.
25) Cos'è la SCD?
La SCD è definita come dimensioni che cambiano lentamente e si applica ai casi in cui i record cambiano nel tempo.
26) Quali sono i tipi di MCI?
Esistono tre tipi di SCD e sono i seguenti:
SCD 1 – Il nuovo record sostituisce il record originale
SCD 2: un nuovo record viene aggiunto alla tabella delle dimensioni del cliente esistente
SCD 3 – Un dato originale viene modificato per includere nuovi dati
27) Cos'è lo schema BUS?
Lo schema BUS è costituito da una serie di dimensioni confermate e da una definizione standardizzata se sono presenti tabelle dei fatti.
28) Cos'è lo schema stellare?
Lo schema a stella non è altro che un tipo di organizzazione delle tabelle in modo tale che il risultato possa essere recuperato rapidamente dal database nell'ambiente del data warehouse.
29) Cos'è lo schema Snowflake?
Schema fiocco di neve che ha una tabella delle dimensioni primaria a cui è possibile unire una o più dimensioni. La tabella delle dimensioni primarie è l'unica tabella che può essere unita alla tabella dei fatti.
30) Cos'è una dimensione fondamentale?
La dimensione principale non è altro che una tabella delle dimensioni utilizzata come dedicata per una tabella dei fatti singola o un datamart.
31) Cosa si chiama pulizia dei dati?
Il nome stesso implica che si tratta di un termine autoesplicativo. Pulizia di record orfani, violazione delle regole aziendali, dati incoerenti e informazioni mancanti in un database.
32) Cosa sono i metadati?
I metadati sono definiti come dati sui dati. I metadati contengono informazioni come numero di colonne utilizzate, larghezza fissa e larghezza limitata, ordinamento dei campi e tipi di dati dei campi.
33) Cosa sono i loop nel Datawarehousing?
Nel datawarehousing esistono dei loop tra le tabelle. Se c'è un ciclo tra le tabelle, la generazione della query richiederà più tempo e creerà ambiguità. Si consiglia di evitare loop tra i tavoli.
34) Se la tabella delle dimensioni può avere un valore numerico?
Sì, le tabelle delle dimensioni possono avere valore numerico in quanto sono gli elementi descrittivi della nostra attività.
35) Qual è la definizione di Cubo nel Datawarehousing?
I cubi sono una rappresentazione logica di dati multidimensionali. Il bordo del cubo contiene i membri della dimensione e il corpo del cubo contiene i valori dei dati.
36) Cos'è la cosiddetta Modellazione Dimensionale?
La modellazione dimensionale è un concetto che può essere utilizzato dai progettisti di dataware house per costruire il proprio datawarehouse. Questo modello può essere memorizzato in due tipi di tabelle: Fatti e Tabella delle dimensioni.
La tabella dei fatti contiene fatti e misurazioni dell'azienda, mentre la tabella delle dimensioni contiene il contesto delle misurazioni.
37) Quali sono le tipologie di Modellazione Dimensionale?
Di seguito sono riportati i Tipi di dimensioni nel data warehouse:
- Dimensione conforme
- Dimensione del bilanciere
- Dimensione rimpicciolita
- Dimensione del gioco di ruolo
- Da dimensione a tabella delle dimensioni
- Dimensione spazzatura
- Dimensione degenerata
- Dimensione scambiabile
- Dimensione del passo
38) Cos'è la chiave surrogata?
La chiave surrogata non è altro che un sostituto della chiave primaria naturale. È impostato per essere un identificatore univoco per ogni riga che può essere utilizzato per la chiave primaria di una tabella.
39) Qual è la differenza tra Modellazione ER e Modellazione Dimensionale?
La modellazione ER avrà un modello logico e fisico, ma la modellazione dimensionale avrà solo un modello fisico.
La modellazione ER viene utilizzata per normalizzare la progettazione del database OLTP mentre la modellazione dimensionale viene utilizzata per denormalizzare la progettazione ROLAP e MOLAP.
40) Quali sono i passaggi per costruire il datawarehouse?
Di seguito sono riportati i passaggi da seguire per costruire il datawaerhouse:
- Raccolta dei requisiti aziendali
- Individuazione delle fonti necessarie
- Identificare i fatti
- Definizione delle dimensioni
- Definizione degli attributi
- Ridefinire le dimensioni e gli attributi, se necessario
- Organizza la gerarchia degli attributi
- Definisci le relazioni
- Assegna identificatori univoci
41) Quali sono le diverse tipologie di datawarehousing?
Di seguito sono elencate le diverse tipologie di Datawarehousing:
- Datawarehouse aziendale
- Archivio dati operativo
- DataMart
42) Cosa è necessario fare durante l'avvio del database?
Per avviare il database è necessario eseguire le seguenti operazioni:
- Avvia un'istanza
- Montare il database
- Apri il database
43) Cosa è necessario fare quando il database viene chiuso?
È necessario eseguire quanto segue quando il database viene arrestato:
- Chiudere il database
- Smontare il database
- Arresta l'istanza
44) Possiamo fare il backup quando il database viene aperto?
Sì, possiamo eseguire il backup completo all'apertura del database.
45) Cosa si intende per Backup Parziale?
Un backup parziale in un file sistema operativo è un backup breve rispetto al backup completo e può essere eseguito mentre il database è aperto o spento.
46) Qual è l'obiettivo di Optimizer?
L'obiettivo di Optimizer è trovare il modo più efficiente per eseguire il file SQL dichiarazioni.
47) Cos'è il piano di esecuzione?
Il piano di esecuzione è un piano utilizzato dall'ottimizzatore per selezionare la combinazione dei passaggi.
48) Quali sono gli approcci utilizzati da Optimizer durante il piano di esecuzione?
Ci sono due approcci:
- Basato su regole
- Basato sui costi
49) Quali sono gli strumenti disponibili per ETL?
Di seguito sono riportati gli strumenti ETL disponibili:
Informatica
Fase dati
Oracle
Costruttore di magazzini
Dall'inizio
Giunzione dati
50) Qual è la differenza tra metadati e dizionario dei dati?
I metadati sono definiti come dati sui dati. Tuttavia, il dizionario dati contiene le informazioni sulle informazioni del progetto, i grafici, i comandi abinito e le informazioni sul server.
Queste domande del colloquio ti aiuteranno anche nel tuo viva(orale)
grazie per l'informazione :)
come installare il software dello strumento datastage etl nel mio Windows 10
grazie per aver condiviso le informazioni
hii
pls
data ware house spiega e teoria
Informazioni molto utili.. Grazie :)
Grazie! molto utile.
I tipi SCD non sono nella sequenza corretta.
Tipo 0 – Dimensione fissa
Non sono consentite modifiche, le dimensioni non cambiano mai
Tipo 1 – Nessuna cronologia
Aggiorna direttamente il record, non è presente alcun record di valori storici, l'unico stato attuale
Tipo 2: controllo delle versioni delle righe
Tieni traccia delle modifiche come record di versione con flag corrente, date attive e altri metadati
Tipo 3: colonna Valore precedente
Tieni traccia delle modifiche a un attributo specifico, aggiungi una colonna per mostrare il valore precedente, che viene aggiornato man mano che si verificano ulteriori modifiche
Tipo 4 – Tabella storica
Mostra il valore corrente nella tabella delle dimensioni ma monitora tutte le modifiche in una tabella separata
Tipo 6 – SCD ibrido
Utilizzare le tecniche dei tipi SCD 1, 2 e 3 per tenere traccia del cambiamento
Grazie... Questo è utile
Utile per la revisione :)
Grazie
È molto utile. Per condividere cose buone con le persone.
Ho bisogno di aiuto per discutere questa domanda!
D: Sei stato assunto come ingegnere interno del dataware da un mega negozio. Come è possibile utilizzare la regola associativa del data mining per aumentare le vendite del megastore?
44. Possiamo eseguire il backup quando il database viene aperto?
Sì, possiamo eseguire il backup completo all'apertura del database. Si chiama backup a caldo…
q 37 non è corretto
Ciao, grazie per aver condiviso i tuoi pensieri. E' aggiornato..
Molto bene, signore.
Grazie per aver fornito domande preziose e risposte di facile comprensione
Grazie, mi ha aiutato molto
E' davvero carino, grazie. Mi aiuta molto.
Facile da capire grazie
Grazie, mi ha aiutato.
Nel complesso informazioni molto utili, grazie