Top 50 des questions et réponses sur les entretiens avec Data Warehouse

Voici les questions et réponses d'entretien avec Data Warehouse pour les candidats les plus récents et les plus expérimentés pour obtenir l'emploi de leurs rêves.

1) Qu’est-ce que l’entrepôt de données ?

L'entreposage de données (DW) est le référentiel de données et il est utilisé pour le système d'aide à la décision de gestion. L’entrepôt de données se compose d’une grande variété de données présentant un niveau élevé de conditions commerciales à un moment donné.

En une seule phrase, il s'agit d'un référentiel d'informations intégrées qui peuvent être disponibles pour des requêtes et des analyses.


2) Qu'est-ce que L'intelligence d'entreprise?

La Business Intelligence est également connue sous le nom de DSS – Système d'aide à la décision qui fait référence aux technologies, applications et pratiques de collecte, d'intégration et d'analyse des informations ou données liées à l'entreprise. Cela aide même à voir les données sur les informations elles-mêmes.

Téléchargement gratuit du PDF : Questions et réponses sur l'entretien avec l'entrepôt de données


3) Qu'est-ce que le tableau des dimensions ?

La table de dimension est une table qui contient les attributs des mesures stockées dans des tables de faits. Ce tableau se compose de hiérarchies, de catégories et de logiques qui peuvent être utilisées pour parcourir les nœuds.


4) Qu'est-ce que la table de faits ?

La table de faits contient la mesure des processus métier et contient des clés étrangères pour les tables de dimensions.

Exemple – Si le processus métier consiste à fabriquer des briques

Nombre moyen de briques produites par une personne/machine – mesure du processus métier


5) Quelles sont les étapes du Datawarehousing ?

Il y a quatre étapes de Datawarehousing :

Entrepôt de données
Entrepôt de données
  • Base de données opérationnelle hors ligne
  • Entrepôt de données hors ligne
  • Entrepôt de données en temps réel
  • Entrepôt de données intégré

6) Qu’est-ce que l’exploration de données ?

L'exploration de données est définie comme un processus d'analyse des données dans différentes dimensions ou perspectives et de les résumer en informations utiles. Peut être interrogé et récupéré les données de la base de données dans leur propre format.


7) Qu'est-ce qu'OLTP ?

OLTP est abrégé en tant que traitement des transactions en ligne. Il s'agit d'une application qui modifie les données chaque fois qu'elles sont reçues et compte un grand nombre d'utilisateurs simultanés.

Questions d'entretien d'entrepôt de données
Questions d'entretien d'entrepôt de données

8) Qu'est-ce qu'OLAP ?

OLAP est abrégé en Online Analytical Processing et est défini comme un système qui collecte, gère et traite des données multidimensionnelles à des fins d'analyse et de gestion.


9) Quelle est la différence entre OLTP et OLAP ?

Voici les différences entre OLTP et OLAP :

OLTP OLAP
Les données proviennent de la source de données d'origine Les données proviennent de diverses sources de données
Requêtes simples des utilisateurs Requêtes complexes par système
Petite base de données normalisée Grande base de données dénormalisée
Tâches commerciales fondamentales Tâches commerciales multidimensionnelles

10) Qu’est-ce que l’ODS ?

ODS est abrégé en Operational Data Store et il s'agit d'un référentiel de données opérationnelles en temps réel plutôt que de données de tendances à long terme.


11) Quelle est la différence entre la vue et la vue matérialisée ?

Une vue n’est rien d’autre qu’une table virtuelle qui prend le résultat de la requête et peut être utilisée à la place des tables.

Une vue matérialisée n'est rien d'autre qu'un accès indirect aux données de la table en stockant les résultats d'une requête dans un schéma distinct.


12) Qu'est-ce qu'ETL ?

ETL est abrégé en Extraire, Transformer et Charger. ETL est un logiciel utilisé pour lire les données de la source de données spécifiée et extraire un sous-ensemble de données souhaité. Ensuite, il transforme les données à l'aide de règles et de tables de recherche et les convertit dans l'état souhaité.

Ensuite, la fonction de chargement est utilisée pour charger les données résultantes dans la base de données cible.


13) Qu'est-ce que VLDB ?

VLDB est abrégé en Very Large Database et sa taille est définie sur plus d’un téraoctet de base de données. Il s’agit de systèmes d’aide à la décision utilisés pour gérer un grand nombre d’utilisateurs.


14) Qu'est-ce que l'entreposage de données en temps réel ?

L'entreposage de données en temps réel capture les données commerciales à chaque fois qu'elles se produisent. Lorsqu'une activité commerciale est terminée, ces données seront disponibles dans le flux et pourront être utilisées instantanément.


15) Que sont les tableaux agrégés ?

Les tables agrégées sont les tables qui contiennent les données d'entrepôt existantes qui ont été regroupées à un certain niveau de dimensions. Il est facile de récupérer des données à partir des tables agrégées que la table d'origine qui a plus de nombre d'enregistrements.

Cette table réduit la charge du serveur de base de données et augmente les performances de la requête.


16) Qu'est-ce qu'une table de faits sans faits ?

Une table de faits sans faits est la table de faits qui ne contient pas de colonne de faits numériques dans la table de faits.


17) Comment peut-on charger la dimension temporelle ?

Les dimensions temporelles sont généralement chargées à toutes les dates possibles d'une année et cela peut être fait via un programme. Ici, 100 ans peuvent être représentés avec une ligne par jour.


18) Que sont les faits non additifs ?

Les faits non addictifs sont des faits qui ne peuvent être résumés pour aucune des dimensions présentes dans le tableau de faits. S'il y a des changements dans les dimensions, les mêmes faits peuvent être utiles.


19) Qu'est-ce qu'un fait conforme ?

Un fait conforme est une table qui peut être utilisée dans plusieurs magasins de données en combinaison avec plusieurs tables de faits.


20) Qu’est-ce que Datamart ?

Un Datamart est une version spécialisée de Datawarehousing et contient un instantané de données opérationnelles qui aide les hommes d'affaires à prendre des décisions grâce à l'analyse des tendances et des expériences passées. Un datamart permet de mettre l’accent sur un accès facile aux informations pertinentes.


21) Qu'est-ce que l'Entrepôt de Données Actif ?

Un entrepôt de données actif est un entrepôt de données qui permet aux décideurs au sein d'une entreprise ou d'une organisation de gérer les relations clients de manière efficace et efficiente.


22) Quelle est la différence entre Datawarehouse et OLAP ?

L'entrepôt de données est un endroit où toutes les données sont stockées pour être analysées, mais OLAP est utilisé pour analyser les données, gérer les agrégations et diviser les informations en informations de niveau mineur.


23) Qu'est-ce que le diagramme ER ?

Le diagramme ER est abrégé en diagramme Entité-Relation qui illustre les interrelations entre les entités de la base de données. Ce diagramme montre la structure de chaque table et les liens entre les tables.

Diagramme ER

24) Quelles sont les colonnes clés des tables de faits et de dimension ?

Les clés étrangères des tables de dimensions sont les clés primaires des tables d'entités. Les clés étrangères des tables de faits sont les clés primaires des tables de dimensions.


25) Qu’est-ce que le SCD ?

SCD est défini comme des dimensions qui changent lentement et s'applique aux cas où l'enregistrement change au fil du temps.


26) Quels sont les types de SCD ?

Il existe trois types de SCD et ils sont les suivants :

SCD 1 – Le nouvel enregistrement remplace l'enregistrement original

SCD 2 – Un nouvel enregistrement est ajouté à la table de dimension client existante

SCD 3 – Une donnée originale est modifiée pour inclure de nouvelles données


27) Qu'est-ce que le schéma BUS ?

Le schéma BUS se compose d'une suite de dimensions confirmées et d'une définition standardisée s'il existe des tableaux de faits.


28) Qu'est-ce qu'un schéma en étoile ?

Le schéma en étoile n'est rien d'autre qu'un type d'organisation des tables de telle manière que le résultat puisse être récupéré rapidement de la base de données dans l'environnement de l'entrepôt de données.

Schéma en étoile

29) Qu'est-ce que le schéma flocon de neige ?

Schéma Snowflake qui possède une table de dimensions principale à laquelle une ou plusieurs dimensions peuvent être jointes. La table de dimensions principale est la seule table qui peut être jointe à la table de faits.

Schéma de flocon de neige

30) Qu’est-ce qu’une dimension essentielle ?

La dimension principale n'est rien d'autre qu'une table de dimension qui est utilisée comme dédiée à une table de faits unique ou à un datamart.


31) Qu'appelle-t-on le nettoyage des données ?

Le nom lui-même implique qu'il s'agit d'un terme explicite. Nettoyage des enregistrements orphelins, violation des règles commerciales, données incohérentes et informations manquantes dans une base de données.


32) Que sont les métadonnées ?

Les métadonnées sont définies comme des données sur les données. Les métadonnées contiennent des informations telles que le nombre de colonnes utilisées, la largeur fixe et la largeur limitée, l'ordre des champs et les types de données des champs.


33) Que sont les boucles dans le Datawarehousing ?

Dans le datawarehousing, des boucles existent entre les tables. S'il y a une boucle entre les tables, la génération de la requête prendra plus de temps et créera une ambiguïté. Il est conseillé d'éviter les boucles entre les tables.


34) La table de dimensions peut-elle avoir une valeur numérique ?

Oui, le tableau des dimensions peut avoir une valeur numérique car ce sont les éléments descriptifs de notre activité.


35) Quelle est la définition de Cube dans le Datawarehousing ?

Les cubes sont une représentation logique de données multidimensionnelles. Le bord du cube contient les membres de la dimension et le corps du cube contient les valeurs des données.


36) Qu’appelle-t-on modélisation dimensionnelle ?

La modélisation dimensionnelle est un concept qui peut être utilisé par les concepteurs d'entrepôts de données pour créer leur propre entrepôt de données. Ce modèle peut être stocké dans deux types de tableaux : le tableau de faits et le tableau de dimensions.

La table de faits contient des faits et des mesures de l'entreprise et la table de dimensions contient le contexte des mesures.


37) Quels sont les types de modélisation dimensionnelle ?

Voici les Types de dimensions dans l'entrepôt de données:

  • Dimension conforme
  • Dimension du stabilisateur
  • Dimension réduite
  • Dimension du jeu de rôle
  • Tableau des dimensions vers les dimensions
  • Dimension indésirable
  • Dimension dégénérée
  • Dimension échangeable
  • Dimension de l'étape

38) Qu'est-ce qu'une clé de substitution ?

La clé de substitution n'est rien d'autre qu'un substitut à la clé primaire naturelle. Il est défini comme un identifiant unique pour chaque ligne pouvant être utilisée pour la clé primaire d'une table.


39) Quelle est la différence entre la modélisation ER et la modélisation dimensionnelle ?

La modélisation ER aura un modèle logique et physique, mais la modélisation dimensionnelle n'aura qu'un modèle physique.

La modélisation ER est utilisée pour normaliser la conception de la base de données OLTP, tandis que la modélisation dimensionnelle est utilisée pour dénormaliser la conception ROLAP et MOLAP.


40) Quelles sont les étapes pour construire le datawarehouse ?

Voici les étapes à suivre pour construire la datawarehouse :

  • Recueil des besoins métiers
  • Identifier les sources nécessaires
  • Identifier les faits
  • Définir les dimensions
  • Définir les attributs
  • Redéfinissez les dimensions et les attributs si nécessaire
  • Organiser la hiérarchie des attributs
  • Définir les relations
  • Attribuer des identifiants uniques

41) Quels sont les différents types d'hébergement de données ?

Voici les différents types de Datawarehousing :

  • Entreposage de données d'entreprise
  • Magasin de données opérationnelles
  • Data Mart

42) Que faut-il faire lors du démarrage de la base de données ?

Ce qui suit doit être fait pour démarrer la base de données :

  1. Démarrer une instance
  2. Monter la base de données
  3. Ouvrir la base de données

43) Que faut-il faire lorsque la base de données est arrêtée ?

Les opérations suivantes doivent être effectuées lorsque la base de données est arrêtée :

  1. Fermer la base de données
  2. Démonter la base de données
  3. Arrêter l'instance

44) Pouvons-nous effectuer une sauvegarde lorsque la base de données est ouverte ?

Oui, nous pouvons effectuer une sauvegarde complète lorsque la base de données est ouverte.


45) Qu'est-ce qui est défini comme une sauvegarde partielle ?

Une sauvegarde partielle dans un le système d'exploitation est une sauvegarde courte d'une sauvegarde complète et elle peut être effectuée pendant que la base de données est ouverte ou arrêtée.


46) Quel est l'objectif d'Optimizer ?

L'objectif d'Optimizer est de trouver le moyen le plus efficace d'exécuter le SQL Déclarations.


47) Qu'est-ce que le plan d'exécution ?

Le plan d'exécution est un plan qui est utilisé par l'optimiseur pour sélectionner la combinaison des étapes.


48) Quelles sont les approches utilisées par Optimizer lors du plan d'exécution ?

Il existe deux approches:

  1. Basé sur des règles
  2. Basé sur le coût

49) Quels sont les outils disponibles pour ETL ?

Voici les outils ETL disponibles :

informatique
Étape des données
Oracle
Constructeur d'entrepôt
Ab initio
Jonction de données


50) Quelle est la différence entre les métadonnées et le dictionnaire de données ?

Les métadonnées sont définies comme des données sur les données. Mais le dictionnaire de données contient des informations sur les informations du projet, des graphiques, des commandes abinito et des informations sur le serveur.

Ces questions d'entretien vous aideront également dans votre soutenance

Partager

21 Commentaires

    1. comment installer le logiciel outil etl datastage dans mon Windows10

  1. Avatar Shiv Gautam dit:

    merci pour le partage de la page d'accueil

    1. Avatar Sai Srinivas dit:

      hii
      pls
      entrepôt de données, explication et théorie

  2. Informations très utiles .. Merci :)

  3. Avatar Grahi Parmar dit:

    Les types SCD ne sont pas dans le bon ordre.
    Type 0 – Dimension fixe
    Aucune modification autorisée, la dimension ne change jamais
    Type 1 – Pas d'historique
    Mettre à jour l'enregistrement directement, il n'y a pas d'enregistrement des valeurs historiques, le seul état actuel
    Type 2 – Versionnement des lignes
    Suivre les modifications sous forme d'enregistrements de version avec l'indicateur actuel et les dates actives et d'autres métadonnées
    Type 3 – Colonne Valeur précédente
    Suivez les modifications apportées à un attribut spécifique, ajoutez une colonne pour afficher la valeur précédente, qui est mise à jour à mesure que d'autres modifications se produisent
    Type 4 – Tableau historique
    Afficher la valeur actuelle dans la table des dimensions mais suivre toutes les modifications dans une table séparée
    Type 6 – SCD hybride
    Utiliser les techniques des types SCD 1, 2 et 3 pour suivre les changements

  4. C'est très utile. Pour partager de bonnes choses avec les gens.

  5. Avatar Mohamed Abubakar dit:

    J'ai besoin d'aide pour discuter de cette question !
    Q : Vous êtes embauché en tant qu'ingénieur dataware house par un méga magasin. Comment pouvez-vous utiliser la règle d'association de l'exploration de données pour augmenter les ventes du méga magasin ?

  6. Avatar Dr Darko Petrusic dit:

    44. Pouvons-nous effectuer une sauvegarde lorsque la base de données est ouverte ?

    Oui, nous pouvons effectuer une sauvegarde complète lorsque la base de données est ouverte. C’est ce qu’on appelle la sauvegarde à chaud…

    1. Alex Silverman Alex Silverman dit:

      Bonjour, merci d'avoir partagé vos réflexions. Il est mis à jour..

  7. Tres bien Monsieur.
    Merci d'avoir fourni des questions précieuses et des réponses faciles à comprendre

  8. C'est vraiment sympa merci Cela m'aide beaucoup.

  9. Avatar Asrar Alam dit:

    Dans l'ensemble, des informations très utiles, merci

Soyez sympa! Laissez un commentaire

Votre adresse email n'apparaitra pas. Les champs obligatoires sont marqués *