Top 19 des questions et réponses d'entretien ab initio (2025)
1) Mentionnez qu’est-ce qu’Abinitio ?
« Abinitio » est un mot latin signifiant « depuis le début ». Abinitio est un outil utilisé pour extraire, transformer et charger des données. Il est également utilisé pour l'analyse des données, la manipulation des données, le traitement par lots et le traitement parallèle basé sur une interface utilisateur graphique.Téléchargement gratuit du PDF : Questions et réponses pour l'entretien ab initio
2) Expliquez quelle est l'architecture d'Abinitio ?
L'architecture d'Abinitio comprend- GDE (Environnement de Développement Graphique)
- Co-système opérateur
- Méta-environnement d'entreprise (EME)
- Conduite-IT
3) Mentionnez quel est le rôle du système de coopération dans Abinitio ?
Le système de coopération Abinitio offre des fonctionnalités telles que- Gérer et exécuter Abinitio graph et contrôler les processus ETL
- Fournir des extensions Ab initio au système d’exploitation
- Surveillance et débogage des processus ETL
- Gestion des métadonnées et interaction avec l'EME
4) Expliquez ce que signifie l'analyse des dépendances dans Abinitio ?
En Ab initio, l'analyse des dépendances est un processus par lequel l'EME examine un projet dans son intégralité et retrace la manière dont les données sont transférées et transformées, d'un composant à l'autre, champ par champ, à l'intérieur et entre les graphiques.5) Expliquez comment Abinitio EME est ségréguée ?
L'abinition est logiquement divisée en deux segments- Partie intégration de données
- Interface utilisateur (Accès aux informations de métadonnées)
6) Mentionnez comment pouvez-vous connecter EME au serveur Abinitio ?
Pour se connecter à Ab initio Server, il existe plusieurs manières comme- Définir AB_AIR_ROOT
- Connectez-vous à l'interface Web EME - http://serverhost:[serverport]/abinitio
- Grâce à GDE, vous pouvez vous connecter au magasin de données EME
- Par le commandement aérien
7) Répertoriez les extensions de fichiers utilisées dans Abinitio ?
Les extensions de fichiers utilisées dans Abinitio sont- .mp : Il stocke le graphique Ab initio ou le composant graphique
- .mpc : composant ou programme personnalisé
- .mdc : composant d'ensemble de données ou d'ensemble de données personnalisé
- .dml : fichier de langage de manipulation de données ou définition de type d'enregistrement
- .xfr : fichier de fonction de transformation
- .dat : fichier de données (fichier multifichier ou série)
8) Mentionnez quelles informations une extension de fichier .dbc fournit pour se connecter à la base de données ?
L'extension .dbc fournit au GDE les informations pour se connecter à la base de données.- Nom et numéro de version de la base de données à laquelle vous souhaitez vous connecter
- Nom de l'ordinateur sur lequel s'exécute l'instance de base de données ou le serveur auquel vous souhaitez vous connecter, ou sur lequel le logiciel d'accès à distance à la base de données est installé
- Nom du serveur, de l'instance de base de données ou du fournisseur auquel vous souhaitez vous lier
9) Expliquez comment exécuter un graphe à l'infini en Ab initio ?
Pour exécuter le graphique à l'infini, le script de fin du graphique doit appeler le fichier .ksh du graphique. Par conséquent, si le nom du graphique est abc.mp, alors dans le script de fin du graphique, il doit appeler abc.ksh. Cela exécutera le graphique à l’infini.10) Mentionnez quelle est la différence entre le fichier « Look-up » et « Look-up » dans Abinitio ?
Le fichier de recherche définit un ou plusieurs fichiers série (fichiers plats) ; il s'agit d'un fichier physique dans lequel les données de la recherche sont stockées. Alors que Look-up est le composant du graphique abinitio, où nous pouvons enregistrer des données et les récupérer en utilisant un paramètre clé.11) Mentionnez quels sont les différents types de parallélisme utilisés dans Abinitio ?
Les différents types de parallélisme utilisés dans Abinitio incluent- Parallélisme des composants : Un graphique avec plusieurs processus s'exécutant simultanément sur des données distinctes utilise le parallélisme
- Parallélisme des données : Un graphique qui fonctionne avec des données divisées en segments et opère respectivement sur chaque segment, utilise le parallélisme des données.
- Parallélisme des pipelines : Un graphique qui traite plusieurs composants s'exécutant simultanément sur les mêmes données utilise le parallélisme de pipeline. Chaque composant du pipeline lit en continu à partir des composants en amont, traite les données et écrit dans les composants en aval. Les deux composants peuvent fonctionner en parallèle.
12) Expliquez qu'est-ce que le composant de tri dans Abinitio ?
Le composant de tri dans Abinitio réorganise les données. Il comprend deux paramètres « Key » et « Max-core ».- Clé: C'est l'un des paramètres du composant de tri qui détermine l'ordre de classement
- Max-noyau : Ce paramètre contrôle la fréquence à laquelle le composant de tri transfère les données de la mémoire vers le disque.
13) Mentionnez ce que font le composant de déduplication et le composant de réplication ?
- Composant de déduplication : Il est utilisé pour supprimer les enregistrements en double
- Composant répliqué : Il combine les enregistrements de données des entrées en un seul flux et écrit une copie de ce flux sur chacun de ses ports de sortie.
14) Mentionnez qu'est-ce qu'une partition et quels sont les différents types de composants de partition dans Abinitio ?
Dans Abinitio, la partition est le processus de division d'ensembles de données en plusieurs ensembles pour un traitement ultérieur. Différents types de composants de partition comprennent- Partition par round-robin : Répartir les données uniformément, en morceaux de taille de bloc, sur les partitions de sortie
- Partition par plage : Vous pouvez diviser les données de manière égale entre les nœuds, en fonction d'un ensemble de plages de partitionnement et de clés.
- Partition par pourcentage : Données de distribution, donc la sortie est proportionnelle aux fractions de 100
- Partition par équilibre de charge : Équilibrage de charge dynamique
- Partition par expression : Division des données selon une expression DML
- Partition par clé : Regroupement de données par une clé
15) Expliquez qu'est-ce que SANDBOX ?
Un SANDBOX fait référence à la collection de graphiques et de fichiers associés qui sont enregistrés dans une seule arborescence de répertoires et se comportent comme un groupe à des fins de navigation, de contrôle de version et de migration.16) Expliquez qu'est-ce que la dé-partition dans Abinitio ?
La départition est effectuée afin de lire les données de plusieurs flux ou opérations et est utilisée pour rejoindre les enregistrements de données de différents flux. Il existe plusieurs composants de départition disponibles, notamment Gather, Merge, Interleave et Concatenation.17) Énumérez certaines des commandes aériennes utilisées dans Abintio ?
Le commandement aérien utilisé à Abinitio comprend- objet aérien est : Il est utilisé pour voir les listes d'objets dans un répertoire à l'intérieur du projet
- objet aérien rm : Il est utilisé pour supprimer un objet du référentiel
- versions d'objet aérien-verbeuses : Il donne l'historique des versions de l'objet.
18) Mentionnez ce qu'est le composant Rollup ?
Le composant de cumul permet aux utilisateurs de regrouper les enregistrements sur certaines valeurs de champ. Il s'agit d'une fonction à plusieurs étapes et comprend l'initialisation 2 et le Rollup 3.19) Mentionnez quelle est la syntaxe de m_dump dans Abinitio ?
La syntaxe de m_dump dans Abinitio est utilisée pour afficher les données dans un multifichier à partir de l'invite Unix. La commande pour m_dump inclut- m_dump a.dml a.dat : Cette commande imprimera les données telles qu'elles se manifestent à partir de GDE lorsque nous visualisons les données sous forme de texte formaté.
- m_dump a.dml a.dat>b.dat : La sortie est redirigée vers b.dat et agira comme un fichier série.b.dat qui peut être référencé lorsque cela est nécessaire.