Las 19 preguntas y respuestas principales de la entrevista ab initio (2025)
1) Menciona ¿Qué es Abinitio?
“Abinitio” es una palabra latina que significa “desde el principio”. Abinitio es una herramienta utilizada para extraer, transformar y cargar datos. También se utiliza para el análisis de datos, la manipulación de datos, el procesamiento por lotes y el procesamiento paralelo basado en la interfaz gráfica de usuario.Descarga gratuita de PDF: Preguntas y respuestas de la entrevista ab initio
2) Explique ¿Qué es la arquitectura de Abinitio?
Arquitectura de Abinitio incluye- GDE (Entorno de desarrollo gráfico)
- Co-Sistema operativo
- Metaentorno empresarial (EME)
- Conducta-TI
3) Mencione ¿cuál es el papel del sistema cooperativo en Abinitio?
El sistema cooperativo Abinitio proporciona características como- Administre y ejecute el gráfico Abinitio y controle los procesos ETL
- Proporcionar extensiones Ab initio al sistema operativo
- Supervisión y depuración de procesos ETL
- Gestión de metadatos e interacción con la EME
4) Explique qué significa el análisis de dependencia en Abinitio.
En Ab initio, el análisis de dependencia es un proceso a través del cual EME examina un proyecto en su totalidad y rastrea cómo se transfieren y transforman los datos, de componente a componente, campo por campo, dentro y entre gráficos.5) Explique cómo se segrega Abinitio EME?
Abinition se divide lógicamente en dos segmentos- Porción de integración de datos
- Interfaz de Usuario (Acceso a la información de los metadatos)
6) Menciona ¿cómo se puede conectar EME a Abinitio Server?
Para conectarse con Ab initio Server, hay varias formas como- Establecer AB_AIR_ROOT
- Inicie sesión en la interfaz web de EME: http://serverhost:[serverport]/abinitio
- A través de GDE, puede conectarse al almacén de datos de EME
- A través del comando aéreo
7) ¿Enumere las extensiones de archivo utilizadas en Abinitio?
Las extensiones de archivo utilizadas en Abinitio son- .mp: Almacena gráfico ab initio o componente de gráfico
- .mpc: componente o programa personalizado
- .mdc: conjunto de datos o componente de conjunto de datos personalizado
- .dml: archivo de lenguaje de manipulación de datos o definición de tipo de registro
- .xfr: archivo de función de transformación
- .dat: archivo de datos (multiarchivo o archivo en serie)
8) Mencione qué información proporciona una extensión de archivo .dbc para conectarse a la base de datos.
La extensión .dbc proporciona al GDE la información para conectarse con la base de datos.- Nombre y número de versión de la base de datos a la que desea conectarse
- Nombre del equipo en el que se ejecuta la instancia de la base de datos o el servidor al que desea conectarse, o en el que está instalado el software de acceso remoto a la base de datos
- Nombre del servidor, instancia de base de datos o proveedor al que desea vincular
9) Explique cómo puede ejecutar un gráfico infinitamente en Ab initio.
Para ejecutar el gráfico infinitamente, la secuencia de comandos final del gráfico debe llamar al archivo .ksh del gráfico. Por lo tanto, si el nombre del gráfico es abc.mp, en el script final del gráfico debería llamar a abc.ksh. Esto ejecutará el gráfico infinitamente.10) Mencione cuál es la diferencia entre el archivo "Buscar" y "Buscar" en Abinitio.
El archivo de búsqueda define uno o más archivos en serie (archivos planos); es un archivo físico donde se almacenan los datos para el Look-up. Mientras que Look-up es el componente del gráfico abinitio, donde podemos guardar datos y recuperarlos usando un parámetro clave.11) Menciona ¿Cuáles son los diferentes tipos de paralelismo utilizados en Abinitio?
Los diferentes tipos de paralelismo utilizados en Abinitio incluyen- Paralelismo de componentes: Un gráfico con múltiples procesos ejecutándose simultáneamente en datos separados usa paralelismo
- Paralelismo de datos: Un gráfico que trabaja con datos divididos en segmentos y opera en cada segmento respectivamente, usa paralelismo de datos.
- Paralelismo de tubería: Un gráfico que se ocupa de varios componentes que se ejecutan simultáneamente en los mismos datos utiliza el paralelismo de canalización. Cada componente de la canalización lee continuamente de los componentes ascendentes, procesa datos y escribe en los componentes descendentes. Ambos componentes pueden operar en paralelo.
12) Explique ¿Qué es Ordenar Componente en Abinitio?
El Componente Ordenar en Abinitio reordena los datos. Se compone de dos parámetros "Key" y "Max-core".- Llave: Es uno de los parámetros para el componente de clasificación que determina el orden de clasificación
- Núcleo máximo: Este parámetro controla la frecuencia con la que el componente de clasificación descarga datos de la memoria al disco.
13) Mencione qué componente de desduplicación y componente de replicación hace.
- Componente de deduplicación: Se utiliza para eliminar registros duplicados.
- Componente replicado: Combina los registros de datos de las entradas en un flujo y escribe una copia de ese flujo en cada uno de sus puertos de salida.
14) Mencione qué es una partición y cuáles son los diferentes tipos de componentes de partición en Abinitio.
En Abinitio, la partición es el proceso de dividir conjuntos de datos en múltiples conjuntos para su posterior procesamiento. Los diferentes tipos de componentes de partición incluyen- Partición por Round-Robin: Distribuir datos de manera uniforme, en fragmentos de tamaño de bloque, a través de las particiones de salida
- Partición por rango: Puede dividir los datos de manera uniforme entre los nodos, en función de un conjunto de rangos de partición y clave.
- Partición por porcentaje: Distribución de datos, por lo que la salida es proporcional a fracciones de 100
- Partición por balance de carga: Equilibrio de carga dinámico
- Partición por expresión: División de datos según una expresión DML
- Partición por clave: Agrupación de datos por clave
15) Explique ¿Qué es SANDBOX?
Se hace referencia a un SANDBOX para la recopilación de gráficos y archivos relacionados que se guardan en un solo árbol de directorios y se comporta como un grupo para fines de navegación, control de versiones y migración.16) Explique ¿Qué es la de-partición en Abinitio?
La partición se realiza para leer datos de múltiples flujos u operaciones y se utiliza para volver a unir registros de datos de diferentes flujos. Hay varios componentes de partición disponibles que incluyen Gather, Merge, Interleave y Concatenation.17) ¿Enumere algunos de los comandos aéreos utilizados en Abintio?
El comando aéreo utilizado en Abinitio incluye- objeto de aire es : Se utiliza para ver los listados de objetos en un directorio dentro del proyecto
- aire objeto rm : Se utiliza para eliminar un objeto del repositorio.
- versiones de objetos aéreos-verbose : Da el historial de versiones del objeto.
18) Mencione ¿Qué es el componente de acumulación?
El componente de resumen permite a los usuarios agrupar los registros en ciertos valores de campo. Es una función de múltiples etapas y consiste en inicializar 2 y acumular 3.19) Menciona ¿cuál es la sintaxis de m_dump en Abinitio?
La sintaxis de m_dump en Abinitio se usa para ver los datos en varios archivos desde el indicador de Unix. El comando para m_dump incluye- m_dump a.dml a.dat: Este comando imprimirá los datos tal como se manifiestan desde GDE cuando veamos datos en texto formateado
- m_dump a.dml a.dat>b.dat: La salida se redirige en b.dat y actuará como un archivo serial.b.dat al que se puede hacer referencia cuando sea necesario.