19 大 Ab initio 面试问题及答案(2025 年)

以下是 Abinitio 面试问题和答案,可帮助应届毕业生和有经验的求职者获得理想的工作。

1)提及什么是Abinitio?

“Abinitio” 是一个拉丁词,意思是“从一开始”。Abinitio 是一种用于提取、转换和加载数据的工具。它还用于数据分析、数据处理、批处理和基于图形用户界面的并行处理。

免费 PDF 下载:从头开始面试问题和答案


2)解释一下Abinitio的架构是什么?

Abinitio 的架构包括
  • GDE(图形开发环境)
  • 合作操作系统
  • 企业元环境 (EME)
  • 行为-IT

3) 请说明一下 Abinitio 中协同操作系统的作用是什么?

Abinitio 协同操作系统提供以下功能
  • 管理和运行 Abinitio 图表并控制 ETL 流程
  • 为操作系统提供 Ab initio 扩展
  • ETL 流程监控和调试
  • 元数据管理和与 EME 的交互

4)解释 Abinitio 中的依赖分析是什么意思?

在 Ab initio 中,依赖关系分析是一个过程,通过该过程,EME 可以完全检查项目并跟踪数据如何在图表内和图表之间从一个组件到另一个组件、从一个字段到另一个字段地传输和转换。

5)解释Abinitio EME是如何分离的?

Abinition 在逻辑上分为两个部分
  • 数据集成部分
  • 用户界面(访问元数据信息)
Abinitio 面试问题
Abinitio 面试问题

6) 请提及如何将 EME 连接到 Abinitio 服务器?

要连接 Ab initio Server,有几种方法,例如
  • 设置 AB_AIR_ROOT
  • 登录 EME 网络界面 - http://serverhost:[serverport]/abinitio
  • 通过 GDE,你可以连接到 EME 数据存储
  • 通过空中指挥

7) 列出 Abinitio 中使用的文件扩展名?

Abinitio 中使用的文件扩展名是
  • .mp:存储从头算图或图形组件
  • .mpc:自定义组件或程序
  • .mdc:数据集或自定义数据集组件
  • .dml:数据操作语言文件或记录类型定义
  • .xfr:变换函数文件
  • .dat:数据文件(多文件或串行文件)

8)提及.dbc 文件扩展名提供哪些信息来连接数据库?

.dbc 扩展为 GDE 提供了与数据库连接的信息
  • 您要连接的数据库的名称和版本号
  • 运行要连接的数据库实例或服务器的计算机的名称,或安装数据库远程访问软件的计算机的名称
  • 您要链接到的服务器、数据库实例或提供程序的名称

9)解释如何在 Ab initio 中无限运行图形?

要无限执行图表,图表结束脚本应调用图表的 .ksh 文件。因此,如果图表名称为 abc.mp,则图表的结束脚本应调用 abc.ksh。这将无限运行图表。
从头开始面试问题
从头开始面试问题

10) 请说明一下 Abinitio 中“Look-up”文件和“Look is up”的区别?

查找文件定义一个或多个串行文件(平面文件);它是一个存储查找数据的物理文件。查找是 abinitio 图的组成部分,我们可以在其中保存数据并使用关键参数检索数据。

11)请说出Abinitio中使用了哪些不同类型的并行性?

Abinitio 中使用的不同类型的并行性包括
  • 组件并行性: 具有多个进程同时在不同数据上执行的图形使用并行性
  • 数据并行: 将数据分成几段并分别对每段进行操作的图使用了数据并行性。
  • 流水线并行性: 处理多个组件同时执行同一数据的图表使用管道并行性。管道中的每个组件都会从上游组件连续读取数据,处理数据并写入下游组件。两个组件都可以并行运行。

12)解释 Abinitio 中的排序组件是什么?

Abinitio 中的排序组件对数据进行重新排序。它包含两个参数“Key”和“Max-core”。
  • 重点: 它是排序组件的参数之一,用于确定排序顺序
  • 最大核心数: 此参数控制排序组件将数据从内存转储到磁盘的频率

13)请提及 dedup 组件和 replicate 组件的作用是什么?

  • 重复数据删除组件: 它用于删除重复记录
  • 复制组件: 它将来自输入的数据记录组合成一个流,并将该流的副本写入其每个输出端口

14) 请提及什么是分区以及 Abinitio 中有哪些不同类型的分区组件?

在 Abinitio 中,分区是将数据集划分为多个集合以供进一步处理的过程。不同类型的分区组件包括
  • 按循环分区: 以块大小为单位将数据均匀分布在输出分区中
  • 按范围分区: 您可以根据一组分区范围和键在节点之间均匀划分数据
  • 按百分比划分: 分布数据,因此输出与 100 的分数成比例
  • 按负载均衡划分: 动态负载均衡
  • 按表达式划分: 根据DML表达式进行数据划分
  • 按键分区: 按键分组数据

15)解释什么是 SANDBOX?

SANDBOX 是指保存在单个目录树中的图表和相关文件的集合,它们作为一个组来运行,以便进行导航、版本控制和迁移。

16)解释一下 Abinitio 中的分区解除是什么?

进行去分区是为了从多个流或操作中读取数据,并用于重新连接来自不同流的数据记录。有几种可用的去分区组件,包括 Gather、Merge、Interleave 和 Concatenation。

17) 列出 Abintio 中使用的一些空中命令?

阿比尼蒂奥使用的空中指挥包括
  • 空气物体是:用于查看项目内目录中的对象列表
  • 空气物体 rm :用于从存储库中删除对象
  • 空气对象版本-详细:它提供对象的版本历史。
Abinitio 的其他空中命令包括空中对象 cat、空中对象修改、空中锁定显示用户等。

18)请提及什么是 Rollup Component?

汇总组件使用户能够根据某些字段值对记录进行分组。它是一个多阶段函数,由初始化 2 和汇总 3 组成。

19)请说明一下 Abinitio 中 m_dump 的语法是什么?

Abinitio 中的 m_dump 语法用于从 unix 提示符查看多文件中的数据。m_dump 的命令包括
  • m_dump a.dml a.dat: 当我们以格式化的文本形式查看数据时,此命令将打印 GDE 中显示的数据
  • m_dump a.dml a.dat>;b.dat: 输出在 b.dat 中重新定向,并将作为串行文件 .b.dat,可以在需要时引用。
这些面试问题也会对你的口试有帮助
分享

发表评论

您的电邮地址不会被公开。 必填项 *