初体験面接の質問と回答トップ 19 (2025)
1) Abinitio とは何ですか?
「Abinitio」とはラテン語で「最初から」を意味します。 Abinitio は、データの抽出、変換、ロードに使用されるツールです。 データ分析、データ操作、バッチ処理、グラフィカル ユーザー インターフェイス ベースの並列処理にも使用されます。無料 PDF ダウンロード: Ab initio インタビューの質問と回答
2) Abinitio のアーキテクチャについて説明してください。
Abinitio のアーキテクチャには以下が含まれます- GDE (グラフィック開発環境)
- 共同オペレーティング·システム
- エンタープライズ メタ環境 (EME)
- ITの実践
3) Abinitio における協力システムの役割について言及してください。
Abinitio 連携システムは次のような機能を提供します。- Abinitio グラフを管理および実行し、ETL プロセスを制御する
- オペレーティング システムに Ab initio 拡張機能を提供する
- ETL プロセスの監視とデバッグ
- メタデータ管理とEMEとの対話
4) Abinitio における依存関係分析とは何を意味するのか説明してください。
Ab initio では、依存関係分析は、EME がプロジェクト全体を検査し、コンポーネントからコンポーネント、フィールドごと、グラフ内およびグラフ間でデータがどのように転送および変換されるかを追跡するプロセスです。5) Abinitio EME がどのように分離されているか説明してください。
Abinition は論理的に XNUMX つのセグメントに分割されます- データ統合部分
- ユーザーインターフェース (メタデータ情報へのアクセス)
6) EME を Abinitio サーバーに接続する方法について言及してください。
Ab initio Server に接続するには、次のようないくつかの方法があります。- AB_AIR_ROOT を設定する
- EME Web インターフェイスにログインします - http://serverhost:[serverport]/abinitio
- GDE を介して EME データストアに接続できます
- 航空指揮を通して
7) Abinitio で使用されるファイル拡張子を列挙してください。
Abinitio で使用されるファイル拡張子は次のとおりです。- .mp: Ab initio グラフまたはグラフ コンポーネントを格納します
- .mpc: カスタムコンポーネントまたはプログラム
- .mdc: データセットまたはカスタム データセット コンポーネント
- .dml: データ操作言語ファイルまたはレコード タイプ定義
- .xfr: 変換関数ファイル
- .dat: データ ファイル (マルチファイルまたはシリアル ファイル)
8) .dbc ファイル拡張子がデータベースに接続するために提供する情報について言及してください。
.dbc 拡張子は、データベースに接続するための情報を GDE に提供します。- 接続するデータベースの名前とバージョン番号
- 接続先のデータベース インスタンスまたはサーバーが実行されているコンピューター、またはデータベース リモート アクセス ソフトウェアがインストールされているコンピューターの名前
- リンク先のサーバー、データベース インスタンス、またはプロバイダーの名前
9) Ab initio でグラフを無限に実行する方法を説明してください。
グラフを無限に実行するには、グラフ終了スクリプトでグラフの .ksh ファイルを呼び出す必要があります。 したがって、グラフ名が abc.mp の場合、グラフの最後のスクリプトで abc.ksh を呼び出す必要があります。 これにより、グラフが無限に実行されます。10) Abinitio の「Look-up」ファイルと「Look is up」の違いについて説明してください。
ルックアップ ファイルは XNUMX つ以上のシリアル ファイル (フラット ファイル) を定義します。 これは、ルックアップのデータが保存される物理ファイルです。 ルックアップはアビニティオ グラフのコンポーネントであり、データを保存し、キー パラメーターを使用して取得できます。11) Abinitio で使用されるさまざまな種類の並列処理について言及してください。
Abinitio で使用されるさまざまな種類の並列処理には次のものがあります。- コンポーネントの並列処理: 複数のプロセスが別々のデータに対して同時に実行されるグラフでは、並列処理が使用されます。
- データの並列処理: セグメントに分割されたデータを処理し、各セグメントをそれぞれ操作するグラフでは、データの並列処理が使用されます。
- パイプラインの並列処理: 同じデータに対して同時に実行される複数のコンポーネントを扱うグラフでは、パイプライン並列処理が使用されます。 パイプライン内の各コンポーネントは、上流コンポーネントから継続的に読み取り、データを処理して、下流コンポーネントに書き込みます。 両方のコンポーネントは並行して動作できます。
12) Abinitio のソートコンポーネントとは何ですか?
Abinitio の並べ替えコンポーネントはデータを並べ替えます。 これは、「Key」と「Max-core」の XNUMX つのパラメータで構成されます。- キー: 照合順序を決定するsortコンポーネントのパラメータのXNUMXつです。
- 最大コア: このパラメータは、並べ替えコンポーネントがメモリからディスクにデータをダンプする頻度を制御します。
13) 重複排除コンポーネントと複製コンポーネントが何を行うかについて言及してください。
- 重複排除コンポーネント: 重複したレコードを削除するために使用されます
- コンポーネントをレプリケートします: 入力からのデータ レコードを XNUMX つのフローに結合し、そのフローのコピーを各出力ポートに書き込みます。
14) パーティションとは何か、Abinitio のさまざまなタイプのパーティション コンポーネントについて説明しますか?
Abinitio では、パーティションとは、さらに処理するためにデータ セットを複数のセットに分割するプロセスです。 さまざまなタイプのパーティション コンポーネントには次のものがあります。- ラウンドロビンによるパーティション: 出力パーティション全体にデータをブロック サイズのチャンク単位で均等に分散する
- 範囲によるパーティション化: 一連のパーティショニング範囲とキーに基づいて、データをノード間で均等に分割できます。
- パーセンテージによるパーティション: 分布データなので、出力は 100 の端数に比例します。
- ロードバランスによるパーティション: 動的負荷分散
- 式によるパーティション化: DML式によるデータ分割
- キーによるパーティション: キーによるデータのグループ化
15) サンドボックスとは何ですか?
SANDBOX は、単一のディレクトリ ツリーに保存されるグラフおよび関連ファイルのコレクションを指し、ナビゲーション、バージョン管理、および移行の目的でグループとして動作します。16) Abinitio のパーティション分割とは何ですか?
パーティション分割は、複数のフローまたは操作からデータを読み取るために行われ、異なるフローからのデータ レコードを再結合するために使用されます。 Gather、Merge、Interleave、Concatenation など、いくつかの分割解除コンポーネントが利用可能です。17) Abintio で使用される航空コマンドをいくつか挙げてください。
Abinitio で使用される航空コマンドには次のものがあります。- 空気オブジェクトは: プロジェクト内のディレクトリ内のオブジェクトのリストを表示するために使用されます。
- エアオブジェクトrm : リポジトリからオブジェクトを削除するために使用されます。
- 空気オブジェクトのバージョン - 詳細: オブジェクトのバージョン履歴を示します。
18) ロールアップ コンポーネントとは何ですか?
ロールアップ コンポーネントを使用すると、ユーザーは特定のフィールド値に基づいてレコードをグループ化できます。 これは複数段階の関数であり、初期化 2 とロールアップ 3 で構成されます。19) Abinitio の m_dump の構文について言及してください。
Abinitio の m_dump の構文は、UNIX プロンプトからマルチファイルのデータを表示するために使用されます。 m_dump のコマンドには次のものが含まれます。- m_dump a.dml a.dat: このコマンドは、フォーマットされたテキストでデータを表示するときに、GDE からマニフェストされたとおりにデータを出力します。
- m_dump a.dml a.dat>b.dat: 出力は b.dat にリダイレクトされ、必要なときに参照できるシリアル file.b.dat として機能します。