As 50 principais perguntas e respostas da entrevista do DataStage (2024)
Aqui estão as perguntas e respostas da entrevista do DataStage para calouros e também para desenvolvedores experientes do Datastage para conseguir o emprego dos sonhos.
1) Definir estágio de dados?
Um estágio de dados é basicamente uma ferramenta usada para projetar, desenvolver e executar vários aplicativos para preencher várias tabelas em data warehouses ou data marts. É um programa para servidores Windows que extrai dados de bancos de dados e os transforma em data warehouses. Tornou-se uma parte essencial do conjunto IBM WebSphere Data Integration.
Download gratuito de PDF: Perguntas e respostas da entrevista do Datastage
2) Explique como um arquivo de origem é preenchido?
Podemos preencher um arquivo de origem de várias maneiras, como criando uma consulta SQL em Oracle, ou usando a ferramenta de extração do gerador de linha, etc.
3) Nomeie as funções da linha de comando para importar e exportar os trabalhos do DS?
Para importar os trabalhos do DS, dsimport.exe é usado e para exportar os trabalhos do DS, dsexport.exe é usado.
4) Qual é a diferença entre o Datastage 7.5 e 7.0?
No Datastage 7.5, muitos novos estágios são adicionados para maior robustez e bom desempenho, como Estágio de Procedimento, Estágio de Comando, Gerar Relatório, etc.
5) No Datastage, como você pode corrigir o erro de dados truncados?
O erro de dados truncados pode ser corrigido usando ENVIRONMENT VARIABLE 'IMPORT_REJECT_STRING_FIELD_OVERRUN'.
6) Definir mesclagem?
Mesclar significa unir duas ou mais tabelas. As duas tabelas são unidas com base nas colunas de chave primária em ambas as tabelas.
7) Diferencie entre arquivo de dados e arquivo descritor?
Como o nome indica, os arquivos de dados contêm os dados e o arquivo descritor contém a descrição/informações sobre os dados nos arquivos de dados.
8) Diferenciar entre datastage e informatica?
No datastage, existe um conceito de partição, paralelismo para configuração de nós. Embora não exista conceito de partição e paralelismo na informática para configuração de nós. Além disso, a Informatica é mais escalonável que o Datastage. O Datastage é mais fácil de usar em comparação com a Informatica.
9) Definir Rotinas e seus tipos?
As rotinas são basicamente uma coleção de funções definidas pelo gerenciador DS. Pode ser chamado via estágio do transformador. Existem três tipos de rotinas, como rotinas paralelas, rotinas de quadro principal e rotinas de servidor.
10) Como você pode escrever rotinas paralelas no datastage PX?
Podemos escrever rotinas paralelas em compilador C ou C++. Tais rotinas também são criadas no gerenciador DS e podem ser chamadas a partir do estágio do transformador.
11) Qual é o método de remoção de duplicatas, sem a etapa de remoção de duplicatas?
As duplicatas podem ser removidas usando o estágio Sort. Podemos usar a opção permitir duplicado = falso.
12) Que medidas devem ser tomadas para melhorar os trabalhos do Datastage?
Para melhorar o desempenho dos jobs do Datastage, primeiro precisamos estabelecer as linhas de base. Em segundo lugar, não deveríamos utilizar apenas um fluxo para teste de performance. Em terceiro lugar, deveríamos trabalhar de forma incremental. Então, devemos avaliar as distorções de dados. Depois devemos isolar e resolver os problemas, um por um. Depois disso, devemos distribuir os sistemas de arquivos para remover gargalos, se houver. Além disso, não devemos incluir RDBMS no início da fase de testes. Por último, mas não menos importante, devemos compreender e avaliar os botões de afinação disponíveis.
13) Diferenciar entre os estágios Join, Merge e Lookup?
Todos os três conceitos são diferentes entre si na forma como utilizam o armazenamento de memória, comparam os requisitos de entrada e como tratam os vários registros. Join and Merge precisa de menos memória em comparação com o estágio Lookup.
14) Explique o estágio de Qualidade?
O estágio de qualidade também é conhecido como estágio de integridade. Auxilia na integração de diferentes tipos de dados de várias fontes.
15) Definir controle de trabalho?
O controle do trabalho pode ser melhor executado usando Idioma de controle do trabalho (JCL). Esta ferramenta permite executar vários trabalhos simultaneamente, sem utilizar nenhum tipo de loop.
16) Diferencie entre Multiprocessamento Simétrico e Processamento Paralelo Massivo?
No Multiprocessamento Simétrico, os recursos de hardware são compartilhados por processador. O processador tem um sistema operativo e se comunica através da memória compartilhada. Enquanto no processamento Massive Parallel, o processador acessa exclusivamente os recursos de hardware. Este tipo de processamento também é conhecido como Shared Nothing, pois nada é compartilhado neste. É mais rápido que o Multiprocessamento Simétrico.
17) Quais são as etapas necessárias para encerrar o trabalho no Datastage?
Para encerrar o trabalho no Datasatge, temos que eliminar o respectivo ID de processamento.
18) Diferenciar entre validado e compilado no Datastage?
No Datastage, validar um trabalho significa executar um trabalho. Durante a validação, o mecanismo Datastage verifica se todas as propriedades necessárias foram fornecidas ou não. Caso contrário, ao compilar um trabalho, o mecanismo Datastage verifica se todas as propriedades fornecidas são válidas ou não.
19) Como gerenciar a conversão de datas no Datastage?
Podemos usar a função de conversão de data para esta finalidade, ou seja, Oconv(Iconv(Filedname,”Formato de data existente”),”Outro formato de data”).
20) Por que usamos atividades de exceção no Datastage?
Todos os estágios após a atividade de exceção no Datastage são executados caso ocorra algum erro desconhecido durante a execução do sequenciador de jobs.
21) Definir APT_CONFIG no Datastage?
É a variável de ambiente usada para identificar o arquivo *.apt no Datastage. Ele também é usado para armazenar informações de nó, informações de armazenamento em disco e informações de rascunho.
22) Cite os diferentes tipos de pesquisas no Datastage?
Existem dois tipos de pesquisas no Datastage, ou seja, lkp normal e lkp esparso. No lkp normal, os dados são salvos primeiro na memória e depois a pesquisa é realizada. No Sparse lkp, os dados são salvos diretamente no banco de dados. Portanto, o lkp esparso é mais rápido que o lkp normal.
23) Como um trabalho de servidor pode ser convertido em um trabalho paralelo?
Podemos converter um trabalho de servidor em um trabalho paralelo usando o estágio IPC e o Link Collector.
24) Definir tabelas de repositório no Datastage?
No Datastage, Repositório é outro nome para um data warehouse. Pode ser centralizado e também distribuído.
25) Definir as funções OConv() e IConv() no Datastage?
No Datastage, as funções OConv() e IConv() são usadas para converter formatos de um formato para outro, ou seja, conversões de números romanos, hora, data, raiz, numeral ASCII etc. IConv() é basicamente usado para converter formatos para o sistema entender . Enquanto, OConv() é usado para converter formatos para que os usuários entendam.
26) Explicar a análise de uso no Datastage?
No Datastage, a análise de uso é realizada com poucos cliques. Inicie o Datastage Manager e clique com o botão direito no trabalho. Em seguida, selecione Análise de uso e pronto.
27) Como você encontra o número de linhas em um arquivo sequencial?
Para encontrar linhas em um arquivo sequencial, podemos usar a variável de sistema @INROWNUM.
28) Diferencie entre arquivo Hash e arquivo Sequencial?
A única diferença entre o arquivo Hash e o arquivo Sequencial é que o arquivo Hash salva dados no algoritmo hash e em um valor de chave hash, enquanto o arquivo sequencial não possui nenhum valor de chave para salvar os dados. Com base neste recurso de chave hash, a pesquisa no arquivo Hash é mais rápida do que no arquivo sequencial.
29) Como limpar o repositório do Datastage?
Podemos limpar o repositório do Datastage usando a funcionalidade Clean Up Resources no Datastage Manager.
30) Como uma rotina é chamada no job do Datastage?
No Datastage, as rotinas são de dois tipos, ou seja, antes das sub-rotinas e depois das sub-rotinas. Podemos chamar uma rotina do estágio do transformador no Datastage.
31) Diferencie entre Operational Datastage (ODS) e Data Warehouse?
Podemos dizer que o ODS é um mini data warehouse. Um ODS não contém informações de mais de 1 ano, enquanto um data warehouse contém informações detalhadas sobre todo o negócio.
32) NLS significa o que no Datastage?
NLS significa Suporte ao Idioma Nacional. Pode ser usado para incorporar outros idiomas como francês, alemão e espanhol etc. nos dados, necessários para o processamento pelo data warehouse. Esses idiomas têm os mesmos scripts do idioma inglês.
33) Você pode explicar como alguém poderia eliminar o índice antes de carregar os dados no destino no Datastage?
No Datastage, podemos eliminar o índice antes de carregar os dados no destino usando a funcionalidade Direct Load do SQL Loaded Utility.
34) O Datastage oferece suporte a dimensões que mudam lentamente?
Sim. A versão 8.5+ suporta este recurso
35) Como encontrar bugs na sequência de tarefas?
Podemos encontrar bugs na sequência de tarefas usando o DataStage Director.
36) Quão complexos os trabalhos são implementados no Datstage para melhorar o desempenho?
Para melhorar o desempenho no Datastage, é recomendado não utilizar mais de 20 estágios em cada trabalho. Se você precisar usar mais de 20 estágios, é melhor usar outro trabalho para esses estágios.
37) Cite as ferramentas de terceiros que podem ser usadas no Datastage?
As ferramentas de terceiros que podem ser usadas no Datastage são Autosys, TNG e Event Co-ordinator. Trabalhei com essas ferramentas e possuo experiência prática em trabalhar com essas ferramentas de terceiros.
38) Definir projeto no Datastage?
Sempre que lançamos o cliente Datastage, somos solicitados a nos conectar a um projeto Datastage. Um projeto do Datastage contém jobs do Datastage, componentes integrados e Datastage Designer ou componentes definidos pelo usuário.
39) Quantos tipos de arquivos hash existem?
Existem dois tipos de arquivos hash no DataStage, ou seja, arquivo hash estático e arquivo hash dinâmico. O arquivo hash estático é usado quando uma quantidade limitada de dados deve ser carregada no banco de dados de destino. O arquivo hash dinâmico é usado quando não sabemos a quantidade de dados do arquivo de origem.
40) Definir Meta Estágio?
No Datastage, o MetaStage é usado para salvar metadados que são úteis para linhagem de dados e análise de dados.
41) Você já trabalhou em ambiente UNIX e por que ele é útil no Datastage?
Sim, trabalhei em ambiente UNIX. Esse conhecimento é útil no Datastage porque às vezes é necessário escrever programas UNIX, como programas em lote, para invocar o processamento em lote, etc.
42) Diferenciar entre Datastage e Datastage TX?
Datastage é uma ferramenta de ETL (Extract, Transform and Load) e Datastage TX é uma ferramenta de EAI (Enterprise Application Integration).
43) Qual é o tamanho de uma transação e um ordem significa em um Datastage?
Tamanho da transação significa o número de linhas escritas antes de confirmar os registros em uma tabela. Um tamanho de array significa o número de linhas escritas/lidas na tabela ou da tabela, respectivamente.
44) Quantos tipos de visualizações existem em um Datastage Director?
Existem três tipos de visualizações em um Datastage Director, ou seja, visualização de trabalho, visualização de log e visualização de status.
45) Por que usamos chave substituta?
No Datastage, usamos chave substituta em vez de chave exclusiva. A chave substituta é usada principalmente para recuperar dados mais rapidamente. Ele usa Index para realizar a operação de recuperação.
46) Como as linhas rejeitadas são gerenciadas no Datastage?
No Datastage, as linhas rejeitadas são gerenciadas por meio de restrições no transformador. Podemos colocar as linhas rejeitadas nas propriedades de um transformador ou podemos criar um armazenamento temporário para as linhas rejeitadas com a ajuda do comando REJECTED.
47) Diferenciar entre estágio ODBC e DRS?
O estágio DRS é mais rápido que o estágio ODBC porque usa bancos de dados nativos para conectividade.
48) Definir estágios Orabulk e BCP?
O estágio Orabulk é usado para carregar uma grande quantidade de dados em uma tabela de destino do banco de dados Oracle. O estágio BCP é usado para carregar uma grande quantidade de dados em uma tabela de destino de Microsoft SQL Server.
49) Definir DS Designer?
O DS Designer é usado para projetar a área de trabalho e adicionar vários links a ela.
50) Por que usamos Link Partitioner e Link Collector no Datastage?
No Datastage, o Link Partitioner é usado para dividir os dados em diferentes partes por meio de determinados métodos de particionamento. Link Collector é usado para coletar dados de várias partições/segmentos em um único dado e salvá-los na tabela de destino.
Essas perguntas da entrevista também ajudarão em sua viva (oral)
Blog fantástico! Você tem dicas e sugestões para aspirantes
escritoras? Estou planejando começar meu próprio site em breve, mas
Estou um pouco perdida em tudo. Você sugeriria começar com
uma plataforma gratuita como WordPress ou opte por uma plataforma paga
opção? Existem tantas opções por aí que estou completamente
confuso .. Alguma idéia? Parabéns!
Para obter informações mais recentes, você deve visitar o site
e na web encontrei esta página como o melhor site para as atualizações mais recentes.
Como o administrador deste site está trabalhando, não hesite, muito em breve ele irá
ser famoso, devido ao seu conteúdo de destaque.
Isso é realmente fascinante, você é um blogueiro muito profissional.
Eu me juntei ao seu feed e estou ansioso por mais de sua magnífica postagem.
Além disso, compartilhei seu site em minhas redes sociais
O que está acontecendo, sou novo nisso, me deparei com isso e descobri que é absolutamente
útil e me ajudou muito. espero dar
uma contribuição e ajudar diferentes clientes como seu
me ajudou. Bom trabalho.
Dia bom! Este é um assunto fora do assunto, mas preciso de alguma orientação de um blog estabelecido.
É difícil criar o seu próprio blog? Eu estou
não é muito técnico, mas consigo descobrir as coisas bem rápido.
Estou pensando em fazer o meu, mas não tenho certeza de onde
começar. Você tem algum ponto ou sugestão?
Com agradecimentos
Se usados corretamente, os blogs circulam pela internet por meio de feeds.
Publique o blog com feed RSS e permita que outras pessoas se inscrevam para
seu conteúdo informativo e artigos. No entanto,
esta é minha opinião baseada em experiências passadas.
No entanto, crie uma colcha de fotos infantis com várias fotos fofas do bebê.
O Google agora deseja que pelo menos 60% do seu texto andhor funcione como o nome da empresa.
Tenho navegado online há mais de três horas, mas nunca descobri nenhum artigo que chamasse a atenção
como o seu. É um valor bastante suficiente para mim. Na minha opinião,
se todos os proprietários de sites e blogueiros fizessem apenas
Conteúdo correto como você fez, a web será ainda mais útil do que nunca.
Hmm parece que seu site comeu meu primeiro comentário (foi super longo) então eu acho
Vou apenas resumir o que enviei e dizer que estou gostando muito do seu blog.
Eu também sou um aspirante a escritor de blog, mas ainda sou novo em tudo.
Você tem alguma recomendação para escritores iniciantes de blog?
Eu definitivamente aprecio isso.
Graças ao meu pai que compartilhou comigo sobre este site, este weblog é realmente notável.
Muito rapidamente esta página da web se tornará famosa entre todos os visualizadores de blogs e construção de sites, devido aos seus bons artigos
Quando comentei originalmente, parece que cliquei no
- Notifique-me quando novos comentários forem adicionados - caixa de seleção e
a partir de agora, sempre que um comentário for adicionado, recebo quatro e-mails com exatamente o mesmo comentário.
Deve haver um meio de me remover desse serviço?
Muito obrigado!
Olá, você fez um ótimo trabalho. Eu definitivamente vou
cave e sugira pessoalmente aos meus amigos. Tenho certeza que eles vão
ser beneficiado com este site.
Muito rapidamente este site se tornará famoso entre todos os visitantes do blog, devido aos seus artigos agradáveis ou
rever
Obrigado cara… eu tento. Agora preciso descobrir como fotografar uma com esta câmera…
É difícil encontrar pessoas experientes neste assunto específico, mas parece que você sabe do que está falando!
obrigado
Página da classe. Vielen Dank.
Olá.
Gostaria de avisar que estou visitando seu site
por muito tempo e você escreve informações muito boas.
Compartilhei seu novo artigo no tumblr
e recebi muitos feedbacks bons.
Esperando pelo seu próximo artigo
Olá a todos, na verdade é agradável para mim
para visitar esta página web, ela contém informações importantes.
Olá,
Quero dizer que utilizo seu site há muito tempo e você compartilha um conteúdo muito bom.
Compartilhei seu último artigo no Twitter e recebi muitos feedbacks bons.
Continue com seu ótimo trabalho!
Oi,
Quero dizer que estou usando este site há alguns
tempo e você compartilha um conteúdo muito bom. Eu compartilhei seu artigo de notícias no Twitter e
recebi muitos feedbacks positivos.
Espero que você coloque novos conteúdos em breve.
Este site foi recomendado por meu primo. Não tenho mais certeza se isso foi colocado ou não
está escrito através dele, pois ninguém mais sabe tão especificamente sobre o meu problema.
Você é maravilhoso! Obrigada!
Obrigado por qualquer outro excelente artigo. Onde mais pode apenas
alguém consegue esse tipo de informação de uma forma tão perfeita de escrever?
Tenho uma apresentação na próxima semana, e estou em busca de tal informação.
Obrigado por este blog. Muito útil. Funciona bem para uma referência rápida antes da entrevista. A propósito, cancelei minha entrevista :)