Las 50 principales preguntas y respuestas de las entrevistas sobre el almacén de datos
Aquí hay preguntas y respuestas de la entrevista de Data Warehouse para candidatos más nuevos y experimentados para obtener el trabajo de sus sueños.
1) ¿Qué es el almacén de datos?
El almacenamiento de datos (DW) es el depósito de datos y se utiliza para el sistema de soporte de decisiones de gestión. El almacén de datos consta de una amplia variedad de datos que tienen un alto nivel de condiciones comerciales en un solo punto en el tiempo.
En una sola frase, es un repositorio de información integrada que puede estar disponible para consultas y análisis.
2) ¿Qué es ¿Inteligencia de negocios?
Business Intelligence también se conoce como DSS: sistema de soporte de decisiones que se refiere a las tecnologías, aplicaciones y prácticas para la recopilación, integración y análisis de información o datos relacionados con el negocio. Incluso, ayuda a ver los datos en la propia información.
Descarga gratuita de PDF: Preguntas y respuestas de la entrevista sobre el almacén de datos
3) ¿Qué es la tabla de dimensiones?
La tabla de dimensiones es una tabla que contiene atributos de medidas almacenadas en tablas de hechos. Esta tabla consta de jerarquías, categorías y lógica que se puede utilizar para recorrer los nodos.
4) ¿Qué es la tabla de hechos?
La tabla de hechos contiene la medición de los procesos comerciales y contiene claves externas para las tablas de dimensiones.
Ejemplo: si el proceso comercial es la fabricación de ladrillos
Número promedio de ladrillos producidos por una persona/máquina: medida del proceso comercial
5) ¿Cuáles son las etapas del Datawarehousing?
Hay cuatro etapas de Datawarehousing:
- Base de datos operativa fuera de línea
- Almacén de datos fuera de línea
- Almacén de datos en tiempo real
- Almacén de datos integrado
6) ¿Qué es la minería de datos?
La minería de datos está configurada para ser un proceso de análisis de los datos en diferentes dimensiones o perspectivas y resumir en una información útil. Se pueden consultar y recuperar los datos de la base de datos en su propio formato.
7) ¿Qué es OLTP?
OLTP se abrevia como Procesamiento de transacciones en línea, y es una aplicación que modifica los datos cada vez que los recibe y tiene una gran cantidad de usuarios simultáneos.
8) ¿Qué es OLAP?
OLAP se abrevia como Procesamiento analítico en línea y está configurado para ser un sistema que recopila, administra y procesa datos multidimensionales con fines de análisis y administración.
9) ¿Cuál es la diferencia entre OLTP y OLAP?
Las siguientes son las diferencias entre OLTP y OLAP:
OLTP | OLAP |
Los datos son de la fuente de datos original | Los datos provienen de varias fuentes de datos. |
Consultas simples por parte de los usuarios | Consultas complejas por sistema |
Pequeña base de datos normalizada | Gran base de datos desnormalizada |
Tareas comerciales fundamentales | Tareas comerciales multidimensionales |
10) ¿Qué es SAO?
ODS se abrevia como almacén de datos operativos y es un depósito de datos operativos en tiempo real en lugar de datos de tendencias a largo plazo.
11) ¿Cuál es la diferencia entre Vista y Vista materializada?
Una vista no es más que una tabla virtual que toma el resultado de la consulta y se puede usar en lugar de tablas.
Una vista materializada no es más que un acceso indirecto a los datos de la tabla al almacenar los resultados de una consulta en un esquema separado.
12) ¿Qué es ETL?
ETL se abrevia como Extraer, Transformar y Cargar. ETL es un software que se utiliza para leer los datos de la fuente de datos especificada y extrae un subconjunto de datos deseado. Luego, transforma los datos usando reglas y tablas de búsqueda y los convierte al estado deseado.
Luego, la función de carga se utiliza para cargar los datos resultantes en la base de datos de destino.
13) ¿Qué es VLDB?
VLDB se abrevia como base de datos muy grande y su tamaño se establece en más de un terabyte de base de datos. Estos son sistemas de soporte de decisiones que se utilizan para servir a una gran cantidad de usuarios.
14) ¿Qué es el almacenamiento de datos en tiempo real?
El almacenamiento de datos en tiempo real captura los datos comerciales siempre que ocurren. Cuando se complete una actividad comercial, esos datos estarán disponibles en el flujo y estarán disponibles para su uso al instante.
15) ¿Qué son las tablas de agregados?
Las tablas agregadas son las tablas que contienen los datos de almacén existentes que se han agrupado en cierto nivel de dimensiones. Es fácil recuperar datos de las tablas agregadas que la tabla original que tiene más registros.
Esta tabla reduce la carga en el servidor de la base de datos y aumenta el rendimiento de la consulta.
16) ¿Qué son las tablas de hechos sin hechos?
Una tabla de hechos sin hechos es la tabla de hechos que no contiene una columna de hechos numéricos en la tabla de hechos.
17) ¿Cómo podemos cargar la dimensión del tiempo?
Las dimensiones de tiempo generalmente se cargan a través de todas las fechas posibles en un año y se puede hacer a través de un programa. Aquí, 100 años se pueden representar con una fila por día.
18) ¿Qué son los hechos no aditivos?
Se dice que los hechos no adictivos son hechos que no se pueden resumir para ninguna de las dimensiones presentes en la tabla de hechos. Si hay cambios en las dimensiones, los mismos hechos pueden ser útiles.
19) ¿Qué es el hecho conformado?
El hecho conformado es una tabla que se puede usar en múltiples data marts en combinación con las tablas de hechos múltiples.
20) ¿Qué es Datamart?
Un Datamart es una versión especializada de Datawarehousing y contiene una instantánea de datos operativos que ayuda a la gente de negocios a decidir con el análisis de tendencias y experiencias pasadas. Un data mart ayuda a enfatizar el fácil acceso a la información relevante.
21) ¿Qué es el almacenamiento de datos activo?
Un almacén de datos activo es un almacén de datos que permite a los responsables de la toma de decisiones dentro de una empresa u organización gestionar las relaciones con los clientes de forma eficaz y eficiente.
22) ¿Cuál es la diferencia entre Datawarehouse y OLAP?
El almacén de datos es un lugar donde se almacenan todos los datos para su análisis, pero OLAP se utiliza para analizar los datos, administrar agregaciones y dividir la información en información de nivel menor.
23) ¿Qué es el diagrama ER?
El diagrama ER se abrevia como diagrama Entidad-Relación que ilustra las interrelaciones entre las entidades en la base de datos. Este diagrama muestra la estructura de cada tabla y los enlaces entre las tablas.
24) ¿Cuáles son las columnas clave en las tablas de hechos y dimensiones?
Las claves foráneas de las tablas de dimensiones son claves primarias de las tablas de entidades. Las claves foráneas de las tablas de hechos son las claves primarias de las tablas de dimensiones.
25) ¿Qué es la ECF?
SCD se define como dimensiones que cambian lentamente y se aplica a los casos en los que el registro cambia con el tiempo.
26) ¿Cuáles son los tipos de SCD?
Hay tres tipos de SCD y son los siguientes:
SCD 1: el nuevo registro reemplaza el registro original
SCD 2: se agrega un nuevo registro a la tabla de dimensiones del cliente existente
SCD 3: se modifica un dato original para incluir datos nuevos
27) ¿Qué es el esquema BUS?
El esquema BUS consiste en un conjunto de dimensiones confirmadas y definición estandarizada si hay tablas de hechos.
28) ¿Qué es el esquema estelar?
El esquema en estrella no es más que un tipo de organización de las tablas de tal manera que el resultado se puede recuperar rápidamente de la base de datos en el entorno del almacén de datos.
29) ¿Qué es el esquema de copo de nieve?
Esquema de copo de nieve que tiene una tabla de dimensiones principal a la que se pueden unir una o más dimensiones. La tabla de dimensiones principal es la única tabla que se puede unir con la tabla de hechos.
30) ¿Qué es una dimensión central?
La dimensión principal no es más que una tabla de dimensiones que se usa como dedicada para tablas de hechos únicos o datamart.
31) ¿A qué se llama limpieza de datos?
El nombre en sí implica que es un término que se explica por sí mismo. Limpieza de registros huérfanos, incumplimiento de las reglas comerciales de datos, datos inconsistentes e información faltante en una base de datos.
32) ¿Qué son los metadatos?
Los metadatos se definen como datos sobre los datos. Los metadatos contienen información como el número de columnas utilizadas, el ancho fijo y el ancho limitado, el orden de los campos y los tipos de datos de los campos.
33) ¿Qué son los bucles en Datawarehousing?
En el almacenamiento de datos, existen bucles entre las tablas. Si hay un bucle entre las tablas, la generación de la consulta llevará más tiempo y creará ambigüedad. Se recomienda evitar bucles entre las tablas.
34) ¿La tabla de dimensiones puede tener un valor numérico?
Sí, la tabla de dimensiones puede tener valor numérico ya que son los elementos descriptivos de nuestro negocio.
35) ¿Cuál es la definición de Cube en Datawarehousing?
Los cubos son representaciones lógicas de datos multidimensionales. El borde del cubo tiene los miembros de dimensión y el cuerpo del cubo contiene los valores de datos.
36) ¿A qué se llama Modelado Dimensional?
El modelado dimensional es un concepto que pueden utilizar los diseñadores de almacenes de datos para construir su propio almacén de datos. Este modelo se puede almacenar en dos tipos de tablas: tablas de hechos y dimensiones.
La tabla de hechos tiene hechos y medidas del negocio y la tabla de dimensiones contiene el contexto de las medidas.
37) ¿Cuáles son los tipos de Modelado Dimensional?
Los siguientes son los Tipos de dimensiones en el almacén de datos:
- Dimensión conformada
- Dimensión del estabilizador
- Dimensión reducida
- Dimensión de juego de roles
- Tabla de dimensión a dimensión
- Dimensión basura
- Dimensión degenerada
- Dimensión intercambiable
- Dimensión de paso
38) ¿Qué es la clave sustituta?
La clave sustituta no es más que un sustituto de la clave primaria natural. Está configurado para ser un identificador único para cada fila que se puede usar para la clave principal de una tabla.
39) ¿Cuál es la diferencia entre Modelado ER y Modelado Dimensional?
El modelado ER tendrá un modelo lógico y físico, pero el modelado dimensional solo tendrá un modelo físico.
El modelado ER se usa para normalizar el diseño de la base de datos OLTP, mientras que el modelado dimensional se usa para desnormalizar el diseño ROLAP y MOLAP.
40) ¿Cuáles son los pasos para construir el almacén de datos?
Los siguientes son los pasos a seguir para construir el datawaerhouse:
- Recopilación de requisitos comerciales.
- Identificar las fuentes necesarias
- identificando los hechos
- Definición de las dimensiones
- Definición de los atributos
- Redefina las dimensiones y atributos si es necesario
- Organizar la jerarquía de atributos
- Definir relaciones
- Asignar identificadores únicos
41) ¿Cuáles son los diferentes tipos de almacenamiento de datos?
Los siguientes son los diferentes tipos de Datawarehousing:
- Almacenamiento de datos empresarial
- Almacén de datos operativos
- Data Mart
42) ¿Qué se debe hacer al iniciar la base de datos?
Lo siguiente debe hacerse para iniciar la base de datos:
- Iniciar una instancia
- Montar la base de datos
- Abre la base de datos
43) ¿Qué se debe hacer cuando se cierra la base de datos?
Lo siguiente debe hacerse cuando la base de datos está cerrada:
- Cerrar la base de datos
- Desmontar la base de datos
- Cerrar la instancia
44) ¿Podemos hacer una copia de seguridad cuando se abre la base de datos?
Sí, podemos realizar una copia de seguridad completa cuando se abre la base de datos.
45) ¿Qué se define como Backup Parcial?
Una copia de seguridad parcial en un sistema operativo es una copia de seguridad inferior a la copia de seguridad completa y se puede realizar mientras la base de datos está abierta o apagada.
46) ¿Cuál es el objetivo de Optimizer?
El objetivo de Optimizer es encontrar la manera más eficiente de ejecutar el SQL Declaraciones.
47) ¿Qué es el Plan de Ejecución?
El Plan de Ejecución es un plan que se utiliza para que el optimizador seleccione la combinación de los pasos.
48) ¿Cuáles son los enfoques utilizados por Optimizer durante el plan de ejecución?
Hay dos enfoques:
- Basado en reglas
- Basado en costos
49) ¿Cuáles son las herramientas disponibles para ETL?
Las siguientes son las herramientas ETL disponibles:
informática
Etapa de Datos
Oracle
Constructor de almacenes
Ab inicio
Unión de datos
50) ¿Cuál es la diferencia entre metadatos y diccionario de datos?
Los metadatos se definen como datos sobre los datos. Pero, el diccionario de datos contiene información sobre la información del proyecto, gráficos, comandos de abinito e información del servidor.
Estas preguntas de la entrevista también te ayudarán en tu viva(orals)
gracias por la información :)
cómo instalar el software datastage etl tool en mi windows 10
gracias por compartir la información
hii
pls
explicación y teoría del almacén de datos
Información muy útil.. Gracias :)
¡Gracias! muy útil.
Los tipos de SCD no están en la secuencia correcta.
Tipo 0 – Dimensión fija
No se permiten cambios, la dimensión nunca cambia
Tipo 1: sin historial
Actualizar registro directamente, no hay registro de valores históricos, el único estado actual
Tipo 2: control de versiones de filas
Realice un seguimiento de los cambios como registros de versión con bandera actual y fechas activas y otros metadatos
Tipo 3: columna de valor anterior
Realice un seguimiento de los cambios en un atributo específico, agregue una columna para mostrar el valor anterior, que se actualiza a medida que se producen más cambios
Tipo 4 – Tabla de historial
Muestra el valor actual en la tabla de dimensiones pero realiza un seguimiento de todos los cambios en una tabla separada
Tipo 6: SCD híbrido
Utilice técnicas de SCD Tipos 1, 2 y 3 para realizar un seguimiento del cambio
Gracias .. Esto es útil
Útil para revisar :)
Muchas Gracias
Es muy útil para compartir cosas buenas con la gente.
¡Necesito ayuda para discutir esta pregunta!
P: Una mega tienda lo contrata como ingeniero interno de dataware. ¿Cómo puede usar la regla de asociación de minería de datos para aumentar la venta de la mega tienda?
44. ¿Podemos hacer una copia de seguridad cuando se abre la base de datos?
Sí, podemos realizar una copia de seguridad completa cuando se abre la base de datos. Se llama copia de seguridad en caliente...
q 37 es incorrecto
Hola, gracias por compartir tus pensamientos. esta actualizado..
Muy bien señor.
Gracias por proporcionar preguntas valiosas y respuestas fáciles de entender.
gracias me ayudo mucho
Es muy bueno gracias Me ayuda mucho.
facil de entender gracias
Gracias, me ayudó.
En general información muy útil, gracias.