상위 50 개 데이터웨어 하우스 인터뷰 질문 및 답변
다음은 꿈의 직업을 얻기 위한 신입 지원자와 숙련된 지원자를 위한 데이터 웨어하우스 면접 질문과 답변입니다.
1) 데이터 웨어하우스란 무엇입니까?
DW(데이터 웨어하우징)는 데이터 저장소이며 경영 의사결정 지원 시스템에 사용됩니다. 데이터 웨어하우스는 단일 시점에 높은 수준의 비즈니스 상황을 갖는 다양한 데이터로 구성됩니다.
한 문장으로 쿼리 및 분석이 가능한 통합정보 저장소입니다.
2) 무엇입니까 비즈니스 인텔리전스?
비즈니스 인텔리전스는 DSS(의사결정 지원 시스템)라고도 알려져 있으며 비즈니스 관련 정보 또는 데이터의 수집, 통합 및 분석을 위한 기술, 애플리케이션 및 관행을 의미합니다. 심지어 정보 자체에 대한 데이터를 보는 것도 도움이 됩니다.
무료 PDF 다운로드: 데이터 웨어하우스 인터뷰 질문 및 답변
3) 디멘션 테이블이란?
차원 테이블은 팩트 테이블에 저장된 측정값의 속성을 포함하는 테이블입니다. 이 테이블은 노드를 탐색하는 데 사용할 수 있는 계층, 범주 및 논리로 구성됩니다.
4) 팩트 테이블이란 무엇입니까?
팩트 테이블에는 비즈니스 프로세스 측정값이 포함되어 있으며 차원 테이블에 대한 외래 키가 포함되어 있습니다.
예 – 비즈니스 프로세스가 벽돌 제조인 경우
한 사람/기계가 생산하는 평균 벽돌 수 - 비즈니스 프로세스의 척도
5) 데이터웨어하우징의 단계는 무엇입니까?
데이터웨어하우징에는 XNUMX가지 단계가 있습니다.
- 오프라인 운영 데이터베이스
- 오프라인 데이터 웨어하우스
- 실시간 데이터웨어하우스
- 통합 데이터웨어하우스
6) 데이터 마이닝이란 무엇입니까?
데이터 마이닝은 데이터를 다양한 차원이나 관점에서 분석하고 유용한 정보로 요약하는 프로세스로 설정됩니다. 데이터베이스에서 데이터를 자체 형식으로 쿼리하고 검색할 수 있습니다.
7) OLTP란 무엇입니까?
OLTP는 On-Line Transaction Processing으로 약칭하며, 데이터를 받을 때마다 이를 수정하는 애플리케이션으로 동시 사용자 수가 많다.
8) OLAP이란 무엇입니까?
OLAP은 Online Analytical Process라고 약칭하며, 분석 및 관리 목적으로 다차원 데이터를 수집, 관리, 가공하는 시스템으로 정의됩니다.
9) OLTP와 OLAP의 차이점은 무엇입니까?
OLTP와 OLAP의 차이점은 다음과 같습니다.
OLTP | 올랩 |
---|---|
데이터는 원본 데이터 소스에서 가져온 것입니다. | 데이터는 다양한 데이터 소스에서 가져온 것입니다. |
사용자의 간단한 쿼리 | 시스템별 복잡한 쿼리 |
정규화된 소규모 데이터베이스 | 비정규화된 대규모 데이터베이스 |
기본적인 비즈니스 작업 | 다차원적인 비즈니스 작업 |
10) ODS란 무엇입니까?
ODS는 Operational Data Store로 약칭되며, 장기적인 추세 데이터가 아닌 실시간 운영 데이터를 저장하는 저장소입니다.
11) 뷰와 구체화된 뷰의 차이점은 무엇입니까?
뷰는 쿼리의 출력을 가져오는 가상 테이블일 뿐이며 테이블 대신 사용할 수 있습니다.
구체화된 뷰는 쿼리 결과를 별도의 스키마에 저장하여 테이블 데이터에 대한 간접적인 액세스에 지나지 않습니다.
12) ETL이란 무엇입니까?
ETL은 Extract, Transform, Load로 축약됩니다. ETL은 지정된 데이터 소스에서 데이터를 읽고 원하는 데이터 하위 집합을 추출하는 데 사용되는 소프트웨어입니다. 다음으로 규칙과 조회 테이블을 사용하여 데이터를 변환하고 원하는 상태로 변환합니다.
그런 다음 로드 기능을 사용하여 결과 데이터를 대상 데이터베이스에 로드합니다.
13) VLDB란 무엇입니까?
VLDB는 Very Large Database로 약칭되며 크기는 XNUMXTB 이상의 데이터베이스로 설정됩니다. 이는 다수의 사용자에게 서비스를 제공하는 데 사용되는 의사 결정 지원 시스템입니다.
14) 실시간 데이터웨어하우징이란 무엇입니까?
실시간 데이터웨어하우징은 비즈니스 데이터가 발생할 때마다 이를 캡처합니다. 비즈니스 활동이 완료되면 해당 데이터가 흐름에 제공되어 즉시 사용할 수 있게 됩니다.
15) 집계 테이블이란 무엇입니까?
집계 테이블은 특정 수준의 차원으로 그룹화된 기존 창고 데이터를 포함하는 테이블입니다. 레코드 수가 많은 원본 테이블보다 집계된 테이블에서 데이터를 검색하는 것이 더 쉽습니다.
이 테이블은 데이터베이스 서버의 부하를 줄이고 쿼리 성능을 높입니다.
16) 팩트리스 팩트 테이블이란 무엇입니까?
사실 없는 사실 테이블은 사실 테이블에 숫자 사실 열을 포함하지 않는 사실 테이블입니다.
17) 시간 차원을 어떻게 로드할 수 있나요?
시간 차원은 일반적으로 100년 중 가능한 모든 날짜를 통해 로드되며 프로그램을 통해 수행될 수 있습니다. 여기서는 하루에 한 행씩 XNUMX년을 나타낼 수 있습니다.
18) 비가산적 사실이란 무엇입니까?
중독성이 없는 사실은 사실 테이블에 있는 어떤 차원에 대해서도 요약할 수 없는 사실이라고 합니다. 차원이 변경되면 동일한 사실이 유용할 수 있습니다.
19) 확정사실이란 무엇입니까?
Conformed Fact는 여러 Fact 테이블과 결합하여 여러 데이터 마트에서 사용할 수 있는 테이블입니다.
20) 데이터마트란 무엇입니까?
데이터마트는 데이터웨어하우징의 특화된 버전으로, 과거 동향과 경험을 분석해 비즈니스 담당자가 의사 결정을 내리는 데 도움이 되는 운영 데이터의 스냅샷을 포함하고 있습니다. 데이터 마트는 관련 정보에 대한 쉬운 접근을 강조하는 데 도움이 됩니다.
21) 액티브 데이터웨어하우징이란 무엇입니까?
활성 데이터웨어하우스는 회사 또는 조직 내의 의사결정자가 고객 관계를 효과적이고 효율적으로 관리할 수 있도록 하는 데이터웨어하우스입니다.
22) Datawarehouse와 OLAP의 차이점은 무엇입니까?
데이터웨어하우스는 데이터 전체를 저장해 분석하는 곳이지만 OLAP은 데이터 분석, 집계 관리, 정보를 마이너 레벨 정보로 분할하는 데 사용된다.
23) ER 다이어그램이란 무엇입니까?
ER 다이어그램은 데이터베이스의 엔터티 간의 상호 관계를 설명하는 엔터티-관계 다이어그램으로 축약됩니다. 이 다이어그램은 각 테이블의 구조와 테이블 간의 링크를 보여줍니다.
24) 팩트 및 차원 테이블의 키 열은 무엇입니까?
차원 테이블의 외래 키는 엔터티 테이블의 기본 키입니다. 팩트 테이블의 외래 키는 차원 테이블의 기본 키입니다.
25) SCD 란 무엇입니까?
SCD는 천천히 변화하는 차원으로 정의되며, 시간이 지남에 따라 레코드가 변경되는 경우에 적용됩니다.
26) SCD에는 어떤 종류가 있나요?
SCD에는 세 가지 유형이 있으며 다음과 같습니다.
SCD 1 – 새 레코드가 원래 레코드를 대체합니다.
SCD 2 – 기존 고객 차원 테이블에 새 레코드가 추가됩니다.
SCD 3 – 원본 데이터가 새 데이터를 포함하도록 수정됩니다.
27) BUS 스키마란 무엇입니까?
BUS 스키마는 팩트 테이블이 있는 경우 확인된 차원과 표준화된 정의의 집합으로 구성됩니다.
28) 스타 스키마란 무엇입니까?
스타 스키마는 데이터 웨어하우스 환경에서 데이터베이스로부터 신속하게 결과를 검색할 수 있도록 테이블을 구성하는 형태에 지나지 않습니다.
29) 눈송이 스키마란 무엇입니까?
하나 이상의 차원을 조인할 수 있는 기본 차원 테이블이 있는 눈송이 스키마입니다. 기본 차원 테이블은 사실 테이블과 조인할 수 있는 유일한 테이블입니다.
30) 핵심 차원이란 무엇입니까?
핵심 차원은 단일 팩트 테이블이나 데이터마트 전용으로 사용되는 차원 테이블일 뿐입니다.
31) 데이터 클리닝이란 무엇입니까?
이름 자체는 그것이 자명한 용어임을 의미합니다. 고아 기록 정리, 데이터 위반 비즈니스 규칙, 일관성 없는 데이터 및 데이터베이스의 정보 누락.
32) 메타데이터란 무엇입니까?
메타데이터는 데이터에 대한 데이터로 정의됩니다. 메타데이터에는 사용된 열 수, 고정 너비 및 제한된 너비, 필드 순서 및 필드의 데이터 유형과 같은 정보가 포함됩니다.
33) 데이터웨어하우징의 루프란 무엇입니까?
데이터웨어하우징에서는 테이블 사이에 루프가 존재합니다. 테이블 사이에 루프가 있으면 쿼리 생성에 더 많은 시간이 걸리고 모호성이 발생합니다. 테이블 간의 루프를 피하는 것이 좋습니다.
34) Dimension 테이블이 숫자값을 가질 수 있는지 여부
네, 차원 테이블은 우리 사업을 설명하는 요소이므로 숫자 값을 가질 수 있습니다.
35) 데이터웨어하우징에서 큐브의 정의는 무엇입니까?
큐브는 다차원 데이터를 논리적으로 표현한 것입니다. 큐브의 가장자리에는 차원 멤버가 있고 큐브의 본문에는 데이터 값이 포함되어 있습니다.
36) 차원 모델링이란 무엇입니까?
차원 모델링은 데이터웨어 하우스 설계자가 자신의 데이터웨어하우스를 구축하는 데 사용할 수 있는 개념입니다. 이 모델은 Facts 테이블과 Dimension 테이블이라는 두 가지 유형의 테이블에 저장될 수 있습니다.
팩트 테이블에는 비즈니스의 팩트와 측정값이 포함되고 차원 테이블에는 측정 컨텍스트가 포함됩니다.
37) 차원 모델링의 유형은 무엇입니까?
다음은 데이터 웨어하우스의 차원 유형:
- 준수 치수
- 아우트리거 치수
- 축소된 차원
- 롤플레잉 차원
- 치수 대 치수 테이블
- 정크 차원
- 퇴화된 차원
- 교체 가능한 차원
- 단계 차원
38) 대리키란 무엇인가요?
대리 키는 자연 기본 키를 대체하는 것에 지나지 않습니다. 테이블의 기본 키로 사용할 수 있는 각 행의 고유 식별자로 설정됩니다.
39) ER 모델링과 차원 모델링의 차이점은 무엇입니까?
ER 모델링에는 논리적 모델과 물리적 모델이 있지만 차원 모델링에는 물리적 모델만 있습니다.
ER 모델링은 OLTP 데이터베이스 설계를 정규화하는 데 사용되는 반면, 차원 모델링은 ROLAP 및 MOLAP 설계를 비정규화하는 데 사용됩니다.
40) 데이터웨어 하우스를 구축하는 단계는 무엇입니까?
다음은 데이터워어하우스를 구축하기 위해 따라야 할 단계입니다.
- 비즈니스 요구 사항 수집
- 필요한 소스 식별
- 사실 확인
- 치수 정의
- 속성 정의
- 필요한 경우 차원 및 속성 재정의
- 속성 계층 구성
- 관계 정의
- 고유 식별자 할당
41) 데이터웨어호스팅에는 어떤 유형이 있나요?
다음은 다양한 유형의 데이터웨어하우징입니다.
- 엔터프라이즈 데이터웨어하우징
- 운영 데이터 저장소
- 데이터 마트
42) 데이터베이스를 시작하는 동안 무엇을 해야 합니까?
데이터베이스를 시작하려면 다음을 수행해야 합니다.
- 인스턴스 시작
- 데이터베이스 탑재
- 데이터베이스 열기
43) 데이터베이스가 종료되면 어떻게 해야 합니까?
데이터베이스가 종료되면 다음을 수행해야 합니다.
- 데이터베이스 닫기
- 데이터베이스 분리
- 인스턴스 종료
44) 데이터베이스가 오픈되면 백업을 할 수 있나요?
예, 데이터베이스가 열리면 전체 백업을 수행할 수 있습니다.
45) 부분 백업이란 무엇입니까?
부분 백업 운영 체제 전체 백업이 아닌 백업으로 데이터베이스가 열려 있거나 종료되는 동안 수행할 수 있습니다.
46) Optimizer의 목표는 무엇입니까?
Optimizer의 목표는 가장 효율적인 실행 방법을 찾는 것입니다. SQL 진술.
47) 실행 계획이란 무엇입니까?
실행 계획은 최적화 프로그램이 단계의 조합을 선택하는 데 사용되는 계획입니다.
48) 실행 계획 중에 Optimizer가 사용하는 접근 방식은 무엇입니까?
두 가지 접근 방식이 있습니다.
- 규칙 기반
- 비용 기반
49) ETL에 사용할 수 있는 도구는 무엇입니까?
다음은 사용 가능한 ETL 도구입니다.
정보학
데이터 스테이지
신탁
창고 건설업자
앱 이니티오
데이터 정션
50) 메타데이터와 데이터 사전의 차이점은 무엇인가요?
메타데이터는 데이터에 대한 데이터로 정의됩니다. 하지만 데이터 사전에는 프로젝트 정보, 그래프, abinito 명령 및 서버 정보에 대한 정보가 포함되어 있습니다.
이 인터뷰 질문은 당신의 비바(구술)에도 도움이 될 것입니다.
정보 주셔서 감사합니다 :)
내 windows10에 datastage etl 도구 소프트웨어를 설치하는 방법
정보를 공유해 주셔서 감사합니다
hii
PLS
데이터웨어 하우스 explain and thoery
매우 유용한 정보입니다.. 감사합니다 :)
감사해요! 매우 도움이 되었습니다.
SCD 유형의 순서가 올바르지 않습니다.
유형 0 - 고정 치수
변경이 허용되지 않으며 치수는 변경되지 않습니다.
유형 1 – 기록 없음
기록을 직접 업데이트합니다. 기록 값에 대한 기록이 없으며 유일한 현재 상태입니다.
유형 2 - 행 버전 관리
현재 플래그, 활성 날짜 및 기타 메타데이터를 사용하여 버전 기록으로 변경 사항을 추적합니다.
유형 3 - 이전 값 열
특정 속성에 대한 변경 사항을 추적하고, 추가 변경 사항이 발생하면 업데이트되는 이전 값을 표시하는 열을 추가합니다.
유형 4 – 기록 테이블
차원 테이블에 현재 값을 표시하지만 별도의 테이블에서 모든 변경 사항을 추적합니다.
유형 6 - 하이브리드 SCD
SCD 유형 1, 2, 3의 기술을 활용하여 변경 사항 추적
감사합니다.. 도움이 됩니다
복습에 도움이 됩니다 :)
감사
매우 도움이 됩니다. 사람들에게 좋은 것을 공유하는 데.
이 질문에 대해 논의하려면 도움이 필요합니다!
Q: 당신은 대형 매장에 데이터웨어 하우스 엔지니어로 채용되었습니다. 데이터 마이닝의 연관 규칙을 활용하여 대형 매장의 매출을 높일 수 있는 방법은 무엇입니까?
44. 데이터베이스가 열려 있을 때 백업을 할 수 있나요?
예, 데이터베이스가 열리면 전체 백업을 수행할 수 있습니다. 핫백업이라고 하는데...
q 37이 올바르지 않습니다.
안녕하세요, 귀하의 생각을 공유해 주셔서 감사합니다. 업데이트됩니다..
아주 좋습니다.
귀중한 질문과 이해하기 쉬운 답변을 제공해 주셔서 감사합니다.
감사합니다. 많은 도움이 되었습니다.
정말 좋네요 감사합니다 많은 도움이 됩니다.
이해가 쉽네요 감사합니다
감사합니다. 도움이 되었습니다.
전반적으로 매우 유용한 정보입니다. 감사합니다.