데이터 웨어하우스의 기본 기능은 다음과 같습니다. 1. 데이터 추출 및 동기화, 데이터 정리, 데이터 변환을 포함한 ETL 설계 2. 일반적으로 ODS 계층, CM 계층 및 ML 계층으로 구분되는 데이터 계층화; . 예비 데이터 구축 금형.
이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.
데이터 웨어하우스(Data Warehouse), 영어 이름은 Data Warehouse이며, 줄여서 DW 또는 DWH로 표기할 수 있습니다. 데이터 웨어하우스는 기업의 모든 수준에서 의사 결정 프로세스를 위한 모든 유형의 데이터에 대한 지원을 제공하는 전략적 컬렉션입니다. 이는 분석 보고 및 의사결정 지원 목적으로 생성된 단일 데이터 저장소입니다. 비즈니스 인텔리전스가 필요한 기업을 위해 비즈니스 프로세스 개선, 모니터링 시간, 비용, 품질 및 제어에 대한 지침을 제공합니다.
데이터 웨어하우스의 기본 기능
ETL 설계: 데이터 추출 및 동기화, 데이터 정리, 데이터 변환. 관계형 데이터베이스(mysql, mariadb, oracle 등) 및 문서 데이터베이스(mongodb, elasticsearch 등) 관련.
데이터 계층화: 일반적으로 ODS 계층, CM 계층, ML 계층으로 구분됩니다. ODS 계층은 처리되지 않은 데이터를 나타냅니다. CM 레이어는 정리 및 병합 레이어의 데이터를 나타냅니다.
예비 데이터 모델링: 데이터 계층적 ML 레이어에 해당하는 관계형 모델(눈송이 모델) 또는 스타 모델은 일반적으로 외부 데이터 지원을 제공하기 위해 넓은 테이블을 구성하는 데 사용됩니다.
관련 기술: HDFS, HIVE, HBASE, MR, SPARK, YARN 등
데이터 웨어하우스 아키텍처
아래 그림은 참고용으로만 작업중인 여러 기업의 데이터 아키텍처를 참고하여 계획한 데이터 아키텍처를 보여줍니다.
더 많은 관련 지식은 FAQ 칼럼을 방문해 주세요!
위 내용은 데이터 웨어하우스의 기본 기능은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!