뛰어난 기능은 "대량 데이터 지원"과 "빠른 검색 기술"입니다. 데이터 웨어하우스는 의사 결정 지원 시스템 및 온라인 분석 응용 데이터 소스를 위한 구조화된 데이터 환경으로, 데이터베이스는 데이터가 저장되고 데이터 검색을 지원하는 전체 데이터 웨어하우스 환경의 핵심으로 조작 데이터베이스에 비해 탁월합니다. 대용량 데이터와 빠른 검색 기술을 지원하는 것이 특징입니다.
이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.
운영 중인 데이터베이스에 비해 데이터 웨어하우스의 뛰어난 특징은 '대량 데이터 지원'과 '빠른 검색 기술'입니다.
데이터 웨어하우스(Data Warehouse), 영어 이름은 Data Warehouse이며, 줄여서 DW 또는 DWH로 표기할 수 있습니다. 데이터 웨어하우스는 기업의 모든 수준에서 의사 결정 프로세스를 위한 모든 유형의 데이터에 대한 지원을 제공하는 전략적 컬렉션입니다. 이는 분석 보고 및 의사결정 지원 목적으로 생성된 단일 데이터 저장소입니다. 비즈니스 인텔리전스가 필요한 기업을 위해 비즈니스 프로세스 개선, 모니터링 시간, 비용, 품질 및 제어에 대한 지침을 제공합니다.
데이터 웨어하우스는 의사결정 지원 시스템(dss) 및 온라인 분석 애플리케이션 데이터 소스를 위한 구조화된 데이터 환경입니다. 데이터 웨어하우징은 데이터베이스에서 정보를 얻는 문제를 연구하고 해결합니다. 데이터 웨어하우스는 주제 지향성, 통합성, 안정성 및 시간 가변성을 특징으로 합니다.
데이터 웨어하우스의 특징
데이터 웨어하우스는 이미 많은 수의 데이터베이스가 존재할 때 데이터 리소스의 추가 마이닝 및 의사 결정 요구를 위해 생성됩니다. 데이터 웨어하우스 솔루션을 구축하는 목적은 프런트엔드 쿼리 및 분석을 위한 기반 역할을 하는 것입니다. 중복성이 크기 때문에 필요한 스토리지도 큽니다. 프런트 엔드 애플리케이션을 더 잘 제공하기 위해 데이터 웨어하우스는 종종 다음과 같은 특성을 갖습니다.
1 효율성이 충분히 높습니다.
데이터 웨어하우스의 분석 데이터는 일반적으로 일, 주, 월, 분기, 연도 등으로 구분됩니다. 일별 주기 데이터는 가장 높은 효율성을 요구한다고 볼 수 있습니다. 고객이 어제의 데이터를 내에서 볼 수 있어야 한다는 것입니다. 24시간, 심지어 12시간까지 데이터 분석이 가능합니다. 일부 기업에서는 매일 많은 양의 데이터를 보유하고 있기 때문에 제대로 설계되지 않은 데이터 웨어하우스로 인해 문제가 발생하는 경우가 많으며, 1~3일의 지연 후에만 데이터를 제공할 수 있으므로 이는 당연히 불가능합니다.
2. 데이터 품질.
데이터 웨어하우스에서 제공하는 다양한 정보는 정확한 데이터여야 하지만, 데이터 웨어하우스 프로세스는 일반적으로 데이터 정리, 로딩, 쿼리, 표시 등 여러 단계로 나누어져 있기 때문에 복잡한 아키텍처에는 더 많은 레이어가 있습니다. 그러면 데이터 소스에 더티 데이터가 포함되어 있거나 코드가 엄격하지 않아 데이터 왜곡이 발생할 수 있으며, 고객이 잘못된 정보를 보게 되면 분석을 통해 잘못된 결정을 내려 이익이 되기는커녕 손실을 입을 수도 있습니다.
3. 확장성.
일부 대규모 데이터 웨어하우스 시스템 아키텍처가 복잡한 이유는 향후 3~5년 간의 확장성을 고려하기 때문입니다. 이렇게 하면 데이터 웨어하우스 시스템을 재구축하는 데 많은 비용을 들이지 않고도 안정적으로 실행할 수 있습니다. 미래에는 데이터 웨어하우스 시스템이 너무 빨리 발전할 것입니다. 주로 데이터 모델링의 합리성에 반영되며, 데이터 웨어하우스 솔루션에 중간 계층이 더 있어 대규모 데이터 흐름에 충분한 버퍼가 있어 데이터 양이 훨씬 더 커지지 않고 실행할 수 없게 됩니다. .
위의 소개에서 볼 수 있듯이 데이터 웨어하우스 기술은 기업이 수년간 축적한 데이터를 깨울 수 있습니다. 이는 기업을 위해 이러한 대규모 데이터를 관리할 뿐만 아니라 데이터의 잠재적 가치를 활용하여 하이라이트 중 하나가 됩니다. 통신 기업 운영 및 유지 관리 시스템.
대체로 데이터 웨어하우스 기반 의사결정 지원 시스템은 데이터 웨어하우스 기술, 온라인 분석 처리 기술, 데이터 마이닝 기술의 세 가지 구성 요소로 구성됩니다. 이 시리즈의 다음 기사에서는 데이터 웨어하우스 기술이 핵심입니다. 이 기사에서는 데이터 웨어하우스 기술을 중심으로 현대 데이터 웨어하우스의 주요 기술과 데이터 처리의 주요 단계를 소개하고 이러한 기술을 사용하여 통신 운영 및 유지 관리 시스템의 운영 및 유지 관리를 돕는 방법에 대해 논의합니다.
4. 주제 중심
운영 데이터베이스의 데이터 구성은 트랜잭션 처리 작업을 지향합니다. 각 비즈니스 시스템은 서로 분리되어 있으며 데이터 웨어하우스의 데이터는 특정 주제 영역에 따라 구성됩니다. 테마는 전통적인 데이터베이스의 응용 지향적 성격에 해당하며, 기업 정보 시스템의 데이터를 더 높은 수준에서 합성, 분류, 분석 및 활용하는 추상적인 개념입니다. 각 테마는 거시 분석 영역에 해당합니다. 데이터 웨어하우스는 의사 결정에 도움이 되지 않는 데이터를 제거하고 특정 주제에 대한 간결한 보기를 제공합니다.
데이터 웨어하우스 구성
데이터 추출 도구
다양한 저장 방식에서 데이터를 꺼내어 필요한 변환과 정리를 수행한 후 데이터 웨어하우스에 저장합니다. 다양한 데이터 저장 방법에 접근하는 능력은 데이터 추출 도구의 핵심입니다. COBOL 프로그램, MVS 작업 제어 언어(JCL), UNIX 스크립트, SQL 문을 생성하여 다양한 데이터에 접근할 수 있어야 합니다. 데이터 변환에는 의사결정 애플리케이션에 의미가 없는 데이터 세그먼트 삭제, 통합된 데이터 이름 및 정의로 변환, 누락된 데이터에 기본값 할당, 다양한 데이터 정의 방법 통합이 포함됩니다.
Database
는 데이터가 저장되고 데이터 검색을 지원하는 전체 데이터 웨어하우스 환경의 핵심입니다. 조작형 데이터베이스에 비해 대용량 데이터 지원과 빠른 검색 기술이 뛰어난 특징이다.
Metadata
메타데이터는 데이터 웨어하우스에 있는 데이터의 구조와 생성 방식을 기술하는 데이터입니다. 이는 용도에 따라 기술적 메타데이터와 상업적 메타데이터의 두 가지 범주로 나눌 수 있습니다.
기술 메타데이터는 데이터 웨어하우스 설계자와 관리자가 데이터 웨어하우스 사용을 개발하고 일상적으로 관리하는 데 사용하는 데이터입니다. 포함 사항: 데이터 소스 정보, 데이터 웨어하우스의 개체 및 데이터 구조 정의, 소스 데이터와 대상 데이터의 매핑, 데이터 가져오기 기록 기록, 정보 공개 이력 등
비즈니스 메타데이터는 상업적인 비즈니스 관점에서 데이터 웨어하우스의 데이터를 설명합니다. 포함: 비즈니스 주제, 포함된 데이터, 쿼리 및 보고서에 대한 설명
메타데이터는 데이터 웨어하우스에 액세스하기 위한 정보 디렉토리(정보 디렉토리)를 제공합니다. 이 디렉토리는 데이터 웨어하우스에 있는 데이터와 데이터를 얻는 방법을 포괄적으로 설명합니다. , 그리고 이 데이터에 접근하는 방법. 데이터 웨어하우스 운영 및 유지 관리의 중심입니다. 데이터 웨어하우스 서버는 이를 사용하여 데이터를 저장하고 업데이트하며, 사용자는 이를 사용하여 데이터를 이해하고 액세스합니다.
데이터 마트
특정 응용 목적이나 응용 범위에 따라 데이터 웨어하우스와 독립된 데이터의 일부입니다. 부서 데이터 또는 주제 데이터(주제 영역)라고도 합니다. 데이터 웨어하우스 구현 과정에서 한 부서의 데이터 마트로 시작한 다음 여러 데이터 마트를 사용하여 완전한 데이터 웨어하우스를 형성하는 경우가 많습니다. 주목해야 할 점은 서로 다른 데이터 마트를 구현할 때 동일한 의미를 가진 필드 정의가 호환되어야 향후 데이터 웨어하우스를 구현할 때 큰 문제가 발생하지 않도록 해야 한다는 것입니다.
데이터 마트 제품에 대한 해외의 유명한 Garnter 보고서에 따르면 1사분면의 민첩한 비즈니스 인텔리전스 제품에는 QlikView, Tableau 및 SpotView가 포함되며, 이들은 모두 빅데이터 측면에서 볼 때 풀 메모리 컴퓨팅 데이터 마트 제품입니다. Giants는 기존 비즈니스 인텔리전스 제품보다 경쟁력이 높습니다. 국내 BI 제품은 늦게 시작되었습니다. 잘 알려진 민첩한 비즈니스 인텔리전스 제품에는 PowerBI, Yonghong Technology의 Z-Suite, SmartBI, FineBI 비즈니스 인텔리전스 소프트웨어 등이 있습니다. 그중 Yonghong Technology의 Z-Data Mart는 핫 메모리 컴퓨팅 데이터 마켓 제품입니다. 국내데온정보는 데이터마트 제품의 시스템 통합업체이기도 합니다.
데이터 웨어하우스 관리
데이터 업데이트 추적, 메타데이터 관리 및 업데이트, 데이터 삭제, 분할 및 복구 ; 저장 관리.
정보 게시 시스템
데이터 웨어하우스의 데이터나 기타 관련 데이터를 다른 위치나 사용자에게 보냅니다. 웹 기반 정보 게시 시스템은 다중 사용자 액세스를 처리하는 가장 효과적인 방법입니다.
액세스 도구
는 사용자에게 데이터 웨어하우스에 액세스할 수 있는 수단을 제공합니다. 데이터 쿼리 및 보고 도구, 관리 정보 시스템(EIS) 도구, 데이터 마이닝 도구가 있습니다.
관련 지식이 더 궁금하시다면 FAQ 칼럼을 방문해 주세요!
위 내용은 운영 데이터베이스와 비교하여 데이터 웨어하우스의 뛰어난 기능은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!