ホームページ よくある問題 データウェアハウスに必要なテクノロジーとは

データウェアハウスに必要なテクノロジーとは

May 07, 2019 am 10:24 AM
データベース

データ ウェアハウス技術 (データ ウェアハウス) は、情報システム ビジネスの発展のニーズに基づいてデータベース システム技術をベースに開発され、徐々に独立しつつある一連の新しいアプリケーション技術です。データ ウェアハウスには、OLTP と OLAP という 2 つの主要なテクノロジがあります。以下でそれらを分析しましょう:

データウェアハウスに必要なテクノロジーとは

## 1. OLTP と OLAP

OLTP の正式名は Online Transaction Processing で、主にトランザクション処理に従来のリレーショナル データベースを使用します。 OLTP の中核となる要件は、単一レコードの効率的かつ高速な処理であり、インデックス技術やサブデータベース、サブテーブルなどの最も基本的な要件は、この問題を解決することです。

OLAP の正式名称は Online Analytical Processing です。OLAP は大量のデータを処理およびカウントできます。データの追加、削除、変更、同時実行制御を考慮する必要がある OLTP データベースとは異なり、OLAP データは一般的にデータ クエリ リクエストの処理のみが必要です。インポートはバッチでインポートされるため、列ストレージ、列圧縮、ビットマップ インデックス作成などのテクノロジによってリクエストへの応答を大幅に高速化できます。

##2. OLTP データと OLAP データの単純な比較

データウェアハウスに必要なテクノロジーとは##3. データ ウェアハウスの論理アーキテクチャ設計

オフライン データ ウェアハウスは通常、次元モデリング理論に基づいて構築されます。オフライン データ ウェアハウスは通常、論理的に階層化されています。単語のセグメンテーションは主に次の考慮事項に基づいています:

1. 分離: ユーザーはデータを使用する必要がありますビジネス システムからの生データではなく、データ チームによって慎重に処理されたデータが使用されるため、最初の利点は、ユーザーがビジネスの観点から慎重に準備され、標準化されたクリーンなデータを使用できることです。非常に理解しやすく、使いやすい。第 2 に、上流のビジネス システムが変更または再構築された場合 (テーブル構造、フィールド、ビジネスの意味など)、データ チームはこれらすべての変更を処理し、下流ユーザーへの影響を最小限に抑える責任を負います。

2. パフォーマンスと保守性: 専門家は専門的なことを行います。データ階層化により、データ処理は基本的にすべてデータ チーム内で行われるため、同じビジネス ロジックを繰り返し実行する必要がなく、対応するストレージが節約されます。オーバーヘッド。さらに、データ階層化により、データ ウェアハウスのメンテナンスも明確かつ便利になります。各レイヤーは、独自のタスクのみを担当します。特定のレイヤーでデータ処理に問題がある場合は、そのレイヤーを変更するだけで済みます。

3. 標準化: 企業や組織にとって、データの品質は非常に重要です。誰もが指標について話すとき、それは明確で認識された品質に基づいていなければなりません。外観、フィールド、指標は、標準化する。

4. ODS レイヤー: データ ウェアハウス ソース システムのデータ テーブルは、通常、そのままの状態で保存されます。これは、ODS (オペレーション データ ストア) レイヤーと呼ばれます。ODS レイヤーは、準備領域 (ステージング領域) とも呼ばれます。 )、これらは後続のデータ ウェアハウス レイヤー (つまり、キンボール ディメンション モデリングに基づいて生成されたファクト テーブルおよびディメンション テーブル レイヤー、およびこれらのファクト テーブルと詳細テーブルに基づいて処理されたサマリー レイヤー データ) によって処理されるデータのソースです。同時に、ODS レイヤーには履歴増分データまたは完全データも保存されます。

5. DWD レイヤーと DWS レイヤー: データ ウェアハウス詳細 (DWD) とデータ ウェアハウス概要 (DWS) は、データ ウェアハウスの主要なコンテンツです。 DWD 層と DWS 層のデータは、ETL のクリーニング、変換、ロード後に ODS 層によって生成され、通常はキンボールの次元モデリング理論に基づいて構築され、各サブトピックの次元は一貫した次元とデータ バスを通じて保証されます。一貫性。

6. アプリケーション層 (ADS): アプリケーション層は主に、DWD および DWS に基づいて各事業または部門によって構築されるデータ マート (DM) であり、データ マート DM は DWD および DWS と相対的なものです。倉庫(DW)。一般的にアプリケーション層のデータはDW層から取得されますが、ODS層への直接アクセスは原則として認められません。さらに、DW レイヤーと比較して、アプリケーション レイヤーには、部門または関係者自身が関心を持つ詳細および概要レイヤーのデータのみが含まれます。

以上がデータウェアハウスに必要なテクノロジーとはの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

MySQL 開発を通じてデータ処理とデータ ウェアハウスにおけるプロジェクトの経験を共有する MySQL 開発を通じてデータ処理とデータ ウェアハウスにおけるプロジェクトの経験を共有する Nov 03, 2023 am 09:39 AM

今日のデジタル時代では、データは一般に企業の意思決定の基礎および資本であると考えられています。ただし、大量のデータを処理し、信頼できる意思決定支援情報に変換するプロセスは簡単ではありません。この時点で、データ処理とデータ ウェアハウジングが重要な役割を果たし始めます。この記事では、MySQL 開発を通じてデータ処理とデータ ウェアハウスを実装したプロジェクトの経験を共有します。 1. プロジェクトの背景 このプロジェクトは、営利企業のデータ構築のニーズに基づいており、データ処理とデータ ウェアハウスを通じてデータの集約、一貫性、クリーンアップ、信頼性を実現することを目的としています。この実装のデータ

Go 言語で Hive を使用して効率的なデータ ウェアハウスを実装する Go 言語で Hive を使用して効率的なデータ ウェアハウスを実装する Jun 15, 2023 pm 08:52 PM

近年、データ ウェアハウスは企業のデータ管理に不可欠な部分となっています。データ分析にデータベースを直接使用すると、単純なクエリのニーズを満たすことができますが、大規模なデータ分析を実行する必要がある場合、単一のデータベースではニーズを満たすことができなくなり、大量のデータを処理するデータ ウェアハウスを使用する必要があります。 。 Hive は、データ ウェアハウス分野で最も人気のあるオープン ソース コンポーネントの 1 つで、Hadoop 分散コンピューティング エンジンと SQL クエリを統合し、大量のデータの並列処理をサポートできます。同時に、Go 言語では次を使用します。

統合データ ウェアハウスを使用してデータ サイロを解消: Apache Doris に基づく CDP 統合データ ウェアハウスを使用してデータ サイロを解消: Apache Doris に基づく CDP Mar 20, 2024 pm 01:47 PM

企業のデータ ソースがますます多様化するにつれ、データ サイロの問題が一般的になってきました。保険会社が顧客データ プラットフォーム (CDP) を構築する場合、コンポーネント集約型のコンピューティング レイヤーと、データ サイロによって引き起こされる分散したデータ ストレージの問題に直面します。これらの問題を解決するために、Apache Doris ベースの CDP 2.0 を採用し、Doris の統合データ ウェアハウス機能を使用してデータ サイロを打破し、データ処理パイプラインを簡素化し、データ処理効率を向上させました。

Go 言語はクラウド上のデータ ウェアハウスとデータ分析アプリケーションをどのようにサポートしますか? Go 言語はクラウド上のデータ ウェアハウスとデータ分析アプリケーションをどのようにサポートしますか? May 17, 2023 pm 04:51 PM

近年、クラウド コンピューティング テクノロジーの継続的な発展に伴い、クラウド上のデータ ウェアハウスとデータ分析がますます多くの企業の関心事となっています。効率的で習得しやすいプログラミング言語である Go 言語は、クラウド上のデータ ウェアハウスとデータ分析アプリケーションをどのようにサポートしますか? Go 言語のクラウド データ ウェアハウス開発アプリケーション クラウド上でデータ ウェアハウス アプリケーションを開発するには、Go 言語ではさまざまな開発フレームワークとツールを使用でき、通常、開発プロセスは非常に簡単です。その中には、次のような重要なツールがいくつかあります。 1.1GoCloudGoCloud は、

運用データベースと比較したデータ ウェアハウスの優れた機能は何ですか? 運用データベースと比較したデータ ウェアハウスの優れた機能は何ですか? Jul 19, 2022 pm 04:15 PM

優れた特徴は「大量データのサポート」と「高速検索技術」です。データ ウェアハウスは、意思決定支援システムおよびオンライン分析アプリケーション データ ソースのための構造化データ環境であり、データベースはデータ ウェアハウス環境全体の中核であり、データが保存され、データ検索のサポートが提供されます。操作データベースと比較して、優れた機能を備えています。大量データのサポートと高速検索技術が特徴です。

PHP とデータ ウェアハウスの統合 PHP とデータ ウェアハウスの統合 May 16, 2023 pm 11:10 PM

インターネットとビッグデータの急速な発展に伴い、ビジネス開発をサポートする重要なインフラストラクチャとしてデータ ウェアハウスを利用し始めている企業が増えています。人気のプログラミング言語として、PHP は徐々に多くの企業や組織にとって最初の選択肢になってきています。では、PHP をデータ ウェアハウスと統合するにはどうすればよいでしょうか? 1. データウェアハウスの概要 データウェアハウスとは、テーマを核として、一定のデータモデルとデータアーキテクチャに従って構築された大規模なデータストレージシステムを指します。その目的は、データアクセス速度とクエリ効率を向上させることです。

AI および分析プロジェクトが失敗しないようにするにはどうすればよいでしょうか? AI および分析プロジェクトが失敗しないようにするにはどうすればよいでしょうか? May 08, 2023 pm 06:40 PM

2023 年は経済危機と気候リスクが拡大する年であるため、効率性、回復力、その他の重要な取り組みを促進するためのデータ主導型の洞察の必要性が、2023 年の企業にとっての最優先事項となります。多くの企業は、このニーズを満たすために高度な分析と人工知能を導入しようとしています。今、彼らは概念実証を投資収益率につなげなければなりません。多くの企業が、多くの人材と適切なソフトウェアに投資して、大きな進歩を遂げています。しかし、多くの企業の AI および分析プロジェクトは、AI および高度な分析ワークロードをサポートする適切な基盤テクノロジーを備えていないために失敗します。一部の企業は時代遅れのレガシー ハードウェア システムに依存していますが、他の企業はパブリック クラウドの活用に伴うコストと制御の問題によって妨げられています。ほとんどの企業

Java を使用して Hive ベースのデータ ウェアハウス アプリケーションを開発する方法 Java を使用して Hive ベースのデータ ウェアハウス アプリケーションを開発する方法 Sep 21, 2023 pm 04:48 PM

Java を使用して Hive ベースのデータ ウェアハウス アプリケーションを開発する方法 はじめに: 今日のビッグ データ時代において、データ ウェアハウスは企業が大量のデータを保存および処理するための重要なツールです。 Hadoop エコシステムのメンバーとして、Hive はデータ ウェアハウス ソリューションを提供します。この記事の目的は、Java を使用して Hive ベースのデータ ウェアハウス アプリケーションを開発する方法を紹介し、詳細なコード例を提供することです。 1. 準備 開始する前に、次の点を確認する必要があります: Hadoop と Hive をインストールし、それらが適切に実行されていることを確認します。