優れた特徴は「大容量データ対応」と「高速検索技術」です。データ ウェアハウスは、意思決定支援システムおよびオンライン分析アプリケーション データ ソースのための構造化データ環境であり、データベースはデータ ウェアハウス環境全体の中核であり、データが保存され、データ検索のサポートが提供されます。操作データベースと比較して、優れた機能を備えています。大量データのサポートと高速検索技術が特徴です。
このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。
運用データベースと比較したデータウェアハウスの優れた特徴は、「大量データのサポート」と「高速検索技術」です。
データ ウェアハウス、英語名は Data Warehouse で、DW または DWH と略されます。データ ウェアハウスは、企業のあらゆるレベルでの意思決定プロセスのためのあらゆる種類のデータのサポートを提供する戦略的なコレクションです。これは、分析レポートと意思決定支援の目的で作成された単一のデータ ストアです。ビジネス インテリジェンスを必要とする企業に、ビジネス プロセスの改善、監視時間、コスト、品質、管理に関するガイダンスを提供します。
データ ウェアハウスは、意思決定支援システム (dss) およびオンライン分析アプリケーション データ ソースのための構造化データ環境です。データ ウェアハウジングは、データベースから情報を取得する際の問題を研究し、解決します。データ ウェアハウスは、主題の指向性、統合性、安定性、時間の変動性によって特徴付けられます。
データ ウェアハウスの特徴
データ ウェアハウスは、すでに多数のデータベースが存在する場合に、データ リソースのさらなるマイニングと意思決定のニーズに使用されます。生成されるものは、いわゆる「大規模データベース」ではありません。データ ウェアハウス ソリューションを構築する目的は、フロントエンドのクエリと分析の基盤として機能することであり、冗長性が高いため、必要なストレージも大きくなります。フロントエンド アプリケーションをより適切に提供するために、データ ウェアハウスには次のような特徴があることがよくあります:
1. 効率は十分に高いです。
データ ウェアハウスの分析データは通常、日、週、月、四半期、年などに分割されます。日次サイクル データが最も効率を必要とし、24 時間または 24 時間かかることがわかります。 12 時間でも、顧客は昨日のデータ分析を確認できます。一部の企業では毎日大量のデータを保有しているため、データ ウェアハウスの設計が不十分だと問題が頻繁に発生し、データの提供が 1 ~ 3 日遅れてからでないと不可能ですが、これは明らかに不可能です。
2. データ品質。
データ ウェアハウスによって提供されるさまざまな情報は正確である必要がありますが、データ ウェアハウスのプロセスは通常、データのクリーニング、読み込み、クエリ、表示などの複数のステップに分かれているため、アーキテクチャにはより多くの層が含まれるため、データ ソース内の汚れたデータや不正確なコードがデータの歪みを引き起こす可能性があり、顧客が間違った情報を見た場合、分析を通じて間違った決定を下し、利益ではなく損失が発生する可能性があります。
3. 拡張性。
大規模なデータ ウェアハウス システムのアーキテクチャが複雑になるのは、今後 3 ~ 5 年の拡張性を考慮しているためです。この場合、コストをかけて構築する必要はありません。将来的にデータ ウェアハウス システムの再構築が早すぎる場合でも、非常に安定して実行できます。主にデータ モデリングの合理性に反映されており、データ ウェアハウス ソリューションにはさらにいくつかの中間層があり、大規模なデータ フローに十分なバッファーがあり、データ量が大幅に増加して実行できなくなることはありません。 。
上記の紹介からもわかるように、データ ウェアハウス テクノロジーは、企業が長年蓄積してきたデータを覚醒させ、企業の膨大なデータを管理するだけでなく、データの潜在的な価値を活用し、通信事業者向けの運用保守システムも目玉の一つ。
データ ウェアハウスをベースとした意思決定支援システムは、大まかにデータ ウェアハウス技術、オンライン分析処理技術、データ マイニング技術の 3 つのコンポーネントで構成されており、データ ウェアハウス技術がシステムの中核となります。この記事では、データ ウェアハウス テクノロジに焦点を当て、最新のデータ ウェアハウスの主要テクノロジとデータ処理の主な手順を紹介し、通信運用および保守システムの運用および保守を支援するためにこれらのテクノロジを使用する方法について説明します。
4. トピック指向
運用データベースのデータ構成はトランザクション処理タスクを指向しており、各ビジネス システムは互いに分離されており、データはデータ ウェアハウスは、サブジェクト領域ごとに編成されています。このテーマは、従来のデータベースのアプリケーション指向の性質に対応し、企業情報システムのデータをより高いレベルで合成、分類、分析、活用するための抽象的な概念です。各トピックはマクロ分析領域に対応します。データ ウェアハウスは、意思決定に役に立たないデータを削除し、特定の主題についての簡潔なビューを提供します。
データウェアハウスの構成
データ抽出ツール
さまざまなデータからデータを抽出して取り出す保存方法を決定し、必要な変換と整理を行ってから、データ ウェアハウスに保存します。データ抽出ツールの鍵となるのは、さまざまなデータ ストレージ メソッドにアクセスできる機能であり、さまざまなデータにアクセスするための COBOL プログラム、MVS ジョブ制御言語 (JCL)、UNIX スクリプト、および SQL ステートメントを生成できる必要があります。データ変換には、意思決定アプリケーションにとって意味のないデータ セグメントの削除、統一されたデータ名と定義への変換、統計と派生データの計算、欠落データへのデフォルト値の割り当て、および異なるデータ定義方法の統合が含まれます。
データベース
はデータ ウェアハウス環境全体の中核であり、データが保存され、データ取得のサポートが提供されます。操作型データベースと比較して、大規模なデータへの対応と高速な検索技術が優れた特徴です。
メタデータ
メタデータは、データ ウェアハウス内のデータの構造と作成方法を記述するデータです。さまざまな用途に応じて、技術メタデータと商業メタデータの 2 つのカテゴリに分類できます。
技術メタデータは、データ ウェアハウスの設計者と管理者がデータ ウェアハウスの使用を開発し、日常的に管理するために使用するデータです。データ ソース情報、データ変換の説明、データ ウェアハウス内のオブジェクトとデータ構造の定義、データ クリーニングとデータ更新のルール、ソース データから宛先データへのマッピング、ユーザー アクセス権、データ バックアップ履歴、およびデータ インポート 履歴が含まれます。記録、情報公開履歴など。
ビジネス メタデータは、商業ビジネスの観点からデータ ウェアハウス内のデータを記述します。内容: ビジネス トピック、含まれるデータ、クエリ、レポートの説明
メタデータは、データ ウェアハウスにアクセスするための情報ディレクトリ (情報ディレクトリ) を提供します。このディレクトリは、データ ウェアハウスにあるデータを包括的に説明します。データの取得方法とデータへのアクセス方法について説明します。これはデータ ウェアハウスの運用と保守の中心であり、データ ウェアハウス サーバーはデータの保存と更新に使用し、ユーザーはデータの理解とアクセスに使用します。
データ マート
特定のアプリケーション目的またはアプリケーション スコープのデータ ウェアハウスから独立したデータの一部。部門データまたは主題とも呼ばれます。データ (サブジェクト領域)。データ ウェアハウスの実装プロセスでは、多くの場合、1 つの部門のデータ マートから開始し、次に複数のデータ マートを使用して完全なデータ ウェアハウスを形成できます。注意すべき点は、異なるデータマートを実装する場合、将来データウェアハウスを実装する際に大きな支障をきたさないように、同じ意味のフィールド定義には互換性を持たせる必要があることです。
データ マート製品に関する海外の有名な Garnter レポートでは、第 1 象限のアジャイル ビジネス インテリジェンス製品には QlikView、Tableau、SpotView が含まれており、これらはすべてフルメモリ コンピューティングのデータ マート製品です。従来のビジネス インテリジェンス製品の巨人は課題を抱えています。国内の BI 製品は後発であり、アジャイル ビジネス インテリジェンス製品としては、PowerBI、Yonghong Technology の Z-Suite、SmartBI、FineBI ビジネス インテリジェンス ソフトウェアなどが有名ですが、その中でも Yonghong Technology の Z-Data Mart は、メモリ コンピューティング データ市場で注目を集めている製品です。国内デオン情報はデータマート製品のシステムインテグレーターでもあります。
データ ウェアハウス管理
セキュリティと権限の管理、データ更新の追跡、データ品質チェック、メタデータの管理と更新、データ ウェアハウスの使用状況とステータスの監査とレポート、データの削除;データのコピー、分割、配布;バックアップとリカバリ;ストレージ管理。
情報公開システム
データ ウェアハウス内のデータまたはその他の関連データをさまざまな場所またはユーザーに送信します。 Web ベースの情報公開システムは、マルチユーザー アクセスに対処する最も効果的な方法です。
アクセス ツール
ユーザーがデータ ウェアハウスにアクセスする手段を提供します。データ クエリおよびレポート ツール、アプリケーション開発ツール、管理情報システム (EIS) ツール、オンライン分析 (OLAP) ツール、およびデータ マイニング ツールがあります。
関連知識の詳細については、FAQ 列をご覧ください。
以上が運用データベースと比較したデータ ウェアハウスの優れた機能は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。