#近年、新たなテクノロジーモデルの登場により、さまざまな業界におけるアプリケーションシナリオの価値が磨き上げられ、それに基づいた製品効果の向上が図られています。大量のデータの蓄積、人工知能アプリケーションは消費、インターネット、その他の分野から発展し、製造、エネルギー、電力などの伝統的な産業に広がります。設計、調達、生産、管理、販売などの経済生産活動の主要なリンクにおけるさまざまな業界の企業における人工知能技術の成熟度と応用は常に向上しており、すべてのリンクでの人工知能の実装と適用が加速しています。産業地位の向上や経営効率の最適化を図るため、徐々に本業と融合させ、自社の優位性をさらに拡大していきます。
人工知能テクノロジーの革新的なアプリケーションの大規模実装により、ビッグデータ インテリジェンス市場の精力的な発展が促進され、基盤となるデータ ガバナンス サービスにも市場の活力が注入されました。 。
ビッグデータ、クラウド コンピューティング、アルゴリズムの発展に伴い、人工知能の流行が始まりました。数年前に誕生し、現在に至るまで多くの産業や分野で広く利用されており、現在進行中の技術革新をリードする技術となっています。そして、急成長を遂げているデータ ガバナンスの分野に人工知能が存在しないはずがありません。データガバナンスと人工知能という一見関係のない言葉ですが、これらを組み合わせるとどのようなストーリーが生まれるのでしょうか?
ビッグデータは、継続的に蓄積、クリーニング、変換され、データ ガバナンスは、ビッグ データを表示するためのより標準化された管理モデルを提供します。現在のほとんどの形式の人工知能は大量のデータ計算を必要とするため、ビッグデータとデータ ガバナンスのサポートと切り離すことができません。人工知能は、ディープラーニングの進化を完了するために、ビッグデータのプラットフォームとテクノロジーに依存する必要があります。
大一部の人工知能は、トレーニングと予測という 2 つのリンクに分かれています。機械学習アルゴリズムの効果は入力データの品質に依存し、入力データに偏りがあると、出力アルゴリズムにも偏りが生じ、得られる結果が使いにくくなる可能性があります。データガバナンスは、データ品質の向上において重要な役割を果たします。データ品質要件を整理し、データ品質検査ルールを定義し、データ品質改善計画を策定し、データ品質管理ツールを設計および実装し、データ品質管理の運用手順とパフォーマンスを監視することにより、企業はクリーンで明確に構造化されたデータを取得し、信頼できるデータを提供できます。ディープラーニングなどの人工知能テクノロジーへの入力。
2. データ ガバナンスにより、人工知能のデータ プライバシーが確保されます
#人工知能の開発が現在直面している最大の制約は、データの所有権とプライバシー保護の問題です。個人のプライバシー データは保護される必要があり、このデータを悪用すると、個人に多大な財産の損失や人身傷害を引き起こす可能性があります。いわゆるプライバシー保護は、実際には個人データの保護であり、最終的にはデータ利用者のプライバシー保護です。データ ガバナンス ツールは、個人データの保護に関する多くの側面を技術レベルから設計し、データのファジー化、データの非感作化、およびデータ暗号化を提供します。これにより、企業の個人データ保護の基礎を築くことができ、それによって人工知能アプリケーションのデータ コンプライアンスを達成できます。
2. 人工知能はデータ ガバナンスのインテリジェンス レベルを向上させます
従来のメタデータ管理では、非構造化データのメタデータ収集は通常、非構造化データの検索インデックスを作成することによって行われます。 。音声認識、画像認識、テキスト分析などの人工知能テクノロジは、メタデータの初期ビジネス語彙の構築を実現するのに役立ち、さまざまな貴重な非構造化メタデータを抽出するためのリソース プールになります。
データ標準実装の初期段階では、既存のシステムを管理するために必要です。 データ標準を確立するための基礎として、データベース フィールドの徹底的な調査を実施して、共通および再利用されるビジネス フィールドを特定します。すべて手作業で行う場合、さまざまな事業部門から多数の人員が連携する必要があり、作業量が膨大になり、ミスも発生しやすくなります。機械学習と自然言語処理技術の助けを借りて、現場の企業名に基づいて高頻度のルートを迅速に分類でき、数か月かかる作業を数日で完了できます。
データ標準管理のもう 1 つの重要な側面は、標準とメタデータのマッピングです。多くのビジネス システムでは、データ標準をビジネス システムのメタデータにマッピングすることは実装エンジニアにとって悪夢であることが多く、注意しないと間違いを犯しやすくなります。人工知能テクノロジーを使用すると、ビジネス分野名に対して自然言語処理を実行し、単語を正確にセグメント化し、ルートの類似性に基づいてデータ標準とメタデータを自動的にマッピングできます。
##データ品質とは、データの効率を確保することです。アプリケーションベース。データ品質を測定するための指標システムには、完全性、標準化、一貫性、正確さ、一意性、適時性が含まれます。データ品質改善計画を実行する前に、さまざまなビジネス ルールやビジネス上の期待に基づいて適切なデータ品質指標システムを選択し、データをクリーンアップする必要があります。
一般的なデータ品質向上の理想的なモデルは、データ ソースからダーティ データを削除することですが、これは現実には不可能です。したがって、ビジネスの期待に応じて、ビジネスの各段階でのデータ品質を的を絞った方法で改善する必要があります。機械学習 (分類学習、クラスタリング、回帰など) は、既存の品質問題を抽出して特定することで、効果的なデータ品質評価指標を策定し、この指標に基づいてデータ品質を最大限に向上させることができます。同時に、教師あり学習とディープラーニングにより、データクリーニングとデータ品質の効果の評価も可能になり、それによって変換ルールとデータ品質の評価次元が改善され、データ量とビジネスの期待が徐々に変化するにつれてデータ品質の改善計画が動的に更新されます。
#4. データ セキュリティ##データ セキュリティとは、情報またはプロセスを保持することを意味します。情報システムが不正なアクセス、使用、破壊、変更、破壊から保護されている状態。人工知能テクノロジーは、機密データを分類して分類できます。機械学習、自然言語処理、テキスト クラスタリング分類テクノロジを適用することで、コンテンツに基づいてデータをリアルタイムで正確に分類および分類できます。データの分類と分類は、データ セキュリティ ガバナンスの中心的なリンクです。たとえば、データ分類エンジンの使用により、電子メール コンテンツのフィルタリング、機密ファイル管理、インテリジェンス分析、不正行為防止、データ漏洩防止などの分野でのセキュリティが大幅に向上しました。
#5. マスター データ管理
##マスター データとは、中核となるビジネスを指します。エンティティデータはゴールデンデータとも呼ばれ、バリューチェーン全体で繰り返し共有され、複数のビジネスプロセスで利用され、さまざまな事業部門やシステム間で共有される情報交換の基盤となる基礎データです。しかし、企業はマスターデータを管理する過程で、膨大なデータの中からマスターデータをどのように特定するのか、統一したマスターデータ規格をどのように確立するのかなどの課題に直面することがあります。
マスター データの決定は、企業のビジネス ニーズの理解と、対応する「ゴールデン データ」の定義に依存します。一般に、各マスターデータのサブジェクト領域には独自の専用の記録システムがあり、さまざまなビジネス システムに分散されています。人工知能関連テクノロジーは、すべてのデータから頻繁に出現するデータや流れてくるデータをフィルタリングすると同時に、マスター データの信頼できるデータ ソースを迅速に特定し、完全なマスター データ ビューを構築するのに役立ちます。
6. 人工知能により、重複したデータが自動的に照合され、データが結合されます。
デジタル ドラマ管理が直面する課題の 1 つは、企業の多数のシステムで同じデータ項目または重複するデータ項目を照合してマージすることです。この課題を解決する 1 つの方法は、さまざまなデータ マッチング ルールを構築することです。信頼レベル、一致の許容度。一部の一致には非常に高いレベルの信頼が必要で、複数のフィールドにわたる正確なデータ一致に基づくことができますが、一部の一致は単にデータ値が矛盾しているために、より低いレベルの信頼で達成される場合もあります。機械学習と自然言語処理は、重複データを識別するための一致ルールを確立するのに役立ちます。重複フィールドを持つマスター データを識別した後は、自動マージは実行されず、マスター データに関連するレコードを特定し、相互参照関係を確立できます。
人工知能技術によってデータ ガバナンスの敷居を下げることは、データ ガバナンスの発展にとって重要な方向性になります。データ ガバナンスの高度な複雑性を十分に考慮して、データ ガバナンス プラットフォームは新しい AI テクノロジを統合し続け、インテリジェントな管理を通じてデータ ガバナンス実装プロセスの簡素化に努め、技術担当者を大幅に解放し、企業がより効率的なデータ ガバナンスを達成し、データ ガバナンスから遠ざかるのを支援します。 「データブラックホール」より。
1. インテリジェントなメタデータ サービス。 Ruizhi プラットフォームは、完全に自動化されたメタデータの収集と関連付けをサポートし、メタモデルのインテリジェントなアプリケーションを実現し、グラフィカルなメタデータ分析ビューを提供します。
#2. データ品質のインテリジェントな調査。 Ruizhi プラットフォームには、数学的統計アルゴリズムとバインドされた機械学習アルゴリズムが組み込まれており、データ品質を自動的に検出し、インテリジェントな修復をサポートします。
#3. データ標準のインテリジェントな構築。 Ruizhi プラットフォームは、インテリジェントなマッピングとマーキング、データ標準の形成、ビジネス データの双方向評価をサポートします。
#4. マスター データのインテリジェントな識別。 Ruizhi プラットフォームはマスター データを自動的に識別し、重複データの自動的な照合とマージを支援し、完全なマスター データ ビューを構築します。
データ ガバナンスと人工知能の急速な発展に伴い、この 2 つの統合により、より多くのシナリオとビジネス モデルが生まれるでしょう。
企業が AI アプリケーションを導入する場合、データ リソースの品質が AI アプリケーションの有効性を大きく左右します。したがって、AI アプリケーションの高品質な実装を促進するには、対象を絞ったデータ ガバナンス作業を実行することが最初で必要なステップです。企業が構築してきた従来のデータガバナンスシステムは、現在、構造化データのガバナンスの最適化に重点が置かれており、データ品質、データフィールドの豊富さ、データ分散、データの各側面においてAIアプリケーションのニーズを満たすことは依然として困難です。リアルタイムのデータ品質要件。 AI アプリケーションの高品質な実装を保証するために、 企業は依然として人工知能アプリケーションの二次データ ガバナンスを実行する必要があります。
人工知能指向のデータ ガバナンスは、AI アプリケーションの実装によって導かれる従来のデータ ガバナンス システムの「アップグレード」です。
データ管理の観点から見ると、人工知能のデータ ガバナンス システムは、データ構造化フロー、データ資産管理のニーズ、データ セキュリティに基づいた要素の構築に引き続き適応します。データ管理、データ資産管理、マスターデータ管理、データライフサイクル管理、データセキュリティとプライバシー管理などのコンポーネントモジュール。データ ガバナンス プロセスでは、必要なデータの規模、品質、適時性を満たすために、マルチソース データの融合、データ収集頻度、データ標準の確立、およびデータ品質管理を実現するために、最下層にさらに重点が置かれます。 AI モデルのニーズに合わせて、AI アプリケーションのニーズを満たすため、データ要件を核として、対応するモジュールのシステム構築が最適化されます。
人工知能指向のデータ ガバナンス サービスには、多くの場合含まれていますin data 3 種類の調達形態には、サービス、プラットフォーム機能、データ製品があります。最初のカテゴリのデータ サービスは、個別のデータ ガバナンス製品の形で表示されます。2 番目のカテゴリのデータ プラットフォームには、主にビッグ データ プラットフォーム、データ ミドル プラットフォーム、データ ウェアハウス、AI 機能プラットフォームおよびその他のプロジェクトが含まれます。3 番目のカテゴリのデータ製品は、 AI アルゴリズムの適用に限定されたデータ製品は、機械学習製品、自然言語理解製品、ナレッジ グラフの 3 種類の AI 製品に分類できます。
現在、AI 製品に対する需要は高く、AI 開発プラットフォームは次々と大規模な開発を推進してきました。 AI 製品の導入規模と AI データ ガバナンスの効果 最終的なプラットフォーム製品の提供効果と密接に関係しています。
全体として、最先端のテクノロジーを適用することで、データ ガバナンスをより合理化、自動化、インテリジェントにしながら、データの拡張性、説明責任、追跡可能性を高めることができます。データ管理を将来的に発展させる唯一の方法となっています。
相互関連、相互に依存し、人工知能アプリケーションの内部および外部の開発を共同で促進します
人工知能指向のデータガバナンスは、機械学習テクノロジーを最大限に活用して自動化およびインテリジェント化しますデータ ガバナンス プロセスは、データ ガバナンスの効率を大幅に向上させると同時に、自然言語理解とナレッジ グラフに基づいて関連する非構造化データのアプリケーション価値を発掘し、データ品質管理の従来の問題を解決し、修復されたデータは、AI アプリケーションの要件により一致します。 効率と品質の観点から、AI モデルの実装を促進します。
同時に、AI アプリケーションの実装効果が大幅に最適化されることで、企業はインテリジェントな変革に対する自信をさらに深め、投資を増やすことができます。関連するガバナンス体制の構築をさらに推進し、「統治するAI」の好循環を創出するための予算投資を実施
以上がAI指向のデータガバナンスシステムを構築するにはどうすればよいでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。