近年、ビッグモデルのことが話題になっています。特にスケーリングの法則の指導の下で、人々はモデルの知能レベルを無限に向上させるためにトレーニングに大規模なデータを使用することを望んでいます。中国では、土地、労働、資本、技術と並ぶ生産要素として「データ」の価値がますます重視されています。近年、中国のデータ要素の市場指向の構築のペースが大幅に加速しています。 「データ」の価値を実現する鍵は、異なる主体間、異なるシナリオでのデータの流通と再利用にあります。データ要素は、従来の生産要素とは本質的に異なります。データの価値は、ビジネス価値が大きくなるほど、リスク コストも高くなります。データ循環のための信頼できる環境を作成することは、データ要素の価値を完全に解放するための基礎となるサポートです。
これに関連して、プライベート コンピューティング テクノロジーの価値が徐々に顕著になり、学界や産業界で注目を集めるようになりました。プライバシー コンピューティングは、その概念の誕生から、最先端の理論から産業応用まで 40 年近くを費やしてきました。ただし、プライバシー コンピューティングがデータ要素流通市場の「基礎技術」になり得るかどうかには、依然として一連の障害をクリアする必要があります。
高密度のデータの流れが将来のトレンドとなり、従来のプライバシー コンピューティング テクノロジーでは、新しい状況の要件を満たすことができなくなります。一方で、従来のプライバシー コンピューティングは、主に複数者間の協力シナリオにおけるコンピューティング セキュリティに焦点を当てており、全体的なセキュリティの観点が欠如しており、大規模なデータ流通プロセスにおける新しいシナリオや役割の導入によってもたらされる追加のリスクに対処できません。第 2 に、プライバシー コンピューティングの実装コストを最小限に抑えるために、さまざまなセキュリティ レベルのデータに対して異なるセキュリティ レベルの技術ソリューションを採用する必要があります。したがって、業界の標準化を促進することが特に重要です。
2024 年の世界人工知能会議では、産業界、学界、研究機関が新たな探求と実践をもたらしました。 7 月 5 日、国内の多くの産学研究機関が共同で、データが現在直面している課題に対する最新技術を提供する「プライバシー コンピューティング製品の一般セキュリティ分類」と「個人情報匿名化システム」に焦点を当てた 2 つのホワイト ペーパーを発表しました。要素循環産業の考え方と産業実践。
どのようなプライバシーコンピューティング技術標準システムが必要ですか?
プライバシー コンピューティングは、暗号化、人工知能、コンピューター ハードウェアなどの多くの分野の知識を横断的に統合する包括的な学際的テクノロジーであり、現在、マルチパーティ セキュア コンピューティング、フェデレーテッド ラーニング、信頼できる実行環境などの技術的ルートを形成しています。
データ要素の信頼できる流通を促進するには、技術の研究開発と標準設定の協力が必要です。プライバシー コンピューティング テクノロジのあらゆる方向において、完了すべき標準設定作業はまだ多くありますが、産業界、学界、研究界は一般に、「クロスドメイン データ制御」、「制御された匿名化」、「ユニバーサル」の 3 つの方向があると考えています。セキュリティ分類」は注目に値します。
クロスドメインデータ制御の目的は、関連する法律、規制、プライバシーポリシーを遵守しながら、データの共有およびフローのプロセス中に、権限のないエンティティによってデータがアクセスまたは改ざんされないことを保証することです。新しい生産要素として、データの価値の鍵は、さまざまな主体によるさまざまなシナリオでのデータの循環と再利用にありますが、このプロセスは多くの場合、「不明確な責任主体、一貫性のない関心の要求、不均等な能力、および困難」という問題に悩まされます。責任のつながりを追跡すること」のリスク。
通常、制御された匿名化は、データの有用性と正確性を維持しながら、データが使用および分析されるときに個人のプライバシー情報が明らかにならないようにするために使用されます。我が国の「サイバーセキュリティ法」と「個人情報保護法」は、匿名化された個人データを個人情報保護の対象から除外するために「個人情報匿名化条項」を具体的に定めていますが、その法的意味合いや実施基準はまだ明確になっていません。実際、個人情報匿名化条項の存在は、データ取引の流れやデータ要素の市場構築における最大のボトルネックの一つになっています。さらに、プライバシー コンピューティングでは、ユニバーサル セキュリティ分類は、さまざまな製品に最適な保護手段を決定するのに役立ち、それによって合理的にセキュリティ リソースが割り当てられ、機密データが適切に保護されるようになります。現在、単一の技術ルートにはいくつかの安全性分類基準がありますが、異なる技術ルートの分類基準は完全に一致しておらず、ユーザーはすべての製品を水平に比較することができず、これらの基準は新興技術ルートには適用されません。
産学、研究間の緊密な協力により、私たちはすでにある程度の進歩を見せています。
この会議では多くの国内の産学界、研究機関が合意に達しました
「クロスドメインのデータ管理と制御」の問題については、2023年末にリリースされるホワイトペーパーで答えが見つかります。
2023年末、華東政法大学データ法研究センターとアントグループが主導して、初めて体系的に説明した「クロスドメインデータ管理と制御に関する白書」を発表した。クロスドメインのデータ管理と制御のための実践的なガイドラインと戦略を示し、データの流通と利用のリスクを効果的に管理および制御するための高密度ステート コンピューティングなどの技術的手段の使用を提案しました。
ホワイトペーパーは、事前のデータの非感作や暗号化などのデータガバナンスメカニズム、シナリオに基づいた使用範囲の定義などのプロセス制御メカニズムを含む、技術、法律、管理レベルからのクロスドメインデータ管理および制御ソリューションの三位一体を形成しています。プロセス中のセキュリティ レベル、および事後のデータ管理と制御メカニズムの監査監視メカニズム。
同時に、ホワイトペーパーでは、データ流通リスクに適応した5つの管理・制御技術要件も提案しています。これには、確認可能なデータソース、利用可能だが表示できないデータ、計算可能だが識別できないデータ、定義可能なデータ使用と追跡可能なデータ流通を明確にし、データ流通における各主体の責任に対する実現可能な解決策は、中国の信頼できるデータ流通リファレンス アーキテクチャの構築に役立ちます。
「制御された匿名化」と「普遍的なセキュリティ分類」という 2 つの提案に関して、最近の WAIC カンファレンスで学界と産業界の間の最新のコンセンサスも確認されました。
2024 年の世界人工知能会議では、多くの国内の産学研究機関が参加しました。両機関は共同で、「プライバシー コンピューティング製品の一般セキュリティ分類」と「個人情報匿名化システム: 技術と法律」という 2 つのホワイト ペーパーを発表しました。
プライバシー コンピューティングにおけるセキュリティ分類には常に多くの困難がありました。業界の経験から判断すると、技術的ルート、製品形態、アプリケーションシナリオが異なるプライバシーコンピューティング製品は、プライバシーデータ漏洩のリスクとセキュリティ要件に大きな違いがあるため、統一されたセキュリティ分類基準が存在しない場合、製品開発は困難です。関係者やユーザーがセキュリティとパフォーマンスのバランスを評価および測定できるようにします。
深セン国家金融技術評価センターのテクニカルディレクターであるLuo Feng氏は、金融業界におけるプライバシーコンピューティング技術の応用は比較的進んでいるが、大規模な実装にはまだ技術的およびビジネス上の課題があると述べました。プライバシー コンピューティングのルートは多様であり、アプリケーション シナリオが異なれば、セキュリティとパフォーマンスの異なるバランスが必要になります。既存の評価や基準から判断すると、安全性分類以前に製品の総合的な安全性と性能の違いを評価することは困難です。 「テクノロジーアイランド」という現象は客観的に存在しており、テクノロジーが相互接続および相互運用できないため、金融機関ごとに商品選択に差異が生じる可能性があります。さらに、期待される効果の見積もりが難しく、投資コストが高いため、多くの中小規模の金融機関はプライバシー コンピューティング アプリケーションの推進に消極的です。
プライバシー コンピューティングの大規模な実装には、より技術的なルートに適用でき、実践的なガイダンスを備えた普遍的なセキュリティ分類スキームが不可欠です。
上記の状況を踏まえ、アントグループ、中国通信標準協会ビッグデータ技術標準推進委員会、深セン国家金融技術評価センター、清華大学などの国内機関16機関が共同でホワイトペーパー「プライバシーコンピューティング製品の一般セキュリティ分類」を執筆した。 」。執筆運営グループのメンバーには、中国科学院の学者であり国際未確認動物学協会のフェローでもある王暁雲氏や、コンピュータ科学技術学部長のレン・クイ氏などの権威ある学者が含まれていることは注目に値します。浙江大学の博士であり、ブロックチェーンとデータセキュリティの国家主要研究所の副所長。
このホワイトペーパーでは、産学界、研究関係者がプライバシー コンピューティングのセキュリティ分類が直面する多くの困難について 1 つずつ議論し、普遍的なセキュリティ分類のための設計アイデアを提供します。たとえば、攻撃効果と防御効果の分類に応じて、さまざまな技術的ルート間の違いを保護したり、「既知の攻撃に対する耐性」を「安全であると証明できる」と「安全ではない」との間に段階的なレベルを追加したり、ソフトウェアなどのより多くの次元を導入したりすることができます。 「セキュリティの実装」を定量化するための信頼性、あらゆる種類の技術的特徴と安全性分類との対応関係を明らかにします。
中国銀行のプライバシー コンピューティング チームのアルゴリズム エンジニアである Shi Xinlei 氏は、参加者データの影響により、異なる需要シナリオには異なるセキュリティ要件があり、グレーディングを通じてビジネスに適切なレベルのセキュリティを提供し、達成できると述べていました。パフォーマンスとセキュリティのバランスを考慮して、コスト管理を実現するために適切なコンピューティング リソースを割り当てることもできます。第 2 に、セキュリティの分類を通じてリスクの程度を迅速に特定でき、セキュリティ レベルに応じて、対応するレベルの規制管理措置を講じてセキュリティ リスクを軽減できます。合理的なプライバシー コンピューティング製品のセキュリティ評価基準と評価システムは、製品のセキュリティをより深く理解して評価し、データ流通のための信頼メカニズムを構築し、業界標準を促進するのに役立ちます。
個人のプライバシー保護に基づいてデータ価値の開発をどのように実現するかは、業界が直面するもう一つの難しい課題です。個人データは、最も利用価値が高く、最も多様な利用シナリオがあり、最も成熟した処理手段を備えたデータであり、個人のプライバシー保護に基づいてデータ価値の発展を実現し、データ間の信頼できる安全な共有の実現を促進する方法です。さまざまな業界、さまざまな機関のオープン性と貿易は、産業界、学術界、研究機関の共通の探求方向です。
その中でも、匿名化技術は個人データのプライバシーを保護するための重要かつ効果的な手段です。我が国のデータインフラの計画と構築の過程において、個人情報の匿名化に関連する処理技術と制度仕様も重要な位置を占めています。産業実装の観点から、この問題の解決を協力して推進する鍵は、法とテクノロジーを統合したインフラの構築と拡充にあります。
そのために、「サイバーセキュリティ法」および「個人情報保護法」に定められた「個人情報匿名化条項」の指針に基づき、国際商経大学、ビッグデータ技術標準化推進委員会およびアントグループは、ホワイトペーパー「個人情報匿名化条項」制度: テクノロジーと法律 (2024) を共同執筆しました。
個人情報匿名化システム1. ジレンマと課題
- 企業は、法的要件を満たせないために匿名化対策が効果がなくなる、または使用価値が失われるのではないかと懸念しています。
- 規制当局は、匿名化が規制を回避するツールになることを懸念しています。
- ユーザーは匿名性が偽りの約束ではないかと心配しています。
2. データ インフラストラクチャ パス
- 複合「データ インフラストラクチャ」パスに移行します。
- データインフラストラクチャは、データ要素市場のインフラストラクチャです。
- 匿名化用語は、法律とテクノロジーを統合するインフラストラクチャに拡張されます。
3.「事前に推定された匿名性」と「事後的に決定された匿名性」
- 以前の「推定匿名性」は、匿名化テクノロジー ソリューションを通じて実現されます。
- 事後の「判決の匿名性」は、法律を説明し、責任を完全にすることによって達成されます。
4. 管理された匿名化措置
- 管理された空間でのみ使用される匿名化。
- 属性情報は管理されたスペースでのみ使用され、オープンスペースのデータには関連付けられません。
技術標準から大規模実装へ
1. 新しいテクノロジーの大規模実装の難しさと企業コストを軽減するための標準
2. 技術要件標準と技術手法の体系の構築
- データ要素の流通には、新たな技術標準体系の構築が急務です。
3. 新しい技術標準システムを共同で構築するための社会協力
- 。
以上がWAIC の見解: プライバシー コンピューティングは業界での導入を加速しており、新しい技術標準システムが誕生しようとしています。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。