価値観とプライバシー保護を完全に網羅し、中国サイバースペース局は生成型AIの「ルールを確立」する予定
中国サイバースペース局(以下、中国サイバースペース局)は4月11日、「生成型人工知能サービスの管理措置(草案)」を起草・公表し、1カ月間の募集を開始した。一般の方からの意見です。
この管理手法(コメント案)は合計 21 条からなり、適用範囲としては、生成型人工知能サービスを提供する主体とユーザーの両方が含まれます。これらのサービスの組織および個人、管理措置には、生成人工知能出力コンテンツの価値指向、サービスプロバイダーのトレーニング原則、プライバシー/知的財産権およびその他の権利の保護などが含まれます。
GPT タイプの自然言語生成大規模モデルと製品の出現により、一般の人々は人工知能の飛躍と限界を体験できるようになっただけでなく、偏った差別的なコンテンツの生成などのセキュリティ リスクも露呈しました。データ漏洩、プライバシー侵害、AI詐欺などの問題。世界的には、さまざまな国で人工知能の規制が徐々に傾向になってきています。
中国では、「生成型人工知能サービス管理措置」が公布されると、国内の生成型AIの大規模モデルと製品プロバイダーは無秩序に「転がる」ことができなくなり、採用者も使用時に問題が発生します。生成的な AI、規範的なサークル。
1. 生成されたコンテンツに「制限エリア」を設定する
"本措置は、人民の領域内で公衆にサービスを提供するために生成人工知能製品を開発および利用する者に適用されます。中華民国。
本措置で言及されている「生成型人工知能」という用語は、アルゴリズム、モデル、ルールに基づいてテキスト、画像、音声、ビデオ、コード、その他のコンテンツを生成する技術を指します。」
中国サイバースペース局は4月11日、「生成型人工知能サービス管理の措置(意見募集草案)」(以下、「措置」という)を発表し、「」の適用対象を明確にした。対策」と第 2 条の「生成人工知能」の定義。
この記事の内容から判断すると、バイドゥ、アリババ、テンセント、ファーウェイなど、生成的な大型モデルや製品を保有していると公言している企業は、以下にサービスを提供する場合には「措置」の対象となります。この範囲内で、ユーザーは関連製品およびサービスを使用する際にも本措置の規定を遵守する必要があります。
「措置」では、国家が人工知能アルゴリズムやフレームワークなどの基礎技術の独立したイノベーション、促進と応用、国際協力を支援し、安全で信頼できるソフトウェア、ツール、コンピューティングおよびデータ リソース。
この前提の下、「措置」は、生成されたコンテンツや研究開発の基本原則を含む、生成型人工知能製品またはサービスのプロバイダーに対する「制限領域」を定めます。
コンテンツに関して、「措置」は次のことを要求します: 生成人工知能を使用して生成されたコンテンツは、社会主義の中核的価値観を反映している必要があり、国家権力を転覆し、社会主義制度を転覆し、国の分裂を扇動するコンテンツを含んではなりません国家統一を損なう、またはテロリズム、過激主義、民族憎悪の促進、民族差別、暴力、わいせつなポルノ情報、虚偽の情報、経済的および社会的秩序を混乱させる可能性のあるコンテンツを促進するもの、生成人工知能を使用して生成されたコンテンツは真実かつ正確である必要があります。虚偽の情報の発生を防止するための措置を講じる必要があります。
研究開発の観点から、「措置」は提供者に対し、人種、民族、宗教、国家、地域、性別、年齢、職業などに基づく差別の発生を防止する措置を講じることを義務付けています。
これらの要件から判断すると、「措置」は基本的に、差別的偏見や虚偽情報の生成など、市販の大規模自然言語モデル製品の利用者によって顕在化する安全性や倫理的問題を対象としています。
人間が生成 AI を通じて作成した問題のあるコンテンツが、インターネット上に後を絶ちません。
たとえば、ChatGPT はかつて、「違法な万引きに関するヒント」が含まれていたにもかかわらず、ユーザーが「万引きの方法」について問い合わせる手順を提供していましたが、その「ロールプレイング」機能はかつてユーザーによって DAN に誘導されました ( Do Anyting Now) は、「Do Anyting Now」のアイデンティティで質問に回答し、その回答には「罵倒」が含まれていました。また、ChatGPT を使用して国内に広まったフェイク ニュースをテストし、それが「噂の反論」のコンテンツになった人もいました。
検索エンジンBingに統合されたマイクロソフトのチャットボットが「ユーザーを虐待している」と海外メディアに暴露され、AI写真生成アプリMidjourneyは「ローマ法王がバレンシアガのダウンジャケットを着る」の作成にも利用され、 「馬 存在しないさまざまな地震の歴史や太陽嵐災害などを作成するためにそれを使用した人もいます。
ローマ法王(左)とマスクの偽写真
虚偽の情報とAI生成コンテンツの特定に関して、「措置」ではプロバイダーに以下のことから始めるよう求めている。情報源は「データの信頼性、正確性、客観性、多様性を保証できること」、生成画像、ビデオ、その他のコンテンツは「インターネット情報サービス深層合成管理規定」に従ってラベル付けする必要がある、生成人工知能製品の開発中手動アノテーションが使用される場合、プロバイダーは、これらの措置の要件に準拠する、明確で具体的かつ運用可能なアノテーション ルールを策定し、アノテーターに必要なトレーニングを実施し、サンプルベースでアノテーションが付けられたコンテンツの正確性を検証するものとします。
中国の規制は、生成型人工知能コンテンツに制限区域を設定しており、大規模なモデルや製品を提供する企業に対しても、事前トレーニングやデータの管理をある程度義務付けています。
2. データソースと個人情報保護の重視
「対策」では、価値観、社会倫理、法令順守、生成されたコンテンツの差別禁止を重視することに加えて、以下の点も重視しています。生成人工知能関連の事前トレーニングとデータ ソース、個人情報保護、その他の権利と利益に関する要件。
たとえば、「措置」では、生成人工知能製品の事前トレーニング データおよび最適化トレーニング データのソースの合法性についてプロバイダーが責任を負い、知的財産を侵害するコンテンツを含まないことを義務付けています。データに個人情報が含まれる場合は、個人情報主体の同意を得るものとする ユーザーの入力情報および利用記録を保護する義務を負うもの 不正に保存しないものとするもの ユーザーの身元を特定できる入力情報を漏洩しないものとするユーザー入力情報は、違法に保持され、ユーザー入力情報および使用方法に基づいてプロファイリングされてはならず、ユーザー入力情報は他者に提供されてはなりません。
生成 AI によるデータ侵害の問題は確かに存在します。たとえば、ユーザーが何らかの業務ニーズを満たすために会話ロボットを使用する場合、必然的に企業情報をアップロードすることになります。注意しないと、次のような問題が発生する可能性があります。営業秘密の漏洩。以前、韓国の電子機器大手サムスンは、ChatGPT上で「制限命令」を提出した後、従業員によるアプリケーションとのやり取りが原因で内部データが漏洩したと述べた。
「措置」は、生成型人工知能製品およびサービスの提供者を指すだけでなく、製品およびサービスのユーザーに対する原則も規定します。
たとえば、生成されたコンテンツを使用して他者のイメージ、評判、その他の正当な権利や利益を傷つけたり、商業的な誇大広告や不当なマーケティングに関与したりしないでください。
「措置」は上位法令である「中華人民共和国サイバーセキュリティ法」、「中華人民共和国データセキュリティ法」、「中華人民共和国個人情報保護法」に基づいて策定されたものであるため、 「中華人民共和国」およびその他の法律および行政規則に従う場合、これらの法律および規則は、知的財産権の侵害、個人情報の侵害、その他の違法行為を含む本措置の違反に適用されます。
「対策」には合計 21 条があり、そのうち 13 条は「プロバイダー」、つまり、生成人工知能製品を使用してチャットやテキスト、画像、画像などのサービスを提供する組織および個人を明確に対象としています。音の生成。
国民は 3 つのチャネルを通じてフィードバックを提供できます
「措置」が正式に公布されると、大規模な生成モデルを作成する国内企業は、採用当事者は規則に従って行動する必要があります。中国サイバースペース局の公式ウェブサイトによると、一般の人々は3つのチャネルを通じてフィードバックを提供でき、フィードバックの期限は2023年5月10日である。
以上が価値観とプライバシー保護を完全に網羅し、中国サイバースペース局は生成型AIの「ルールを確立」する予定の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

7月5日のこのウェブサイトのニュースによると、グローバルファウンドリーズは今年7月1日にプレスリリースを発行し、自動車とインターネットでの市場シェア拡大を目指してタゴール・テクノロジーのパワー窒化ガリウム(GaN)技術と知的財産ポートフォリオを買収したことを発表した。モノと人工知能データセンターのアプリケーション分野で、より高い効率とより優れたパフォーマンスを探求します。生成 AI などのテクノロジーがデジタル世界で発展を続ける中、窒化ガリウム (GaN) は、特にデータセンターにおいて、持続可能で効率的な電力管理のための重要なソリューションとなっています。このウェブサイトは、この買収中にタゴール・テクノロジーのエンジニアリングチームがGLOBALFOUNDRIESに加わり、窒化ガリウム技術をさらに開発するという公式発表を引用した。 G
