ホームページ テクノロジー周辺機器 AI 大手モデルの時代に不適切なコンテンツをどのようにキャッチするか? EUの法案ではAI企業にユーザーの知る権利の確保を義務付ける

大手モデルの時代に不適切なコンテンツをどのようにキャッチするか? EUの法案ではAI企業にユーザーの知る権利の確保を義務付ける

May 27, 2023 pm 02:05 PM
大型モデル 不快な内容 アイカンパニー

過去 10 年間で、大手テクノロジー企業は、言語、予測、パーソナライゼーション、アーカイブ、テキスト解析、データ処理など、多くのテクノロジで非常に優れています。しかし、有害なコンテンツを見つけて報告し、削除することは依然として苦手です。米国で広まっている選挙とワクチンの陰謀論については、過去 2 年間の出来事を振り返るだけで、それらが引き起こしている現実世界の害悪を理解することができます。

この違いにより、いくつかの疑問が生じます。なぜテクノロジー企業はコンテンツモデレーションを改善しないのでしょうか?彼らにこれを強制することはできるのでしょうか?人工知能の新たな進歩により、悪い情報をキャッチする私たちの能力は向上するでしょうか?

ほとんどの場合、ハイテク企業が米国議会から憎悪と誤った情報の拡散における自社の役割について説明を求められると、自社の失敗を言語自体の複雑さのせいにする傾向があります。幹部らは、さまざまな言語や文脈での文脈上のヘイトスピーチを理解し、防止するのは難しい課題だと語る。

マーク・ザッカーバーグの好きな言葉の 1 つは、テクノロジー企業が世界のすべての政治問題を解決する責任を負うべきではないというものです。

大手モデルの時代に不適切なコンテンツをどのようにキャッチするか? EUの法案ではAI企業にユーザーの知る権利の確保を義務付ける (出典: STEPHANIE ARNETT/MITTR | GETTY IMAGES)

ほとんどの企業は現在、テクノロジーと人間のコンテンツ モデレーターの両方を採用していますが、後者の仕事は過小評価されており、これが彼らのわずかな報酬に反映されています。

たとえば、現在 Facebook で削除されるすべてのコンテンツの 97% は AI が担当しています。

ただし、AI はニュアンスやコンテキストを解釈するのが苦手なので、たとえ人間がコンテンツモデレーターに取って代わる可能性は低いと、スタンフォードインターネット観測所の研究マネージャー、レニー・ディレスタ氏は述べています。 。

自動コンテンツ モデレーション システムは通常、英語のデータに基づいてトレーニングされるため、文化的背景や言語によって、他の言語のコンテンツを効果的に処理する際に課題が生じる可能性があります。

カリフォルニア大学バークレー校情報学部のハニ・ファリド教授が、より分かりやすい説明をしています。ファリド氏によると、コンテンツのモデレーションはテクノロジー企業の経済的利益にならないため、リスクに対応できていないという。それはすべて貪欲に関するものです。お金の問題ではないふりをするのはやめてください。 「

連邦規制がないため、オンライン暴力の被害者がプラットフォームに経済的責任を求めることは困難です。

コンテンツのモデレーションは、テクノロジー企業と悪意のある者との間の終わりのない戦争のようです。テクノロジー企業がコンテンツモデレーションルールを展開するとき、悪意のある者は検出を避けるために絵文字や意図的なスペルミスを使用することがよくあります。そして、これらの企業は抜け穴をふさごうとし、人々は新たな抜け穴を見つけるというサイクルが続きます。

大手モデルの時代に不適切なコンテンツをどのようにキャッチするか? EUの法案ではAI企業にユーザーの知る権利の確保を義務付ける

さあ、大規模な言語モデルが登場します...

現在の状況はすでに非常に困難です。生成型人工知能や ChatGPT などの大規模言語モデルの出現により、状況はさらに悪化する可能性があります。生成テクノロジーには問題があります。たとえば、自信を持って物事をでっち上げ、事実として提示する傾向があります。しかし、1 つ明らかなことは、AI は言語能力が向上しており、非常に強力です。

ディレスタ氏もファリド氏も慎重ではあるが、事態がどのように展開するかについて判断を下すのは時期尚早であると考えている。 GPT-4 や Bard などの大規模モデルの多くにはコンテンツ管理フィルターが組み込まれていますが、それでもヘイトスピーチや爆弾の作り方の指示など、有害な出力を生成する可能性があります。

生成 AI を使用すると、悪意のある攻撃者はより大規模かつ迅速に偽情報キャンペーンを実行できます。 AI によって生成されたコンテンツを識別してラベルを付ける方法がひどく不十分であることを考えると、これは悲惨な状況です。

一方、最新の大規模言語モデルは、以前の人工知能システムよりもテキスト解釈のパフォーマンスが優れています。理論的には、自動コンテンツモデレーションの開発を促進するために使用できる可能性があります。

テクノロジー企業は、この特定の目標を達成するために、大規模な言語モデルの再設計に投資する必要があります。 Microsoft などの企業はこの問題を調査し始めていますが、まだ大きな活動は行われていません。

ファリド氏は次のように述べています。「私たちは多くの技術的進歩を見てきましたが、コンテンツモデレーションの改善については懐疑的です。」

大規模な言語モデルは急速に進歩していますが、文脈理解においては依然として課題に直面しており、投稿と画像の間の小さな違いを人間のモデレータほど正確に理解することができない可能性があります。異文化間の拡張性と特異性も問題を引き起こします。 「特定のタイプのニッチ向けのモデルを展開していますか? 国ごとに行っていますか? コミュニティごとに行っていますか? それは画一的な質問ではありません」とディレスタ氏は述べた。

大手モデルの時代に不適切なコンテンツをどのようにキャッチするか? EUの法案ではAI企業にユーザーの知る権利の確保を義務付ける

新しいテクノロジーに基づいた新しいツール

生成 AI が最終的にオンライン情報環境に害を及ぼすか助けるかは、コンテンツが AI によって生成されたかどうかを知らせる、広く採用されている優れたツールをテクノロジー企業が考案できるかどうかに大きく依存する可能性があります。

DiResta は、合成メディアの検出は技術的な課題である可能性があり、困難であるため優先する必要があると私に言いました。これには、電子透かしのような方法が含まれます。電子透かしとは、添付されたコンテンツが人工知能によって作成されたことを示す永続的なマークとしてコードを埋め込むことを指します。 AI によって生成または操作された投稿を検出するための自動ツールは、ウォーターマークとは異なり、AI によって生成されたコンテンツの作成者によるアクティブなタグ付けを必要としないため、魅力的です。言い換えれば、機械によって生成されたコンテンツを識別しようとする現在のツールは十分に機能していないということです。

一部の企業は、コンテンツの生成方法などの情報の暗号署名を数学を使用して安全に記録することを提案していますが、これは透かしなどの自主的な開示技術に依存することになります。

欧州連合が先週提案した人工知能法(AI法)の最新版では、生成人工知能を使用する企業に対し、コンテンツが実際に機械によって生成された場合にユーザーに通知するよう義務付けている。 AI によって生成されたコンテンツの透明性への需要が高まるにつれ、今後数か月間で新しいツールについてさらに多くの情報が聞かれることになるでしょう。

サポート: レン

原文:

https://www.technologyreview.com/2023/05/15/1073019/catching-bad-content-in-the-age-of-ai/

以上が大手モデルの時代に不適切なコンテンツをどのようにキャッチするか? EUの法案ではAI企業にユーザーの知る権利の確保を義務付けるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ビッグモデルアプリ Tencent Yuanbao がオンラインになりました! Hunyuan がアップグレードされ、どこにでも持ち運べるオールラウンドな AI アシスタントが作成されました ビッグモデルアプリ Tencent Yuanbao がオンラインになりました! Hunyuan がアップグレードされ、どこにでも持ち運べるオールラウンドな AI アシスタントが作成されました Jun 09, 2024 pm 10:38 PM

5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアン アプレット バージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。 、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネス シナリオにおける豊富で大規模なポーランド テクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Jun 05, 2024 pm 07:59 PM

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

Shengteng AI テクノロジーを使用した秦嶺・秦川交通モデルは、西安のスマート交通イノベーション センターの構築を支援します Shengteng AI テクノロジーを使用した秦嶺・秦川交通モデルは、西安のスマート交通イノベーション センターの構築を支援します Oct 15, 2023 am 08:17 AM

「高度な複雑性、高度な断片化、およびクロスドメイン」は、輸送業界のデジタル化およびインテリジェントなアップグレードに向かう上で常に主要な問題点でした。最近、チャイナビジョン、西安雁塔区政府、西安未来人工知能コンピューティングセンターが共同で構築したパラメータースケール1000億の「秦嶺・秦川交通モデル」は、スマート交通・交通分野を指向している。西安とその周辺地域にサービスを提供しており、この地域はスマート交通イノベーションの拠点となるでしょう。 「秦嶺・秦川交通モデル」は、オープンシナリオにおける西安の膨大な地元交通生態データ、中国科学ビジョンが自社開発したオリジナルの高度なアルゴリズム、そして西安未来人工知能コンピューティングセンターのShengteng AIの強力なコンピューティング能力を組み合わせたものです。道路網の監視を提供するため、緊急指令、メンテナンス管理、公共交通機関などのスマートな交通シナリオは、デジタルでインテリジェントな変化をもたらします。交通管理には都市ごとに異なる特徴があり、道路の交通状況も異なります。

NVIDIA の大規模モデル推論フレームワークを明らかにする: TensorRT-LLM NVIDIA の大規模モデル推論フレームワークを明らかにする: TensorRT-LLM Feb 01, 2024 pm 05:24 PM

1. TensorRT-LLM の製品位置付け TensorRT-LLM は、NVIDIA が開発した大規模言語モデル (LLM) 向けのスケーラブルな推論ソリューションです。 TensorRT 深層学習コンパイル フレームワークに基づいて計算グラフを構築、コンパイル、実行し、FastTransformer の効率的なカーネル実装を利用します。さらに、デバイス間の通信には NCCL を利用します。開発者は、カットラスに基づいてカスタマイズされた GEMM を開発するなど、技術開発や需要の違いに基づいて特定のニーズを満たすためにオペレーターをカスタマイズできます。 TensorRT-LLM は、NVIDIA の公式推論ソリューションであり、高いパフォーマンスを提供し、実用性を継続的に向上させることに尽力しています。 TensorRT-LL

GPT-4をベンチマーク!中国移動の九天大型モデルが二重登録を通過 GPT-4をベンチマーク!中国移動の九天大型モデルが二重登録を通過 Apr 04, 2024 am 09:31 AM

4月4日のニュースによると、中国サイバースペース局は最近、登録された大型モデルのリストを発表し、その中にチャイナモバイルの「九天自然言語インタラクション大型モデル」が含まれており、チャイナモバイルの九天AI大型モデルが生成人工言語を正式に提供できることを示した。外部世界への諜報機関。チャイナモバイルは、これは中央企業が開発した初めての大規模モデルであり、国家の「生成人工知能サービス登録」と「国内深層合成サービスアルゴリズム登録」の二重登録を通過したと述べた。報告によると、Juiutian の自然言語インタラクション大規模モデルは、強化された業界能力、セキュリティ、信頼性の特徴を持ち、フルスタック ローカリゼーションをサポートしており、90 億、139 億、570 億、1000 億などのさまざまなパラメータ バージョンを形成しており、クラウド、エッジ、エンドでは状況が異なりますが、柔軟に導入できます。

産業ナレッジグラフの高度な実践 産業ナレッジグラフの高度な実践 Jun 13, 2024 am 11:59 AM

1. 背景の紹介 まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータ ガバナンスの普及により、より効率的なデータ ガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

新しいテストベンチマークがリリース、最も強力なオープンソースのLlama 3が困惑 新しいテストベンチマークがリリース、最も強力なオープンソースのLlama 3が困惑 Apr 23, 2024 pm 12:13 PM

テストの問題が簡単すぎると、上位の生徒も下位の生徒も 90 点を獲得でき、その差は広がりません。Claude3、Llama3、さらには GPT-5 などのより強力なモデルが後にリリースされるため、業界はより困難で差別化されたモデルのベンチマークが緊急に必要です。大型モデルアリーナの背後にある組織 LMSYS は、次世代ベンチマーク Arena-Hard を発表し、広く注目を集めました。 Llama3 命令の 2 つの微調整されたバージョンの強度に関する最新のリファレンスもあります。全員が同様のスコアを持っていた以前の MTBench と比較すると、アリーナとハードの識別は 22.6% から 87.4% に増加し、一目で強くも弱くもなりました。 Arena-Hard は、アリーナからのリアルタイムの人間データを使用して構築されており、人間の好みとの一致率は 89.1% です。

Xiaomi Byteが力を合わせます! Xiao Ai の Doubao へのアクセスの大規模モデル: 携帯電話と SU7 にすでにインストールされています Xiaomi Byteが力を合わせます! Xiao Ai の Doubao へのアクセスの大規模モデル: 携帯電話と SU7 にすでにインストールされています Jun 13, 2024 pm 05:11 PM

6月13日のニュースによると、Byteの「Volcano Engine」公開アカウントによると、Xiaomiの人工知能アシスタント「Xiao Ai」はVolcano Engineとの協力に達し、両社はbeanbao大型モデルに基づいて、よりインテリジェントなAIインタラクティブ体験を実現するとのこと。 。 ByteDance が作成した大規模な豆包モデルは、毎日最大 1,200 億のテキスト トークンを効率的に処理し、3,000 万個のコンテンツを生成できると報告されています。 Xiaomi は、Doubao 大型モデルを使用して、独自モデルの学習能力と推論能力を向上させ、ユーザーのニーズをより正確に把握するだけでなく、より速い応答速度とより包括的なコンテンツ サービスを提供する新しい「Xiao Ai Classmate」を作成しました。たとえば、ユーザーが複雑な科学的概念について質問する場合、&ldq

See all articles