スタンフォード大学がAI基本モデルの透明性指数を発表、Llama 2は1位だが「不合格」-AI-php.cn

ホームページ

テクノロジー周辺機器

スタンフォード大学がAI基本モデルの透明性指数を発表、Llama 2は1位だが「不合格」

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 21, 2023 am 08:17 AM

IT House News 10月20日、スタンフォード大学は最近、AI基本モデルの「透明性指数」を発表、最も高い表示指数はMetaのLama 2だが、関連する「透明性」は54%にすぎないため、研究者らは発表した。市場に出回っているほぼすべての AI モデルは「透明性に欠けている」と考えられています。

この研究は、HAI 基本モデル研究センター (CRFM) 所長であるリシ・ボンマサニ氏が主導し、海外で最も人気のある 10 個の基本モデルを調査したと報告されています。

メタのラマ 2、

BloomZ by BigScience、

OpenAI の GPT-4、

安定性AIの安定した普及、

クロード、人類 PBC の

Google の PaLM 2、

コヒアの命令、

ジュラシック-2、
AI21 Labs
語形変化 AI の語形変化、

アマゾンのタイタン。

リシ・ボンマサニ氏は、「透明性の欠如」が常に AI 業界が直面している問題であると考えています。特定のモデルの「透明性指標」に関して、IT ハウスは、関連する評価内容が主に「モデルのトレーニングデータ」を中心に展開していることを発見しました。「著作権の設定」、「トレーニングモデル「使用されるコンピューティングリソース」、「モデルによって生成されたコンテンツの信頼性」、「モデル自体の機能」、「モデルが有害なコンテンツの生成を誘導されるリスク」、「モデルの使用に関するユーザーのプライバシー」」など計100件。

最終調査では、Meta の Lama 2 が 54% の透明性でリストのトップに立ったのに対し、OpenAI の GPT-4 の透明性は 48% にとどまり、Google の PaLM 2 は 40% で 5 位にランクされました。

斯坦福大学发布AI基础模型透明度指标，Llama 2居首但“不及格”

▲ 画像出典スタンフォード大学

具体的な指標のうち、スコアパフォーマンスが「最高」の上位10モデルは「モデルの基礎」であり、この評価内容は主に「モデルの学習時にモデル、スケール、モデルが正確に導入されているか」が含まれます。「アーキテクチャ」の平均透明度は 63% です。最もパフォーマンスが悪いのは Impact で、主に基本モデルが「評価のためにユーザー情報を取得する」かどうかを評価しており、平均透明性はわずか 11% です。

CRFMディレクターのパーシー・リャン氏は、ビジネスベースモデルの「透明性」はAI法制や関連業界、学界を推進する上で非常に重要であると述べた。

リシ・ボンマサニ氏は、モデルの透明性が低いと、企業が関連モデルを安全に信頼できるかどうかを判断することが難しくなり、研究者がこれらのモデルに頼って研究を行うことが難しくなると述べた。

リシ・ボンマサニ氏は最終的に、上記の 10 個の基本モデルは透明性の点ですべて「失敗」していると考えています。Meta の Llama 2 は最高のスコアを持っていますが、外部世界のニーズを満たすことはできません。「モデルの透明性は少なくとも 82 に達する必要があります。」 % 外部の世界に認識されるようにする。」

以上がスタンフォード大学がAI基本モデルの透明性指数を発表、Llama 2は1位だが「不合格」の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7333

Java チュートリアル

1627

CakePHP チュートリアル

1351

Laravel チュートリアル

1262

PHP チュートリアル

1209

Related knowledge

モデルコンテキストプロトコル（MCP）とは何ですか？ Mar 03, 2025 pm 07:09 PM

モデルコンテキストプロトコル（MCP）：AIとデータのユニバーサルコネクタ私たちは皆、毎日のコーディングにおけるAIの役割に精通しています。 Replit、Github Copilot、Black Box AI、およびCursor IDEは、AIがワークフローを合理化する方法のほんの一部です。しかし、想像してみてください

Omniparser V2とOmnitoolを使用して地元のビジョンエージェントを構築する Mar 03, 2025 pm 07:08 PM

MicrosoftのOmniparser V2とOmnitool：AIでGUIオートメーションに革命をもたらす味付けされた専門家のように、Windows 11インターフェースと相互作用するだけでなく、熟練したプロのように相互作用するAIを想像してください。 MicrosoftのOmniparser V2とOmnitoolはこれを再生します

レプリットエージェント：実用的な例を備えたガイド Mar 04, 2025 am 10:52 AM

アプリ開発の革新：レプリットエージェントに深く潜ります複雑な開発環境と不明瞭な構成ファイルとの格闘にうんざりしていませんか？ Replit Agentは、アイデアを機能的なアプリに変換するプロセスを簡素化することを目的としています。このai-p

カーソルAIでバイブコーディングを試してみましたが、驚くべきことです！ Mar 20, 2025 pm 03:34 PM

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Runway Act-One Guide：私はそれをテストするために自分自身を撮影しました Mar 03, 2025 am 09:42 AM

このブログ投稿では、Runway MLの新しいAct-One Animationツールの経験をテストし、WebインターフェイスとPython APIの両方をカバーしています。約束しますが、私の結果は予想よりも印象的ではありませんでした。生成AIを探索したいですか？ PでLLMSを使用することを学びます