スタンフォード大学がAI基本モデルの透明性指数を発表、Llama 2は1位だが「不合格」
IT House News 10月20日、スタンフォード大学は最近、AI基本モデルの「透明性指数」を発表、最も高い表示指数はMetaのLama 2だが、関連する「透明性」は54%にすぎないため、研究者らは発表した。市場に出回っているほぼすべての AI モデルは「透明性に欠けている」と考えられています。
この研究は、HAI 基本モデル研究センター (CRFM) 所長であるリシ・ボンマサニ氏が主導し、海外で最も人気のある 10 個の基本モデルを調査したと報告されています。
リシ・ボンマサニ氏は、「透明性の欠如」が常に AI 業界が直面している問題であると考えています。特定のモデルの「透明性指標」に関して、IT ハウスは、関連する評価内容が主に「モデルのトレーニング データ」を中心に展開していることを発見しました。 「著作権の設定」、「トレーニング モデル 「使用されるコンピューティング リソース」、「モデルによって生成されたコンテンツの信頼性」、「モデル自体の機能」、「モデルが有害なコンテンツの生成を誘導されるリスク」、「モデルの使用に関するユーザーのプライバシー」 」など計100件。メタのラマ 2、
- BloomZ by BigScience、
- OpenAI の GPT-4、
- 安定性AIの安定した普及、
- クロード、人類 PBC の
- Google の PaLM 2、
- コヒアの命令、
- ジュラシック-2、
- AI21 Labs
語形変化 AI の語形変化、- アマゾンのタイタン。
最終調査では、Meta の Lama 2 が 54% の透明性でリストのトップに立ったのに対し、OpenAI の GPT-4 の透明性は 48% にとどまり、Google の PaLM 2 は 40% で 5 位にランクされました。
具体的な指標のうち、スコアパフォーマンスが「最高」の上位10モデルは「モデルの基礎」であり、この評価内容は主に「モデルの学習時にモデル、スケール、モデルが正確に導入されているか」が含まれます。 「アーキテクチャ」の平均透明度は 63% です。最もパフォーマンスが悪いのは Impact で、主に基本モデルが「評価のためにユーザー情報を取得する」かどうかを評価しており、平均透明性はわずか 11% です。
CRFMディレクターのパーシー・リャン氏は、ビジネスベースモデルの「透明性」はAI法制や関連業界、学界を推進する上で非常に重要であると述べた。
リシ・ボンマサニ氏は、モデルの透明性が低いと、企業が関連モデルを安全に信頼できるかどうかを判断することが難しくなり、研究者がこれらのモデルに頼って研究を行うことが難しくなると述べた。
リシ・ボンマサニ氏は最終的に、上記の 10 個の基本モデルは透明性の点ですべて「失敗」していると考えています。Meta の Llama 2 は最高のスコアを持っていますが、外部世界のニーズを満たすことはできません。「モデルの透明性は少なくとも 82 に達する必要があります。」 % 外部の世界に認識されるようにする。」
以上がスタンフォード大学がAI基本モデルの透明性指数を発表、Llama 2は1位だが「不合格」の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











モデルコンテキストプロトコル(MCP):AIとデータのユニバーサルコネクタ 私たちは皆、毎日のコーディングにおけるAIの役割に精通しています。 Replit、Github Copilot、Black Box AI、およびCursor IDEは、AIがワークフローを合理化する方法のほんの一部です。 しかし、想像してみてください

MicrosoftのOmniparser V2とOmnitool:AIでGUIオートメーションに革命をもたらす 味付けされた専門家のように、Windows 11インターフェースと相互作用するだけでなく、熟練したプロのように相互作用するAIを想像してください。 MicrosoftのOmniparser V2とOmnitoolはこれを再生します

アプリ開発の革新:レプリットエージェントに深く潜ります 複雑な開発環境と不明瞭な構成ファイルとの格闘にうんざりしていませんか? Replit Agentは、アイデアを機能的なアプリに変換するプロセスを簡素化することを目的としています。 このai-p

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

このブログ投稿では、Runway MLの新しいAct-One Animationツールの経験をテストし、WebインターフェイスとPython APIの両方をカバーしています。約束しますが、私の結果は予想よりも印象的ではありませんでした。 生成AIを探索したいですか? PでLLMSを使用することを学びます

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します
