首頁 科技週邊 人工智慧 史丹佛大學發布AI基礎模型透明度指標,Llama 2居首但'不及格”

史丹佛大學發布AI基礎模型透明度指標,Llama 2居首但'不及格”

Oct 21, 2023 am 08:17 AM

IT之家10 月20 日消息,史丹佛大學日前發布了AI 基礎模型“透明度指標”,其中顯示指標最高的是Meta 的Lama 2,但相關“透明度”也只有54%,因此研究人員認為,市面上幾乎所有AI 模型,都「缺乏透明度」。

據悉,這項研究是由 HAI 基礎模型研究中心(CRFM)的負責人 Rishi Bommasani 所主導,調查了海外最受歡迎的 10 款基礎模型:

  • Meta 的 Llama 2、
  • BigScience 的 BloomZ、
  • OpenAI 的 GPT-4、
  • Stability AI 的 Stable Diffusion、
  • Anthropic PBC 的 Claude、
  • Google的 PaLM 2、
  • Cohere 的 Command、
  • AI21 Labs 的 Jurassic-2、
  • Inflection AI 的 Inflection、
  • 亞馬遜的 Titan。

Rishi Bommasani 認為,「缺乏透明度」一直是AI 產業所面臨的問題,在具體模型「透明度指標」方面,IT之家發現,相關評估內容主要圍繞「模型訓練資料集版權」、「訓練模型所使用的運算資源」、「模型產生內容的可信度」、「模型自身能力」、「模型被誘導產生有害內容的風險」、「使用模型的使用者隱私性」等展開,共100 項。

最終調查情況顯示,Meta 的 Lama 2 以 54% 的透明度居冠,而 OpenAI 的 GPT-4 透明度只有 48%,谷歌的 PaLM 2 則以 40% 排名第五。

斯坦福大学发布AI基础模型透明度指标,Llama 2居首但“不及格”

▲ 圖源 史丹佛大學

在具體指標中,十大模型得分錶現均「最好」的是「模型基本資訊」(Model Basics),這項評估內容主要包含「模型訓練上是否準確介紹了模型的模式、規模、架構”,平均透明度為63%。表現最差的則是影響(Impact),主要評估基礎模型是否會“調取使用者資訊進行評估”,平均透明度只有 11%。

CRFM 主任 Percy Liang 表示,商業基礎模式的「透明度」對於推動 AI 立法,及相關產業、學術界而言,非常重要。

Rishi Bommasani 則表示,較低的模型透明度讓企業更難知道它們能否安全地依賴相關模型,也難以讓研究人員依靠這些模型來做研究。

Rishi Bommasani 最終認為,上述十大基礎模型在透明度方面都“不及格”,雖然Meta 的Llama 2 得分最高,但並不能滿足外界需求,“模型透明度最少要達到82%,才能被外界認可」。

以上是史丹佛大學發布AI基礎模型透明度指標,Llama 2居首但'不及格”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

最佳AI藝術生成器(免費付款)創意項目 最佳AI藝術生成器(免費付款)創意項目 Apr 02, 2025 pm 06:10 PM

本文回顧了AI最高的藝術生成器,討論了他們的功能,對創意項目的適用性和價值。它重點介紹了Midjourney是專業人士的最佳價值,並建議使用Dall-E 2進行高質量的可定製藝術。

開始使用Meta Llama 3.2 -Analytics Vidhya 開始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

最佳AI聊天機器人比較(Chatgpt,Gemini,Claude&更多) 最佳AI聊天機器人比較(Chatgpt,Gemini,Claude&更多) Apr 02, 2025 pm 06:09 PM

本文比較了諸如Chatgpt,Gemini和Claude之類的頂級AI聊天機器人,重點介紹了其獨特功能,自定義選項以及自然語言處理和可靠性的性能。

Chatgpt 4 o可用嗎? Chatgpt 4 o可用嗎? Mar 28, 2025 pm 05:29 PM

Chatgpt 4當前可用並廣泛使用,與諸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和產生連貫的響應方面取得了重大改進。未來的發展可能包括更多個性化的間

頂級AI寫作助理來增強您的內容創建 頂級AI寫作助理來增強您的內容創建 Apr 02, 2025 pm 06:11 PM

文章討論了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的寫作助手,重點介紹了其獨特的內容創建功能。它認為Jasper在SEO優化方面表現出色,而AI工具有助於保持音調的組成

構建AI代理的前7個代理抹布系統 構建AI代理的前7個代理抹布系統 Mar 31, 2025 pm 04:25 PM

2024年見證了從簡單地使用LLM進行內容生成的轉變,轉變為了解其內部工作。 這種探索導致了AI代理的發現 - 自主系統處理任務和最少人工干預的決策。 Buildin

向員工出售AI策略:Shopify首席執行官的宣言 向員工出售AI策略:Shopify首席執行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

選擇最佳的AI語音生成器:評論的頂級選項 選擇最佳的AI語音生成器:評論的頂級選項 Apr 02, 2025 pm 06:12 PM

本文評論了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高級AI語音生成器,重點介紹其功能,語音質量和滿足不同需求的適用性。

See all articles