目錄
全面取得SOTA,但8k視窗
Llama迎來官方網頁版
One More Thing
首頁 科技週邊 人工智慧 Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

Apr 19, 2024 pm 12:43 PM
python meta Python直程式

Llama 3來了!

就在剛剛,Meta官網上新,官宣了Llama 3 80億和700億參數版本。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

並且推出即為開源SOTA:

Meta官方數據顯示,Llama 3 8B和70B版本在各自參數規模上超越一眾對手。

8B模型在MMLU、GPQA、HumanEval等多項基準上都勝過Gemma 7B和Mistral 7B Instruct。

而70B模型則超越了閉源的當紅炸子雞Claude 3 Sonnet,和谷歌的Gemini Pro 1.5打得有來有回。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

Huggingface連結一出,開源社群再次沸騰。

眼尖的盲生們還第一時間發現了華點:

Meta更藏了一手4000億參數 的Llama 3版本,不遜於Claude 3超大杯Opus的那種!

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

AI寫作助手創企HyperWriteAI的CEO見此已忍不住感慨:

我們正在步入一個新世界,一個GPT -4層級的模型開源並且可以自由存取的世界。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

英偉達科學家Jim Fan則認為,還在訓練中的Llama 3 400B將成為開源大模型的分水嶺,改變許多學界研究和新創公司的發展方式。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

全面取得SOTA,但8k視窗

更多技術細節,Meta在部落格文章中給出。

架構層面,Llama 3選擇了經典的僅解碼(decoder-only)式Transformer架構,採用包含128K token詞彙表的分詞器。

訓練數據上看,Llama 3的訓練數據規模達到了15T tokens,全部來自於公開信息,其中5%為非英文數據,涵蓋30多種語言。

Llama 3的資料量比Llama 2的訓練資料多7倍,其中程式碼比Llama 2多4倍。

此外,為了提高Llama 3 模型的推理效率,Meta AI也採用了分組查詢注意力(GQA)機制,在8192個tokens的序列上訓練模型,並使用掩碼確保自註意力不會跨越文檔邊界。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

結果,無論是8B或70B版本,Llama 3相較於近似規模的上一代Llama 2,都取得了重大飛躍。

在迄今為止的8B和70B參數規模的模型中,Llama 3都成為了新的SOTA模型。

在語言(MMLU)、知識(GPQA)、程式設計(HumanEval)、數學(GSM-8K、MATH)等能力上,Llama 3幾乎全面領先於同等規模的其他模型。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

除了這些常規的資料集,Meta AI也評估了Llama 3在現實場景中的效能,並為此研發了一套高品質的測試資料集。

這個測試集包含了1800條數據,涵蓋程式碼、推理、寫作、總結等12 個關鍵用例,並針對開發團隊保密。

結果,Llama 3不僅大幅超越Llama 2,也戰勝了Claude 3 Sonnet、Mistral Medium和GPT-3.5這些知名模型。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

而在AGIEval、BIG-Bench、ARC-Challenge這些更高階、更困難的資料集上,Llama 3的表現同樣可圈可點。

8B版本在這些任務上超越了Mistral和Gemma,70B版本則戰勝了Gemini Pro和MoE架構的Mixtral,分別斬獲對應規模的SOTA。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

不過美中不足的是,Llama 3的上下文視窗只有8k,這與現在動輒幾十上百萬窗口的大模型相比,彷彿還停留在上一代(手動狗頭)。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

但也不必過度擔憂,Matt Shumer就對此持樂觀態度,他表示相信在開源社群的努力下,視窗長度很快就會擴展上去。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

Llama迎來官方網頁版

目前,Llama 3兩種參數量的基礎和Instruct版本都已上線Hugging Face可供下載。

此外,微軟Azure、Google雲端、亞馬遜AWS、英偉達NIM等雲端服務平台也將陸續上線Llama 3。

同時,Meta也表示Llama 3會得到英特爾、英偉達、AMD、高通等多家廠商提供的硬體平台支援。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

值得一提的是,此次與基礎模型一同發布的,還有基於Llama 3的官方Web版本,名字就叫Meta AI。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

目前平台有對話和繪畫兩大功能,只用對話的話無需註冊登入、即開即用,使用繪畫功能則需要先登入帳號。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

不過,該平台目前還不支援中文,也暫未上線文字上傳等功能。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

程式碼方面,該平台也能夠運行一些簡單的Python程序,但似乎只能輸出文本,涉及到繪圖這樣的任務就無法運行了。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

總的來看,這個網頁版本還比較初級,但也不妨期待一波後面的更新。

One More Thing

一個小插曲是,其實在Meta官員宣前幾個小時,微軟的Azure市場已經偷跑了Llama 3 8B Instruct版本的消息。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

開源模型機器學習線上平台Replicate上的Llama 3價格表也被網友們第一時間扒拉了出來。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來

但很快,這些「小道消息」就都被404了。

好在烏龍完了,官方也沒拖著,關心開源大模型的小夥伴們,可以造作起來了(doge)。

Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來


##參考連結:

[1]https://ai.meta.com/blog/meta-llama-3/。 #[2]https://about.fb.com/news/2024/04/meta-ai-assistant-built-with-llama-3/。美洲駝/Meta-Llama-3-70B。

以上是Llama3突然來襲!開源社群再次沸騰:GPT4級模式自由訪問時代到來的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1666
14
CakePHP 教程
1425
52
Laravel 教程
1326
25
PHP教程
1273
29
C# 教程
1252
24
PHP和Python:解釋了不同的範例 PHP和Python:解釋了不同的範例 Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

在PHP和Python之間進行選擇:指南 在PHP和Python之間進行選擇:指南 Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

sublime怎麼運行代碼python sublime怎麼運行代碼python Apr 16, 2025 am 08:48 AM

在 Sublime Text 中運行 Python 代碼,需先安裝 Python 插件,再創建 .py 文件並編寫代碼,最後按 Ctrl B 運行代碼,輸出會在控制台中顯示。

PHP和Python:深入了解他們的歷史 PHP和Python:深入了解他們的歷史 Apr 18, 2025 am 12:25 AM

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

Python vs. JavaScript:學習曲線和易用性 Python vs. JavaScript:學習曲線和易用性 Apr 16, 2025 am 12:12 AM

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

Golang vs. Python:性能和可伸縮性 Golang vs. Python:性能和可伸縮性 Apr 19, 2025 am 12:18 AM

Golang在性能和可擴展性方面優於Python。 1)Golang的編譯型特性和高效並發模型使其在高並發場景下表現出色。 2)Python作為解釋型語言,執行速度較慢,但通過工具如Cython可優化性能。

vscode在哪寫代碼 vscode在哪寫代碼 Apr 15, 2025 pm 09:54 PM

在 Visual Studio Code(VSCode)中編寫代碼簡單易行,只需安裝 VSCode、創建項目、選擇語言、創建文件、編寫代碼、保存並運行即可。 VSCode 的優點包括跨平台、免費開源、強大功能、擴展豐富,以及輕量快速。

notepad 怎麼運行python notepad 怎麼運行python Apr 16, 2025 pm 07:33 PM

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後,在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”,即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。

See all articles