目錄
Meta的未來
首頁 科技週邊 人工智慧 Meta計劃在明年發布全新的開源版GPT-4級大模型,其參數量將是Llama 2的數倍,用戶可免費商用

Meta計劃在明年發布全新的開源版GPT-4級大模型,其參數量將是Llama 2的數倍,用戶可免費商用

Sep 17, 2023 pm 10:49 PM
ai 模型

根據外媒《華爾街日報》消息,Meta正在加緊開發新的大語言模型,能力將完全對標GPT-4,預計明年推出。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

訊息還特別強調了,Meta新的大語言模型將比Llama 2大數倍,而且大機率還是會開源,支援免費商用。

自從年初Meta將LlaMA「不小心」洩漏出來之後,到7月份Llama 2的開源發布,Meta漸漸找到了自己在這次AI浪潮中的獨特位置—— AI開源社群的旗幟。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

人員的變動不斷,模型的能力有缺陷,只能依賴開源軟體來解決問題

年初,在OpenAI在用GPT-4引爆了科技業之後,Google,微軟也相繼推出了自己的AI產品。

在5月份的時候,美國監管層就邀請了當時他們認為AI行業相關的頭部企業CEO,開了一個圓桌會議,討論AI技術的發展。

OpenAI、Google和微軟都受邀參加了,甚至還有新創公司Anthropic,但Meta卻沒有出現。當時官方回應Meta缺席的原因是:「我們只邀請了AI產業中最頂尖的公司。」

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

##好事沒有輪上Meta,但是麻煩卻源源不絕地找上門。

小札在6月初收到了國會寄來的一封質詢信,信中要求他詳細解釋3月份LlaMA洩漏事故的原因和影響。這封信措辭嚴厲,要求非常明確

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

而在後來的幾個月時間裡,即便在Llama 2發布之後,Meta之前花重金打造的AI團隊卻仍在逐漸分崩離析。

在Llama 2的致謝中,提到了4個最早發起這項研究的團隊成員,其中三人已經離職,目前只有Edouard Grave仍在Meta公司工作

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

業界大牛何愷,也將離開Meta,回歸學術界。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

根據最近The Information的爆料文章,Meta的AI團隊,因為對於內部算力的爭奪,摩擦不斷,人員陸續離開。

在這樣的大背景下,小扎自己應該也很清楚,Meta自己的大語言模型,也確實沒有辦法和業界最前沿的GPT-4沾邊。

無論是從基準測試的各個方向還是使用者回饋來看,Llama 2和GPT-4之間的差距仍然很大

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

在各項基準測試中,開源的Llama 2和GPT-4之間存在相當大的差距

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

##GPT-4比Llama 2在網友的實際體驗中依然展現出明顯的領先優勢

#

因此,小扎決定讓Meta繼續在模型開源之路上狂奔不止

或許小扎背後的思路是這樣的:Meta模型的能力一般,無法與閉源大佬競爭,繼續保密也沒有意義。因此,乾脆開源,讓AI社群以自家模型為基礎進行不斷迭代,以擴大自己產品在業界的影響力

小扎曾多次公開表示,開源社群對於他們的模型迭代起到了啟發作用,使得他們的技術團隊能夠在未來開發出更具競爭力的產品

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

小扎在Fridman的播客中強調,開源能讓Meta從社群中吸收靈感,而未來Meta可能會推出閉源模型。

請參閱:https://lexfridman.com/mark-zuckerberg-2/

而事實也證明,Meta的這個選擇確實是正確的。

雖然在算力資源和技術實力上比不上谷歌,OpenAI,但是Meta的Llama 2等開源模型對於開源社群的吸引力依然是首屈一指的。隨著Llama 2慢慢成為AI開源社群的「技術底座」,Meta也在業界找到了自己的生態位。

最明顯的一個標誌是,馬上9月份將要召開的國會AI閉門會議之中,小扎終於成為了監管層的座上賓,和谷歌、OpenAI等行業最前沿的公司CEO一同作為代表,對於AI產業監管發出自己的聲音。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

而如果明年Meta推出的新模型,能夠繼續保持進步,獲得和GPT-4持平的能力,一方面能讓開源社區持續拉近與閉源巨頭的差距,坐實了「開源社群與業界最先進水準差距在一年左右」的說法。

另一方面,小札在訪談中也曾透露,如果未來大模型能力進一步提升,Meta可能會推出自己的閉源模型。如果新的模型能進一步迫近產業SOTA,也許就離Meta推出自己的閉源模型不遠了。

儘管Meta在這次AI浪潮中似乎暫時落後,但小扎並不滿足於只做一個追隨者

在Yann Lecun的指導下,Meta也在準備顛覆整個產業

Meta的未來

所以,這個傳說中能比肩GPT-4的神秘大模型之後,Meta AI未來會是什麼樣子?

因為目前還沒有具體訊息,我們也只能做一番猜測,例如從Meta AI首席科學家LeCun的態度入手。

當紅炸雞GPT,一直是LeCun批評和鄙視的人工智慧發展路線。

今年2月4日,LeCun直截了當地表達了他的觀點,他認為大型語言模型在通往人類級別AI的道路上是一條錯誤的路徑

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

他認為這種根據機率生成自回歸的大模型最多活不過5年,因為這些人工智慧只是在大量的文本上訓練的,它們無法理解現實世界。

這些模型既不會進行計劃,也不能進行推理,它們只具備上下文學習的能力

嚴肅的說,這些在LLM上訓練的人工智慧幾乎毫無「智能」可言。

而LeCun期待的,則是能夠通往AGI的 「世界模型」。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

世界模型能夠學習世界如何運作,更快速地進行學習,為完成複雜任務做出計劃,並隨時應對不熟悉的新情況。

這與需要大量預訓練的LLM不同,世界模型能夠像人類一樣,從觀察中找到規律,適應新環境、掌握新技能。

Meta力求多樣化的模型開發,與OpenAI在LLM領域不斷精進深耕的策略相比

今年6月14日, Meta發布了一個「類人」的人工智慧模型I-JEPA,也是史上第一個基於LeCun世界模型願景關鍵部分的AI模型。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

請點擊以下連結查看論文:https://arxiv.org/abs/2301.08243

I-JEPA能夠理解圖像中的抽象表徵,並透過自我監督學習獲取常識

#I-JEPA無需額外的人工製作知識作為輔助

隨後,Meta推出了Voicebox,這是一個全新的創新語音生成系統,它基於Meta AI提出的一種全新的方法——流匹配

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

它可以合成六種語言的語音,執行去雜訊、編輯內容、轉換音訊風格等操作。

Meta也發布了通用的具身AI代理人

透過語言引導技能協調(LSC),機器人可以在預先繪製的某些環境中自由移動和拾取物品

在多模態模型的開發中,Meta獨具特色

ImageBind,第一個能夠從六種不同模態綁定資訊的人工智慧模型。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

它具備了機器全面的理解能力,能夠將照片中的物體與它們的聲音、三維形狀、溫度以及運動方式聯繫起來

而來自Meta AI和CMU_Robotics共同開發的RoboAgent,讓機器人可以獲得各種各樣的非平凡技能,並將它們推廣到數百個生活場景中。

所有這些場景的資料都比之前在該領域的工作少了一個數量級

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

##對於這次爆料的模型,有網友表示,希望他們繼續開放原始碼。

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

然而,也有一些網友表示,Meta要到2024年初才會開始訓練

Meta计划在明年发布全新的开源版GPT-4级大模型,其参数量将是Llama 2的数倍,用户可免费商用

#但令人欣慰的是,Meta依舊釋放了自己將繼續堅持原有戰略的訊號。

以上是Meta計劃在明年發布全新的開源版GPT-4級大模型,其參數量將是Llama 2的數倍,用戶可免費商用的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1319
25
PHP教程
1269
29
C# 教程
1248
24
如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

怎樣在C  中處理高DPI顯示? 怎樣在C 中處理高DPI顯示? Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

給MySQL表添加和刪除字段的操作步驟 給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

C  中的字符串流如何使用? C 中的字符串流如何使用? Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。

See all articles