開源與閉源的紛爭已久,現在或許已經達到了一個新的高潮。說到開源大模型,Llama 系列自誕生以來就是典型代表,其優秀的效能與開源特點讓人工智慧技術的應用性和可訪問性大大提升。任何研究人員和開發者都能夠從中獲益,讓研究和應用變得更加廣泛。現在,Meta Llama 3.1 405B 正式發布。在官方部落格中,Meta 表示:「直到今天,開源大語言模型在功能和效能方面大多落後於封閉模型。現在,我們正在迎來一個開源引領的新時代。」
Meta 創辦人祖克柏闡述開源對AI 的意義- 開源是AI 發展的必要條件
Meta 創辦人兼執行長祖克柏表示,開源對AI 的積極發展至關重要。他以 Unix 和 Linux 的發展為例,認為開源 AI 將促進創新、資料保護和成本效益。
- 開源Llama 模型建構完整生態系統
祖克柏認為,開源Llama 模型可以建立一個完整的生態系統,確保技術進步,並避免因競爭而喪失優勢。
- Meta 的開源歷史和願景
Meta 擁有成功的開源歷史。祖克柏希望透過開源 AI 模型,促進全球技術的平等和安全應用。
原文連結:https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/
以下是原文內容:
扎克伯克為Meta 注入開源基因
在高效能運算的早期,各大主流科技公司都投入大量資金開發各自的閉源Unix 版本。當時很難想像會有其他方法能開發出如此先進的軟體。
然而,開源的Linux 逐漸流行起來:最初是因為它允許開發人員自由修改程式碼且價格更實惠,而後來它變得更先進、更安全,並且擁有比任何閉源Unix 更廣泛的生態系統,支援更多的功能。今天,Linux 已成為雲端運算和運行大多數行動裝置的作業系統的行業標準基礎, 大家都因其卓越的產品而受益。
我相信人工智慧的發展也與其發展軌跡類似。今天,一些科技公司正在開發領先的閉源模型,但開源正在迅速縮小差距。
去年,Llama 2 僅能與一代舊型號相媲美。而在今年,Llama 3 在某些領域已經可以與業界領先的模式競爭甚至領先。明年開始,我們預計未來的 Llama 模型將成為業界中最先進的大模型。在此之前,Llama 也已經在開放性、可修改性和成本效益方面領先。
今天,我們正邁出下一步 —— 讓開源 AI 成為業界標準。我們發布了第一個前沿級開源 AI 模型 Llama 3.1 405B,以及改進版的 Llama 3.1 70B 和 8B 模型。較於閉源模型,這些開源模型在成本效益上顯著提升,特別是 405B 模型的開源特性,使其成為微調和蒸餾小型模型的最佳選擇。
除了發表這些模型,我們也與多家公司合作,拓展更廣泛的生態系統。亞馬遜、Databricks 和英偉達正在推出全套服務,支援開發者微調和蒸餾他們自己的模型。像 Groq 這樣的創新者已經為所有新模型建立了低延遲、低成本的推理服務。
這些模型將在包括 AWS、Azure、Google、Oracle 等所有主要雲端平台上可用。 Scale.AI、戴爾、德勤等公司已經準備好幫助企業採用 Llama 並使用自己的資料訓練客製化模型。隨著社區的成長和更多公司開發新服務,我們可以共同使 Llama 成為行業標準,並將 AI 的益處帶給每個人。
Meta 致力於開源 AI,以下是我認為開源是最佳開發平台的原因,為什麼開源 Llama 對 Meta 有利,以及為什麼開源 AI 對世界有益,並由此將長期存在。
開源 AI 之於開發者
當我與全球的開發者、CEO 和政府官員交談時,通常聽到幾個主題:
我們需要訓練、微調和蒸餾自己的模型。每個組織都有不同的需求,這些需求最好透過使用不同規模並使用特定資料訓練或微調的模型來滿足。設備上的任務和分類任務需要小型模型,而更複雜的任務則需要大型模型。現在,你可以使用最先進的 Llama 模型,繼續用自己的數據訓練它們,然後將它們蒸餾成最適合你需求的模型規模 —— 無需我們或任何其他人看到你的數據。
我們需要掌控自己的命運,而不是被閉源供應商「鎖死」。許多組織不希望依賴他們無法自己運作和控制的模型。他們不希望閉源模型供應商能夠更改模型、改變使用條款,甚至完全停止服務。他們也不希望被鎖定在擁有模式專有權的單一雲端平台上。開源使得相容工具鏈的廣泛生態系統成為可能,你可以輕鬆地在這些工具之間切換。
我們需要保護我們的資料。許多組織處理需要保護的敏感數據,無法透過雲端 API 發送到閉源模型。有些組織則根本不信任閉源模型供應商對其資料的處理。開源解決了這些問題,因為它使你可以在任何你想要的地方運行模型。眾所周知,開源軟體會因為開發過程更加透明,而更安全。
我們需要一個高效率且經濟的模型。開發者可以在自己的基礎設施上運行 Llama 3.1 405B,進行推理,成本大約是使用閉源模型(如 GPT-4)的 50%,適用於用戶端和離線推理任務。
我們希望投資於將成為長期標準的生態系統。許多人看到開源的發展速度快於封閉模型,他們希望在能夠長期提供最大優勢的架構上建立自己的系統。
開源 AI 之於 Meta
Meta 的商業模式是為人們建立最佳體驗和服務。為了實現這一目標,我們必須確保始終能夠獲得最佳技術,而不是被鎖定在競爭對手的封閉生態系統中,這樣他們就不能限制我們所開發的內容。
我想分享一個重要經驗:雖然蘋果公司允許我們在其平台上建立內容,但是當我們建立服務時仍受到了限制。無論是他們對開發者的稅收、他們施加的任意規則,還是他們阻止的所有產品創新,顯而易見,如果我們能夠構建產品的最佳版本,並且競爭對手無法限制我們構建的內容,Meta 和許多其他公司將能夠為人們提供更好的服務。從哲學層面上講,這也是我如此堅信在 AI 和 AR/VR 領域為下一代電腦建立開放生態系統的一個重要原因。
人們常常問我是否擔心因為開源Llama 而失去技術優勢,但我認為這忽略了大局,原因有以下幾點:
首先,為了確保我們能夠長期保持技術領先,並且不被鎖定在在閉源生態系統中,Llama 需要發展成一個完整的生態系統,包括工具、效率改進、硬體優化和其他整合。如果只有我們公司使用 Llama,這個生態系統將不會發展,我們的境況也不會比 Unix 的閉源變種好多少。
其次,我預計 AI 開發將繼續保持高度競爭,這意味著在任何給定時刻,開源某個模型不會使我們在與下一個最佳模型的競爭中失去巨大優勢。 Llama 成為行業標準的途徑是透過一代又一代地保持競爭力、高效性和開放性。
第三,Meta 與閉源模型供應商的一個關鍵差異在於,銷售 AI 模型的存取權並不是我們的商業模式。這意味著公開發布 Llama 不會削弱我們的收入、永續性或投資研究的能力,而閉源提供者則會受到影響。 (這也是為什麼一些閉源供應商一直在遊說公共管理者反對開源的原因之一。)
最後,Meta 在開源專案上有著豐富的成功經驗。透過與開放運算專案分享我們的伺服器、網路和資料中心設計,並使供應鏈標準化,我們節省了數十億美元。透過開源 PyTorch、React 等領先工具,我們從生態系統的創新中受益匪淺。這種方法長期以來一直極具效果。
開源 AI 之於世界
我相信開源對 AI 的未來是必要的。 AI 比任何其他現代技術都更有潛力提高人類的生產力、創造力和生活質量,並且能夠在加速經濟成長的同時推動醫學和科學研究的進步。開源將確保全球更多的人能夠從 AI 的發展中獲得利益和機會,權力不會集中在少數幾家公司手中,並且技術能夠更均勻和安全地在社會中部署。
關於開源 AI 模型的安全性,存在著持續的爭論。我的觀點是,開源 AI 將比替代方案更安全。我認為各國政府最終會得出支持開源的結論,因為這將使世界更加繁榮和安全。
在我理解的安全性框架中,我們需要防範兩類危害:無意和故意。
無意的危害是指 AI 系統可能在運作時非故意造成傷害。例如,現代 AI 模型可能在無意中給出錯誤的健康建議。或者,在未來場景中,有人擔心模型可能會無意中自我複製或過度優化目標,從而對人類造成損害。
故意的危害是指不良行為者使用 AI 模型以造成傷害為目的。
值得注意的是,無意的危害涵蓋了人們對 AI 的多數擔憂 —— 從 AI 系統對數十億用戶的影響到大多數真正災難性的科幻場景。在這方面,開源所帶來的安全性更加顯著,因為系統更透明,可以被廣泛審查。
歷史上,開源軟體因為這個原因一直比較安全。同樣,使用 Llama 及其安全系統如 Llama Guard,可能會比閉源模型更安全和更可靠。因此,大多數關於開源 AI 安全性的討論集中在故意的危害上。
我們的安全流程包括嚴格的測試和紅隊評估,以檢驗我們的模型是否有可能造成實質傷害,此目標
以上是Llama成大模型頂流,祖克柏掀論戰:玩開源,時代變了的詳細內容。更多資訊請關注PHP中文網其他相關文章!