史丹佛「草泥馬」火了:100美元就能比肩GPT-3.5!手機都能運作的那種
一夕之間,大模型界又炸出個big news!
史丹佛發表Alpaca(羊駝,網友口中的「草泥馬」):
只花100美元,人人都可微調Meta家70億參數的LLaMA大模型,效果竟可比肩1750億參數的GPT-3.5(text-davinci-003)。
而且還是單卡就能運作的那種,連樹莓派、手機都能hold住!
還有一個更絕的「騷操作」。
研究所涉及的資料集,是史丹佛團隊花了不到500美元用OpenAI的API來產生的。
所以整個過程下來,就等同於GPT-3.5自己教出了個旗鼓相當的對手AI。
然後團隊也說,用大多數雲端運算平台去微調訓練好的模型,成本也不到100美元:
複製一個GPT-3.5效果的AI,很便宜,很容易,還很小。
而且團隊還把資料集(秒省500刀)、程式碼統統都給開源了,這下子人人都能去微調個效果炸裂的對話AI:
#專案在GitHub發布才半天時間,便已經狂攬1800 顆星,火爆程度可見一斑。
Django共同開發者甚至對史丹佛的新研究用「驚天大事」來形容:
不僅如此,史丹佛團隊還搞了demo,在線可玩的那種。
話不多說,我們現在就來看看這個「草泥馬」的效果。
比肩davinci-003的草泥馬Aplaca
在史丹佛官方的示範中,他們先小試牛刀地提了一個問題:
什麼是羊駝?它和美洲駝的差別是什麼?
草泥馬Aplaca給出的答案較為乾練:
羊駝是一種小型駱駝科動物,原產於秘魯、玻利維亞、厄瓜多和智利;它比美洲駝小,羊毛更細,也沒有駝峰。
而後又簡單的介紹了二者群居生活的不同。
同樣的問題若是交給ChatGPT(GPT3.5-turbo),則答案就不會像草泥馬Aplaca那般簡潔:
對此,團隊給出的解釋是:
Alpaca的答案通常比ChatGPT短,反映text-davinci-003的輸出較短。
而後團隊示範了讓草泥馬Alpaca寫郵件:
寫一封e-mail祝賀被史丹佛大學錄取的新生,並提到你很高興能親自見到他們。
草泥馬Alpaca對於這個任務也是信手拈來,直接給了一個像模像樣的郵件模板:
難度再次進階,團隊這次提出了讓草泥馬Alpaca寫論文摘要的需求:
寫一篇經過深思熟慮的機器學習論文摘要,證明42是訓練神經網路的最優seed。
草泥馬Alpaca給出的答案從內容上來看,非常符合大多數論文的摘要形式:試圖回答什麼問題、用了什麼方法、結果如何,以及未來展望。
當然,也有迫不及待的網友親自下場試驗,發現草泥馬Alpaca寫程式也是不在話下。
但即使草泥馬Alpaca能夠hold住大部分問題,但這並不代表它沒有缺陷。
例如團隊便示範了一個例子,在回答「坦尚尼亞的首都是哪裡」的問題時,草泥馬Alpaca給出的答案是「達累斯薩拉姆」。
但其實早在1975年就被「多馬」取代了。
除此之外,若是親自體驗過草泥馬Alpaca就會發現,它…巨慢:
對此,有網友認為可能是使用的人太多的原因。
筆記本、手機、樹莓派都能跑
Meta開源的LLaMA大模型,剛發布幾週就被大家安排明白了,單卡片就能運作。
所以理論上,基於LLaMA微調的Alpaca同樣可以輕鬆地在本地部署。
沒有顯示卡也沒關係,蘋果筆記本甚至樹莓派、手機都可以玩。
作者實測,M1晶片的MacBook Pro上即可運行,另外也支援Windows和Linux系統。
還是這個C 移植版本,有人成功在4GB記憶體的樹莓派4上成功運行了LLaMA的 70億參數版本。
雖然速度非常慢,大約10秒產生一個token(也就是一分鐘蹦出4.5個單字)。
更離譜的是僅僅2天之後,有人把LLaMA模型量化壓縮(權重轉換成更低精度的資料格式)後成功在Pixel 6安卓手機上運行(26秒一個token)。
Pixel 6使用Google自研處理器Google Tensor,跑分成績在驍龍865 到888之間,也就是說新一點的手機理論上都能勝任。
微調資料集也開源
###史丹佛團隊微調LLaMA的方法,來自華盛頓大學Yizhong Wang等去年底提出的Self-Instruct。 ###############以175個問題作為種子任務,讓AI自己從中組合出新的問題以及生成配套答案實例,人工過濾掉低質量的,再把新任務添加到任務池裡。 ######所有這些任務,之後可以採用InstructGPT的方法讓AI學會如何遵循人類指令。 ######套娃幾圈下來,相當於讓AI自己來指導自己。 ###############史丹佛版Alpaca,就是花了不到500美元使用OpenAI API產生了5.2萬個這樣的範例搞出來的。 ###這些數據同樣開源了出來,而且比原論文的數據多樣性更高。
同時也給了產生這些數據的程式碼,也就是說如果有人還嫌不夠,可以再去自行擴充微調數據,繼續提升模型的表現。
微調程式碼也會在HuggingFace官方支援LLaMA後放出。
不過Alpaca最終的模型權重需要Meta許可才能發布,並且繼承了LLaMA的非商用開源協議,禁止任何商業用途。
並且由於微調資料使用了OpenAI的API,根據使用條款也禁止用來開發與OpenAI形成競爭的模型。
One More Thing
還記得AI繪畫的發展歷程嗎?
2022年上半年還只是話題熱度高,8月份Stable Diffusion的開源讓成本下降到可用,並由此產生爆炸式的工具創新,讓AI繪畫真正進入各類工作流程。
語言模型的成本,如今也下降到了個人電子設備可用的程度。
最後還是由Django框架創始人Simon Willison喊出:
大語言模型的Stable Diffusion時刻到了。
以上是史丹佛「草泥馬」火了:100美元就能比肩GPT-3.5!手機都能運作的那種的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。
