大模型競賽,又殺出一匹黑馬-
Inflection-2.5###,由DeepMind聯創Mustafa Suleyman的大模型新創公司打造。
只用40%的運算資源訓練,表現就超過了GPT-4的九成,尤其擅長程式碼和數學。圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
求出函數f(x)=x³ 2x²-1的極值點
#解完全正確,而是十分詳細。
當然要想數學好,邏輯思維是必不可少的,所以我們在常規的數學題之外,又用一道經典的題目考驗了一下的Pi邏輯思維,結果還不錯。
透過Pi的表現,可以看出背後的Inflection-2.5模型的確可圈可點。
而從官方自己公佈的測試數據來看,無論是綜合能力還是各個子項,Inflection-2.5的表現都緊跟著GPT-4。
以數學和程式碼為例,Inflection-2.5在MATH、HumanEval等測驗中都比1.0版本都有大幅飛躍。
在這些常規的資料集之外,Inflection還挑戰了匈牙利高考數學試題和GRE物理測試,結果幾乎與GPT-4打成平手。
比較「刁鑽」的,還有人專門用大模型難以理解的問題建構了一個BIG-Bench資料集,而Inflection-2.5挑戰了其中的Hard子集,結果和GPT-4的差距不到一分。
那麼,Inflection-2.5的背後,是怎樣的公司呢?
這家公司名叫Inflection AI,由DeepMind聯創Mustafa Suleyman等人於2022年創立,目前共有70餘人。
同樣來自DeepMind的,還有資深研究員Karen Simonyan,現擔任Inflection AI的首席科學家。
此外,LinkedIn聯創Reid Hoffman也參與了Inflection AI的創立。
創立以來,Inflection AI已經獲得了來自英偉達、微軟、比爾蓋茲等巨頭的共計15億美元的融資。
目前,基於Inflection的Pi還是免費的,但CEO Suleyman也表示,一直用愛發電不現實,長久地看以後還是要收費。
想要體驗的朋友,可能要抓緊時間了~
傳送門:https://pi.ai
以上是40%算力訓練效果比肩GPT-4,實測DeepMind聯創大模型創業新成果的詳細內容。更多資訊請關注PHP中文網其他相關文章!