GPT-4真的被反超了!
大模型競技場上,Claude 3大杯Opus新王登基,Elo分數來到榜首。
連小杯Haiku也躋身第二梯隊,超過了GPT-4-0613這個型號,把GPT-3.5-turbo遠遠甩在身後。
Haiku的輸入token價格,可是比GPT-3.5-turbo還便宜了一半,輸出方面,每100萬token也比GPT-3.5-turbo便宜近2塊錢。
跟GPT-4相比,價格更是只有1/20。並且Haiku同樣支援200k上下文。
難怪有開發者直言:
GPT-3.5在Claude Haiku面前不堪一擊。
不只是價格更便宜,Haiku還更上一層樓了。
而在Claude 3加入競技之前,GPT-4家族已經霸榜快一年了。
給新來的朋友補充背景知識:大模型競技場榜單(LMSYS Chatbot Arena Leaderboard)的評分標準是人類評分,同一個問題同時投給A、B兩個模型,人類裁判覺得哪個回答得好就給哪個投票。
值得一提的是,在競技場官方賀電中,Haiku這個型號也被專門高亮了出來:
根據我們的用戶偏好,Claude 3 Haiku達到了GPT-4等級。
其速度、功能和上下文長度在目前的市場上是獨一份的。
具體有多快,已經有網友做了個直覺的對比:
博爾特還沒跑完100米,Haiku已經讀完100k token的文檔了……
事實上,憑藉其超高的性價比,在開發者社群中,Claude 3小杯Haiku確已成新寵。
已經有人第一時間大開腦洞,搞出了能讓Haiku效果「超頻」到大杯Opus水準的開源項目,吸引不少關注。
簡單來說,就是讓Opus給Haiku當老師:
先用Opus產生執行任務的範例,再用這些教學案例來提高Haiku的姿勢水平。
劃重點:Haiku的價格僅為Opus的1/60,而反應速度則是Opus的10倍。
這個名為gpt-prompt-engineer的專案目前在GitHub上累積攬下7.3k標星。
還是這位馬特老哥,還用Opus和Haiku搞了個“AI股票分析師”,直接火上了GitHub熱榜。
Многие прикладные продукты также были впервые подключены к Haiku. Например, Vercel может автоматически создавать пользовательский интерфейс веб-сайта на основе подсказок.
Однако среди голосов, восхваляющих нового короля Клода 3, некоторые пользователи сети подумали:
Тот факт, что GPT-3.5 — «старая» модель и до сих пор конкурирует с новейшими моделями, просто безумие.
Но, конечно, больше всего разработчики ждут:
OpenAI, вставай и объем (дож).
以上是Claude 3反超GPT-4競技場登頂!小杯Haiku成開發者新寵:性價比無敵的詳細內容。更多資訊請關注PHP中文網其他相關文章!