ChatGPT-4震撼發布!準確度提高,能在SAT上能擊敗90%人類
3月15日消息,美國當地時間週二,人工智慧研究公司OpenAI發布了其下一代大型語言模型GPT-4,這是其支援ChatGPT和新必應等應用程式的最新AI大型語言模型。該公司表示,該模型在許多專業測試中的表現超出了「人類水平」。
OpenAI聲稱,ChatGPT-4比迭代前的GPT-3.5更大,這意味著它接受了更多的資料訓練,模型檔案中有更多的權重(參數),這也使得它的運行成本更高。該公司聲稱,該模型“比以往任何時候都更具創造性和協作性”,“可以更準確地解決難題”。它可以解析文字和圖像輸入,儘管它只能透過文字進行回應。
目前,該領域的許多研究人員認為,AI最近的許多進步來自於在數千台超級電腦上運行越來越大的模型,訓練過程可能耗資數千萬美元。 GPT-4就是以「擴大規模」為中心以達到更好結果的例證。
OpenAI承認,該公司使用了微軟雲端運算平台Azure來訓練其模型,微軟已經向OpenAI投資了數十億美元。 OpenAI以競爭為由,沒有公佈具體的模型大小或用於訓練它的硬體等細節,這些細節可以用來重建模型。
OpenAI的GPT大型語言模型支援許多AI演示,這些演示在過去六個月裡始終令科技行業的人們驚嘆不已,包括必應的AI聊天機器人和ChatGPT。
ChatGPT-4是對語言模型取得最新進展的預覽,這些新進展可能會在未來幾週開始向下滲透到聊天機器人等消費產品中。微軟週二表示,必應的AI聊天機器人使用GPT-4模型。
OpenAI聲稱,新模型將產生更少的事實錯誤答案,更少偏離話題,更少談論被禁止的話題,甚至在許多標準化考試中表現得比人類更好。
該公司舉例說,GPT-4在模擬律師考試中的成績在所有考生中列於前10%,在SAT閱讀考試中進入了前7%,在SAT數學考試中進入前11 %。
然而,OpenAI警告說,新模型還不夠完美,在許多情況下它的能力不如人類。例如,GPT-4仍然存在所謂的「幻覺」或編造故事等問題,而且在事實上並不可靠。當它犯錯的時候,它仍然傾向於堅持自己是正確的。 OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用時仍然能給你留下深刻印象。」
OpenAI在部落格文章中表示:「GPT-4仍有許多已知的局限性,我們正在努力解決,如社交偏見、幻覺和敵意回復等。在一次隨意的談話中, GPT-3.5和GPT-4之間的差異很小。而當任務的複雜性達到足夠的閾值時,差異就會顯現出來:GPT-4比GPT-3.5更可靠、更有創造力,並且能夠處理更多細微差別的指令。」
OpenAI表示,該公司已經與多家公司合作將GPT-4整合到他們的產品中,包括Duolingo、Stripe和Khan Academy等。這款新模型透過OpenAI每月20美元的ChatGPT訂閱服務ChatGPT Plus向用戶開放,並為微軟的必應聊天機器人提供動力。同時,GPT-4也將作為API的一部分提供,該API允許程式設計師將AI整合到自己的應用程式中。
以上是ChatGPT-4震撼發布!準確度提高,能在SAT上能擊敗90%人類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

2023年,AI技術已成為熱門話題,對各行業產生了巨大影響,程式設計領域尤其如此。人們越來越認識到AI技術的重要性,Spring社群也不例外。隨著GenAI(GeneralArtificialIntelligence)技術的不斷進步,簡化具備AI功能的應用程式的創建變得至關重要和迫切。在這個背景下,"SpringAI"應運而生,旨在簡化開發AI功能應用程式的過程,使其變得簡單直觀,避免不必要的複雜性。透過"SpringAI",開發者可以更輕鬆地建立具備AI功能的應用程序,將其變得更加易於使用和操作

OpenAI最近宣布推出他們的最新一代嵌入模型embeddingv3,他們聲稱這是效能最出色的嵌入模型,具備更高的多語言效能。這一批模型被劃分為兩種類型:規模較小的text-embeddings-3-small和更強大、體積較大的text-embeddings-3-large。這些模型的設計和訓練方式的資訊披露得很少,模型只能透過付費API存取。所以就出現了很多開源的嵌入模型但是這些開源的模型與OpenAI閉源模型相比如何呢?本文將對這些新模型與開源模型的效能進行實證比較。我們計劃建立一個數據

如果AI模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統在更重要的領域中得到應用,證明為什麼我們可以信任它們的輸出,並明確何時不應信任它們,變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是,要求系統對其輸出產生一種解釋,這種解釋對人類或另一個受信任的系統來說是可讀的,即可以完全理解以至於任何可能的錯誤都可以被發現。例如,為了建立對司法系統的信任,我們要求法院提供清晰易讀的書面意見,解釋並支持其決策。對於大型語言模型來說,我們也可以採用類似的方法。不過,在採用這種方法時,確保語言模型生

作者丨TimAnderson編譯丨諾亞出品|51CTO技術堆疊(微訊號:blog51cto)Zed編輯器專案目前仍處於預發布階段,已在AGPL、GPL和Apache許可下開源。此編輯器以高性能和多種AI輔助選擇為特色,但目前僅適用於Mac平台使用。內森·索博(NathanSobo)在一篇貼文中解釋道,Zed專案在GitHub上的程式碼庫中,編輯器部分採用了GPL許可,伺服器端元件則使用了AGPL許可證,而GPUI(GPU加速用戶介面)部分則採用了Apache2.0授權。 GPUI是Zed團隊開發的一款

Ollama是一款超實用的工具,讓你能夠在本地輕鬆運行Llama2、Mistral、Gemma等開源模型。本文我將介紹如何使用Ollama實現對文本的向量化處理。如果你本地還沒有安裝Ollama,可以閱讀這篇文章。本文我們將使用nomic-embed-text[2]模型。它是一種文字編碼器,在短的上下文和長的上下文任務上,效能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。啟動nomic-embed-text服務當你已經成功安裝好o

不久前OpenAISora以其驚人的視訊生成效果迅速走紅,在一眾文生視訊模型中突顯重圍,成為全球矚目的焦點。繼2週前推出成本直降46%的Sora訓練推理復現流程後,Colossal-AI團隊全面開源全球首個類Sora架構視頻生成模型“Open-Sora1.0”,涵蓋了整個訓練流程,包括數據處理、所有訓練細節與模型權重,攜手全球AI熱愛者共同推動影片創作的新紀元。先睹為快,我們先看一段由Colossal-AI團隊發布的「Open-Sora1.0」模型生成的都市繁華掠影影片。 Open-Sora1.0

微軟、OpenAI開年被曝預將大筆資金砸向人形機器人新創公司。其中,微軟計畫掏出9,500萬美元,OpenAI跟投500萬美元。彭博社消息稱,這家公司本輪預計共融資5億美元,投前估值或將達19億美元。是什麼吸引了他們?不妨先來看看這家公司的機器人成果。只見這個機器人通體銀黑,外觀酷似好萊塢科幻大片中的機器人形象:現在,他正在將一顆咖啡膠囊放進咖啡機裡:如果沒放正,還會自主調整,無需任何人為遠程遙控:不過一會兒,一杯咖啡就可以端走享用:有木有家人們已經認出來了,沒錯,這款機器人就是前段時間

突發! OpenAI開人了,理由:涉嫌資訊外洩。一位是失蹤的首席科學家Ilya盟友,超級對齊(Superalignment)團隊核心成員LeopoldAschenbrenner。另一位也不簡單,是LLM推理團隊研究員PavelIzmailov,曾經也在超級對齊團隊幹過。目前尚不清楚這倆到底洩漏了啥訊息。消息曝光後,不少網友表示「挺震驚」:不久前我還看過Aschenbrenner的貼文,感覺他正處於事業上升期,沒想到會有這樣的轉變。圖片還有網友認為:OpenAI失去Aschenbrenner,I
