近來一段時間,人工智慧聊天機器人ChatGPT刷爆網絡,網友們爭先恐後去領略它的超高情商和巨大威力。參加高考、修改程式碼、構思小說……它在廣大網友的「鞭策」下不斷突破自我,甚至可以用一整段程序,為你拼接出一隻小狗。而這些技能只是基於GPT-3.5開發而來,在3月15日,AI世界再次更新,最新版本的GPT-4也被OpenAI發布了出來。
與之前相比,GPT-4不僅展現了更強大的語言理解能力,還能夠處理圖像內容,在考試中的得分甚至能超越90%的人類。那麼,如此「逆天」的GPT-4還具有哪些能力呢?它又是如何煉成的呢?
在發布了GPT-4後,OpenAI官網一度發生擁堵,許多用戶在社群媒體裡面表示他們立刻訂閱了Plus服務。 GPT-4在發布後,「GPT-4」這一詞條迅速登上美國、日本等地區熱榜,也登上了國內的微博熱搜榜、抖音熱榜社會榜等。
根據OpenAI官方介紹,GPT-4是一個大型的多模式模型,可以接收圖像和文字輸入,輸出文字。雖然它在許多現實世界場景中的能力不如人類,但在各種專業和學術基準上表現出人類水平的表現。例如GPT-4可以透過模擬SAT(美國學術能力評估測驗),並且取得前10%的成績,而GPT-3.5的成績則在最後10%之列。
我們看到,在官方演示影片中,Open AI總裁兼聯合創始人Greg Brockman也讓用戶先睹為快,了解最新版系統的圖像識別功能,該系統尚未公開,僅由一家名為Be My Eyes的公司測試。此功能將允許 GPT-4 分析和回應與提示一起提交的影像,並根據這些影像回答問題或執行任務。 「GPT-4 不僅僅是一種語言模型,它還是一種視覺模型,」Brockman表示,「它可以靈活地接受任意穿插圖像和文字的輸入,有點像文檔。」
在演示的另一個時刻,Greg Brockman向GPT-4提交了一張手繪和初步網站草圖的照片,系統創建了一個工作基於繪圖的網站。
業界認為,ChatGPT-4比GPT-3強大571倍,最受益於此最新成果的三大職業就是作家、行銷人員和創業家。根據對兩者比較,業界人士還指出GPT-4的其他優勢,如訓練資料更多、答覆更加多樣性和有創意性以及反應所需時長更短,一秒即可。
我們認為,這種升級體現的一個主要趨勢就是多模態,模型變得更加複雜龐大,可以將不同類型的資料放入同一模型,對我們週邊的環境和真實世界做出更好的理解。
此外,在多語言方面,GPT-4也體現出優越性。在測試的26種語言中,GPT-4在24種語言的表現均優於GPT-3.5等其他大語言模型的英語語言表現,其中包括部分低資源語言如拉脫維亞語、威爾斯語等。在中文語境中,GPT-4能夠達到80.1%的準確性。
不過,OpenAI也在官方網站上給出了GPT-4存在的不足,其仍然存在包括社會偏見、捏造事實、對抗生成等已知限制。 OpenAI對此表示,隨著社會對AI模型的接受,將增加透明度,鼓勵並促進用戶教育和更廣泛的人工智慧素養,並致力於擴大人們在培養AI模型方面的輸入途徑。
隨著GPT-4的發展,我們發現它的能力雖然在許多現實場景中不如人類,但在各種專業和學術基準測試中表現出了與人類相當的水平,這也意味著,GPT-4確實在商業化上更進一步了。
先前,GPT-3在專業領域的表現一直被人們認為差強人意,在美國的律師資格考試Uniform Bar Exam (MBE MEE MPT)中,GPT-3.5只能排在倒數10%,而GPT-4的成績已經可以排到前10%。 GPT-4在專業領域的能力實現了巨大提升,在一些專業領域已經開始逐漸接近甚至超過人類,這給GPT-4在許多ToB商業領域提供了更多可能性。
例如專業技能輔助工具,知識檢索類別的應用,職業教培輔導等領域,GPT-4帶來的能力可能將會是革命性的。
GPT-4發布之後,微軟在第一時間表示:「如果你在過去五週內的任何時候使用過新的Bing預覽版,你就已經提前了解了OpenAI最新模型的強大功能」。這表示New Bing早已經用上了GPT-4,在過去幾週,很多人體驗的必應就是GPT-4加強過的,僅僅開放使用了文字能力而已。雖然微軟沒有用全球首發的字眼來描述,畢竟微軟在OpenAPI上已經投入了130億美元(約合人民幣900億元),換來的這樣的待遇也是情理之中。
除了微軟的New Bing外,目前還有多家公司將GPT-4搭載到他們的產品中,包括語言學習工具軟體多鄰國(Duolingo)、幫助視障用戶的軟體BeMyEyes、行動支付公司Stripe、國際性金融服務公司摩根士丹利等。
但不得不承認的是,雖然GPT-4大幅拓寬了大模型可能落地的商業化場景,但算力、研發成本,仍被許多人認為是大模型落地過程中很難跨過的障礙。畢竟大模型的研發、算力支出在目前看來高得嚇人,此前ChatGPT公開的單次訓練、日常營運開支都是以百萬美元為單位的,短期內想要商用可能很難控製成本。
眾所周知,ChatGPT是OpenAI公司研發的一個大型自然語言處理模型,但很多人不知道,它的發展歷程可以追溯到2015年。 2015年,OpenAI由特斯拉的馬斯克、Sam Altman及其他投資者共同創立,旨在透過先進的人工智慧技術推動人工智慧領域的發展。而馬斯克則在2018年時因公司發展方向分歧而離開。
先前,OpenAI因推出 GPT系列自然語言處理模式而聞名。從2018年起,OpenAI就開始發布生成式預訓練語言模型GPT(Generative Pre-trained Transformer),可用於產生文章、程式碼、機器翻譯、問答等各類內容。
每一代GPT模型的參數量都爆炸式增長,2019年2月發布的GPT-2參數量為15億,在2020年5月,當OpenAI發布了GPT-3,它已經是世界上最先進的自然語言生成模式。 GPT-3具有1750億個參數。
GPT-3出現時,作為一個無監督模型(現在經常被稱為自監督模型),幾乎可以完成自然語言處理的絕大部分任務,例如面向問題的搜尋、閱讀理解、語義推論、機器翻譯、文章產生和自動問答等等。
而且,該模型在諸多任務上表現卓越,例如在法語-英語和德語-英語機器翻譯任務上達到當前最佳水平,自動產生的文章幾乎讓人無法辨別出自人還是機器,更令人驚訝的是在兩位數的加減運算任務上達到幾乎100%的正確率,甚至還可以依據任務描述自動產生程式碼。一個無監督模型功能多效果好,似乎讓人看到了通用人工智慧的希望,也許這就是GPT-3影響如此之大的主要原因。
2021年,OpenAI宣布將推出一個新的名稱,名為「DALL-E",這是一種能夠產生影像的人工智慧技術。同時,OpenAI也在研發更先進的自然語言處理技術。
此後的故事相信大家都很清楚了,2022年底基於GPT-3.5的ChatGPT以光速席捲全球,成為全球最大的“科技明細”,直到現在GPT-4的發布更是登上多國熱搜。
GPT的未來怎麼樣?可以預見的是,隨著演算法技術和算力技術的不斷進步,ChatGPT也將進一步走向更先進功能更強的版本,在越來越多的領域進行應用,為人類產生更多更美好的對話和內容。
也許GPT距離正在的「AI」還有距離,但我們不妨把它當作一個起點,一個全新「AI」時代的起點。
以上是再一次改變「AI」世界 GPT-4千呼萬喚始出來的詳細內容。更多資訊請關注PHP中文網其他相關文章!