ChatGPT之後性能怪獸來了?馬庫斯7大「黑暗」預測:GPT-4帶不來AGI
2022年接近尾聲之際,OpenAI發布了名為ChatGPT的聊天機器人,迅速走紅網路。
發布後不到兩週,已有超過一百萬人註冊線上試用。使用者只要輸入文本,就能立即得到一段段落的不可思議的文章、故事和詩歌。
它的文筆很好,以至於有些人用它在Tinder上寫約會的開場白(「你介意我坐這裡嗎?你做臀衝的樣子讓我的腿有點發軟。」)
#不僅如此,令世界各地的教育工作者相當震驚的是,學生們開始使用ChatGPT來撰寫學期論文。還有一些人正在使用它來嘗試重塑搜尋引擎。一時之間,全世界都在討論ChatGPT的神奇。
儘管如此,馬庫斯表示,我們不能對聊天機器人濾鏡太厚。
雖然ChatGPT看起來無所不知,但它也很容易出錯。在接受採訪時,馬庫斯表示,ChatGPT和之前一樣,相關係統「仍然不可靠,仍然不了解現實世界,仍然不了解心理世界並且仍然充滿錯誤。」
也就是說,ChatGPT時常胡編亂造;它所說的相當一部分根本不是真的。
例如,在使用者的誘導下,ChatGPT可以說出油條非常適合手術,因為「它們體積小巧,可以在手術過程中實現更高的精確度和控制,降低併發症的風險並改善手術的整體結果」 。
聊天機器人一本正經地說胡話,以至於著名的網站Stack Overflow已經暫時禁止電腦產生的答案。
而錯誤是無窮無盡的。雖然ChatGPT經常根據使用者回饋進行調整,但在產品發布幾週後,仍有許多網友對它的回答感到無言:
##類似的錯誤頻頻發生,連OpenAI的執行長Sam Altman也不得不承認現實:
ChatGPT仍有諸多局限,但足以創造出偉大的假象。
現在靠ChatGPT去完成重要任務還為時過早。關於提高穩健性和真實性,我們要做的還有很多。
簡而言之,ChatGPT雖然聽起來像是星際爭霸戰中的電腦一樣科幻,但目前,人們還不能完全信任它。
當然,ChatGPT是2022年AI愛好者的禮物。那麼2023年呢?
2023年,矽谷乃至整個世界翹首以盼的,是GPT-4。
GPT-4:AI界的「天降紫微星」
#實際嘗試過GPT-4的人都對產品印象深刻。根據一些傳言,GPT-4將於2023年春天發布。屆時,它將使ChatGPT 黯然失色;可以肯定的是,會有更多人談論它。
在許多方面,人們對GPT-4的期望值非常高:
創投公司DVC創辦人Nick Davidov表示:GPT-4的出現,會帶來「和新冠疫情類似的經濟衝擊」。 GPT-4的快速傳播和使用,可以「迅速提高數億知識工作者的生產力」。
從技術上講,GPT-4內部將會有更多的參數,更多的處理器和內存,並接受更多資料的訓練。
GPT-1接受了4.6GB資料的訓練,而到了GPT-3,資料量直接飆升至750GB。由此可見,GPT-4的訓練量會更加驚人,甚至會對整個網路的大部分進行學習。
OpenAI深知,更大的訓練量意味著更好的輸出。經過每次迭代,GPT的表現越來越像人類。對於GPT-4,可能會進化成為一個性能怪物。
但它會解決之前遇到的問題嗎?馬庫斯對此仍然打了個問號。
儘管GPT-4看起來肯定會比它的前任更聰明,但其內部架構仍然存在問題。
馬庫斯稱,他懷疑人們在GPT-4時,會有一種似曾相識的感覺:先是火遍全網,然後過了幾天,人們發現許多問題仍然存在。
根據目前訊息,GPT-4在架構上與GPT-3基本相同。如果是這樣,可以預料到,一些基本問題仍然無法解決:聊天機器人仍然缺乏了解世界運作方式的內部模型。
因此,GPT-4無法在抽象層面上理解事物。它可能更擅長幫學生寫論文,但它仍然不會真正了解世界,答案的字裡行間仍會透露機器的特徵。
關於GPT-4的七大預測
因此,儘管AI界對GPT-4的到來滿心歡喜,馬庫斯卻給出了7個不太積極的預測。
1. GPT-4仍然會像它的前輩一樣,犯下各種愚蠢的錯誤。它有時可能會很好地完成給定的任務,有時卻罷工不干,但你並不能提前預料到即將出現的是哪種情況。
2. GPT-4對物理、心理和數學的推理依然靠不住。它或許能夠解決部分之前未能挑戰成功的項目,但在面對更長和更複雜的場景時依然束手無策。
例如,當被問及醫學問題時,它要么拒絕回答,要么偶爾會說出聽起來很有道理但很危險的廢話。儘管它已經吞噬了網路上的大量內容,但它並不能足夠可信和完整地提供可靠的醫療建議。
3. 流暢幻象(fluent hallucinations)仍將十分常見,而且很容易被誘發。也就是說,大型語言模型依然是能輕易用於製作聽起來很合理但卻完全錯誤的訊息的工具。
4. GPT-4的自然語言輸出仍然無法以可靠的方式為下游程式提供服務。利用它來建立虛擬助理的開發者會發現,自己無法可靠地將使用者語言映射到使用者的意圖。
5. GPT-4本身不會是一個能解決任意任務的通用人工智慧。如果沒有外部的輔助,它既不能在Diplomacy中擊敗Meta的Cicero;也不能可靠地駕駛汽車;更不能驅動《變形金剛》裡的“擎天柱”,或者像《傑森一家》裡的“Rosie ”那樣多才多藝。
6. 人類「想要什麼」與機器「去做什麼」之間的「對接」,依然是一個關鍵且尚未解決的問題。 GPT-4仍將無法控制自己的輸出,一些建議是令人驚訝的糟糕,掩蓋偏見的例子也會在幾天或幾個月內被發現。
7. 當AGI(通用人工智慧)實現時,像GPT-4這樣的大型語言模型,或許會成為最終解決方案的一部分,但也僅限於其中的一部分。單純的「擴展」,也就是建立更大的模型直到它吸收了整個互聯網,在一定程度上會被證明是有用的。但值得信賴的、與人類價值觀一致的通用人工智慧,一定會來自於結構化程度更高的系統。它將具有更多的內建知識,並包含明確的推理和計劃工具。而這些,都是現在的GPT系統所缺乏的。
馬庫斯認為,在十年內,也許更少,人工智慧的重點將從對大型語言模型的擴展,轉向與更廣泛的技術相結合。
酷炫的東西總是好玩的,但這並不意味著它能帶領我們走向可信的通用人工智慧。
對此,馬庫斯預測,我們在未來需要的是一個可以將顯性知識和世界模型作為核心的全新架構。
參考資料:https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting
以上是ChatGPT之後性能怪獸來了?馬庫斯7大「黑暗」預測:GPT-4帶不來AGI的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

DALL-E 3 於 2023 年 9 月正式推出,是比其前身大幅改進的車型。它被認為是迄今為止最好的人工智慧圖像生成器之一,能夠創建具有複雜細節的圖像。然而,在推出時,它不包括

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S

本站8月1日消息,SK海力士今天(8月1日)發布博文,宣布將出席8月6日至8日,在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024,展示諸多新一代產品。未來記憶體和儲存高峰會(FutureMemoryandStorage)簡介前身是主要面向NAND供應商的快閃記憶體高峰會(FlashMemorySummit),在人工智慧技術日益受到關注的背景下,今年重新命名為未來記憶體和儲存高峰會(FutureMemoryandStorage),以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在

在前端開發的世界裡,VSCode以其強大的功能和豐富的插件生態,成為了無數開發者的首選工具。而近年來,隨著人工智慧技術的快速發展,VSCode上的AI代碼助理也如雨後春筍般湧現,大大提升了開發者的編碼效率。 VSCode上的AI代碼助手,如雨後春筍般湧現,大大提升了開發者的編碼效率。它利用人工智慧技術,能夠聰明地分析程式碼,提供精準的程式碼補全、自動糾錯、語法檢查等功能,大大減少了開發者在編碼過程中的錯誤和繁瑣的手工工作。有今天,就為大家推薦12款VSCode前端開發AI程式碼助手,幫助你在程式設計之路

本站7月5日消息,格芯(GlobalFoundries)於今年7月1日發布新聞稿,宣布收購泰戈爾科技(TagoreTechnology)的功率氮化鎵(GaN)技術及智慧財產權組合,希望在汽車、物聯網和人工智慧資料中心應用領域探索更高的效率和更好的效能。隨著生成式人工智慧(GenerativeAI)等技術在數位世界的不斷發展,氮化鎵(GaN)已成為永續高效電源管理(尤其是在資料中心)的關鍵解決方案。本站引述官方公告內容,在本次收購過程中,泰戈爾科技公司工程師團隊將加入格芯,進一步開發氮化鎵技術。 G
