目錄
ChatGPT為什麼這麼火,我們自己都不明白" >ChatGPT為什麼這麼火,我們自己都不明白
微調過程" >微調過程
準備發布
發布後的回饋
首頁 科技週邊 人工智慧 真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

Apr 11, 2023 pm 09:34 PM
ai 模型

這家公司做出了或許能引爆第四次工業革命的產品,但他們卻百思不得其解:為啥自家的產品能這麼火?

就,真的不是凡爾賽。

最近,MIT Technology Review採訪了ChatGPT的幾位開發者,讓我們近距離了解了這個大爆的AI產品背後的故事。

火成這樣,沒有絲毫防備

當OpenAI在202211月下旬悄無聲息地推出ChatGPT時,這家新創公司並沒有報多大的期望。

OpenAI的員工也沒想過,自家模型即將走上的,是一條屬於頂流的爆紅之路。

ChatGPT彷彿在夜間大紅大紫,也引發了關於大語言模型的一場全球淘金熱,而OpenAI還沒有絲毫準備,只能匆忙地趕上自己頂流模型的腳步,試圖抓住商機。

在OpenAI從事政策工作的Sandhini Agarwal說,在OpenAI內部,ChatGPT一直被視為「研究預覽」——它是一個兩年前技術的更完善的版本,更重要的是,公司試圖透過公眾的回饋,來消除模型的一些缺陷。

誰能想到,這樣一個「預覽」產品,陰差陽錯出道後就爆紅了呢。

對此,OpenAI的科學家很懵逼,對於外界的花朵和掌聲,他們也很清醒。

「我們不想把它誇大為一個巨大的基礎性進步,」參與研發ChatGPT的OpenAI科學家Liam Fedus說。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

ChatGPT團隊成員當中,有5位被評為2023年度AI 2000 全球人工智慧學者

為此,MIT Technology Review的記者Will Douglas Heaven採訪了OpenAI的共同創辦人John Schulman、開發者Agarwal和Fedus、對齊團隊的負責人Jan Leike。

ChatGPT為什麼這麼火,我們自己都不明白

#創辦人John Schulman表示,ChatGPT發布後幾天,他時不時就會刷推特。有那麼一段瘋狂的時期,推特資訊流中全是ChatGPT的截圖。

他想到了這是一個對使用者很直覺的產品,也想到它會有一些粉絲,但沒想到它會變得這麼主流。

Jan Leike表示,一切都太突然了,所有人都很驚訝,努力地跟上ChatGPT爆火的節奏。他很好奇,到底是什麼在推動它的人氣飆升,難道有什麼幕後推手?畢竟,OpenAI自己都搞不清楚為什麼ChatGPT能這麼火紅。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

Liam Fedus解釋了他們如此驚訝的原因,因為ChatGPT並不是第一個通用的聊天機器人,先前就已經有很多人嘗試過了,所以Liam Fedus覺得他們的機會不大。不過,私人測試版也給了他信心——或許,這款A是用戶們真心會喜歡的東西。

Sandhini Agarwal總結道,對所有人來說,ChatGPT一炮而紅都是個驚喜。先前,大家在這些模型上做了太多的工作了,以至於都忘記了對於公司外部的普羅大眾來說,它是如此驚人。

的確,ChatGPT內的大部分技術並不新鮮。它是GPT-3.5的微調版本,而在ChatGPT幾個月前,OpenAI就發布了GPT-3.5。而GPT-3.5本身就是GPT-3的更新版本,GPT-3出現在2020年。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

ChatGPT團隊參與先前七大技術研發人數

在網站上,OpenAI以應用程式介面或API的形式提供了這些模型,其他開發者可以輕易地將模型插入自己的程式碼中。

在2022年1月,OpenAI也發表了GPT-3.5的前一個微調版本InstructGPT。只不過,這些技術沒有向大眾推介罷了。

微調過程

根據Liam Fedus的介紹,ChatGPT模型是由與InstructGPT相同的語言模型微調而來的,使用的微調方法類似。研究人員增加了一些對話數據,並對訓練過程進行了一些調整。所以他們不想把它誇大為一個巨大的基礎性進步。

事實證明,對ChatGPT起了大作用的,是對話數據。

根據標準基準的評估,實際上兩個模型之間的原始技術能力並沒有很大差別,ChatGPT最大的不同是,更容易取得和使用。

Jan Leike解釋說,在某種意義上,可以把ChatGPT理解為OpenAI已有一段時間的AI系統的一個版本。 ChatGPT的能力並沒有更強。在ChatGPT問世之前,同樣的基本模型已經在API上使用了將近一年時間。

而研究者們的改進可以概括為,在某種意義上,讓它更符合人類想用它做什麼。它會在對話中和使用者交談,是一個聊天介面,很容易存取。它更容易推斷出意圖,而使用者可以透過來回試探,來達到自己想要的目的。

秘訣就是,人類回饋強化學習(RLHF)技術,這和InstructGPT的訓練方式很像-教會它人類使用者實際喜歡的樣子。

Jan Leike介紹說,他們讓一大群人閱讀了ChatGPT的提示和回應,然後對回應進行二選一的選擇,看看大家認為哪個回應更好。然後,所有這些數據都被合併到一次訓練中。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

它的大部分內容與他們在InstructGPT上所做的內容是一樣的。例如你希望它有幫助的,希望它是真實的,希望它不會惡毒。

另外還有一些細節,例如如果用戶的詢問不清楚,它應該問後續的問題去細化。它也應該澄清,自己是一個人工智慧系統,不應該承擔它沒有的身份,不應該聲稱擁有它所沒有的能力。當使用者要求它做它不該做的任務時,它必須明確拒絕。

也就是有一個清單,列出了人類評分員必須對模型進行排名的各種標準,例如真實性。但他們也會偏愛某些做法,例如AI不要假裝自己是人。

準備發布

總的來說,ChatGPT用的都是OpenAI已經使用過的技術,所以團隊在準備向公眾發布這個模型時,沒有做任何特別的事情。在他們看來,為先前的模型設定的標準已經足夠了,GPT-3.5已經足夠安全。

而在ChatGPT對人類偏好的訓練中,它自學了拒絕行為,拒絕了許多請求。

OpenAI為ChatGPT組成了一些 「唱紅臉的」人:公司裡的每個人都坐下來,試圖打破這個模型。也有外部團體做同樣的事情。值得信賴的早期用戶也會提供回饋。

Sandhini Agarwal介紹道,他們確實發現了它會產生某些不必要的輸出,但這些都是GPT-3.5也產生的東西。因此,只看風險的話,作為一個「研究預覽」,ChatGPT已經夠好了。

John Schulman也表示,不可能等到一個系統100%完美了,才去發布它。幾個月來,他們對早期版本進行了beta測試,而beta測試人員對ChatGPT的印像都很好。

OpenAI最擔心的,其實是事實性的問題,因為ChatGPT太喜歡捏造東西了。但這些問題在InstructGPT和其他大型語言模型中都存在,所以在研究者看來,只要ChatGPT在事實性和其他安全問題上比那些模型更好,就已經足夠了。

而根據有限的評估,在發布之前,可以確認ChatGPT比其他模型更真實,更安全,因此,OpenAI決定繼續發布。

發布後的回饋

ChatGPT發布後,OpenAI一直在觀察用戶是如何使用它的。

一個大型語言模型被放在數以千萬計的使用者手中,這種事還是史上第一次。

用戶們也玩瘋了,想測試ChatGPT的極限在哪裡,bug在哪裡。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

ChaatGPT的走紅,也讓許多問題湧現出來,例如偏見問題,例如透過prompt誘導的問題。

Jan Leike表示,某些在推特上瘋傳的東西,其實OpenAI已經有人悄悄出手了。

例如越獄問題,絕對是他們需要解決的。使用者就是喜歡嘗試透過一些彎彎繞繞讓模型說不好的話,這在OpenAI的意料之內,也是一條必經之路。

當發現越獄時,OpenAI會把這些情況加入訓練和測試資料中,所有資料都會被納入未來的模型。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

Jan Leike表示,每當有一個更好的模型,他們都會想把它拿出來測試。

他們非常樂觀地認為,一些有針對性的對抗性訓練,可以讓越獄的情況得到很大的改善。雖然目前還不清楚這些問題是否會完全消失,但他們認為,自己可以使許多越獄行為變得困難。

當一個系統「正式出道」時,很難預見到所有實際會發生的事情。

因此,他們只能把重點放在監測人們使用系統的目的上,看看會發生什麼,然後對此作出反應。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

如今,微軟已經推出了必應Chat,許多人認為它是OpenAI官方未宣布的GPT-4的一個版本。

在這個前提下,Sandhini Agarwal表示,現在他們面臨的,肯定比六個月前高得多,但仍然低於一年後的水平。

這些模型是在什麼背景下被使用的,有極為重要的意義。

對於Google和微軟這樣的大公司,即使有一件事不符合事實,也會成為巨大的問題,因為他們本身就是搜尋引擎。

真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解

Google的第23位員工、創建了Gmail的Paul Buchheit,對Google持悲觀態度

作為搜尋引擎的大語言模型,和一個只為了好玩的聊天機器人是完全不同的。 OpenAI的研究者們也在努力弄清楚,如何在不同用途之間遊走,創造出真正對使用者有用的東西。

John Schulman承認,OpenAI低估了人們對ChatGPT政治議題的關心程度。為此,在收集訓練資料時,他們希望做出一些更好的決定,來減少這方面的問題。

Jan Leike表示,從自己的角度來看,ChatGPT經常出現失敗。有太多問題要解決了,但OpenAI並沒有解決。這一點,他坦誠地承認。

儘管語言模型已經存在了一段時間,但仍然處於早期。

接下來,OpenAI需要做的事情,就更多了。

以上是真不是凡爾賽! ChatGPT如此成功,OpenAI也不理解的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

如何配置Debian Apache日誌格式 如何配置Debian Apache日誌格式 Apr 12, 2025 pm 11:30 PM

本文介紹如何在Debian系統上自定義Apache的日誌格式。以下步驟將指導您完成配置過程:第一步:訪問Apache配置文件Debian系統的Apache主配置文件通常位於/etc/apache2/apache2.conf或/etc/apache2/httpd.conf。使用以下命令以root權限打開配置文件:sudonano/etc/apache2/apache2.conf或sudonano/etc/apache2/httpd.conf第二步:定義自定義日誌格式找到或

Tomcat日誌如何幫助排查內存洩漏 Tomcat日誌如何幫助排查內存洩漏 Apr 12, 2025 pm 11:42 PM

Tomcat日誌是診斷內存洩漏問題的關鍵。通過分析Tomcat日誌,您可以深入了解內存使用情況和垃圾回收(GC)行為,從而有效定位和解決內存洩漏。以下是如何利用Tomcat日誌排查內存洩漏:1.GC日誌分析首先,啟用詳細的GC日誌記錄。在Tomcat啟動參數中添加以下JVM選項:-XX: PrintGCDetails-XX: PrintGCDateStamps-Xloggc:gc.log這些參數會生成詳細的GC日誌(gc.log),包含GC類型、回收對像大小和時間等信息。分析gc.log

debian readdir如何實現文件排序 debian readdir如何實現文件排序 Apr 13, 2025 am 09:06 AM

在Debian系統中,readdir函數用於讀取目錄內容,但其返回的順序並非預先定義的。要對目錄中的文件進行排序,需要先讀取所有文件,再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序:#include#include#include#include//自定義比較函數,用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

如何優化debian readdir的性能 如何優化debian readdir的性能 Apr 13, 2025 am 08:48 AM

在Debian系統中,readdir系統調用用於讀取目錄內容。如果其性能表現不佳,可嘗試以下優化策略:精簡目錄文件數量:盡可能將大型目錄拆分成多個小型目錄,降低每次readdir調用處理的項目數量。啟用目錄內容緩存:構建緩存機制,定期或在目錄內容變更時更新緩存,減少對readdir的頻繁調用。內存緩存(如Memcached或Redis)或本地緩存(如文件或數據庫)均可考慮。採用高效數據結構:如果自行實現目錄遍歷,選擇更高效的數據結構(例如哈希表而非線性搜索)存儲和訪問目錄信

Debian syslog如何配置防火牆規則 Debian syslog如何配置防火牆規則 Apr 13, 2025 am 06:51 AM

本文介紹如何在Debian系統中使用iptables或ufw配置防火牆規則,並利用Syslog記錄防火牆活動。方法一:使用iptablesiptables是Debian系統中功能強大的命令行防火牆工具。查看現有規則:使用以下命令查看當前的iptables規則:sudoiptables-L-n-v允許特定IP訪問:例如,允許IP地址192.168.1.100訪問80端口:sudoiptables-AINPUT-ptcp--dport80-s192.16

Debian Nginx日誌路徑在哪裡 Debian Nginx日誌路徑在哪裡 Apr 12, 2025 pm 11:33 PM

Debian系統中,Nginx的訪問日誌和錯誤日誌默認存儲位置如下:訪問日誌(accesslog):/var/log/nginx/access.log錯誤日誌(errorlog):/var/log/nginx/error.log以上路徑是標準DebianNginx安裝的默認配置。如果您在安裝過程中修改過日誌文件存放位置,請檢查您的Nginx配置文件(通常位於/etc/nginx/nginx.conf或/etc/nginx/sites-available/目錄下)。在配置文件中

Debian郵件服務器SSL證書安裝方法 Debian郵件服務器SSL證書安裝方法 Apr 13, 2025 am 11:39 AM

在Debian郵件服務器上安裝SSL證書的步驟如下:1.安裝OpenSSL工具包首先,確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝,可以使用以下命令進行安裝:sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來,使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求(CSR):openss

Debian郵件服務器防火牆配置技巧 Debian郵件服務器防火牆配置技巧 Apr 13, 2025 am 11:42 AM

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法,包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables(如果尚未安裝):sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則:sudoiptables-L配置

See all articles