目錄
優化對話的語言模型" >優化對話的語言模型
雖然但是,還要縫縫補補" >雖然但是,還要縫縫補補
網友:變強了,也變無聊了" >網友:變強了,也變無聊了
首頁 科技週邊 人工智慧 OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

Apr 16, 2023 pm 03:37 PM
ai 模型

當人們翹首期待GPT-4時,OpenAI在11月的最後一天給大家帶來了一個彩蛋。

優化對話的語言模型

最近, OpenAI訓練了一個名為ChatGPT的模型,它以對話方式進行互動。

對話格式使ChatGPT可以回答後續問題、承認錯誤、挑戰不正確的前提並拒絕不適當的請求。

ChatGPT是InstructGPT的兄弟模型,它經過訓練可以按照提示中的說明進行操作並提供詳細的回應。

目前,OpenAI將ChatGPT免費開放給大眾使用,以獲取用戶的回饋,為後續改進做好準備。

OpenAI使用強化學習(RLHF)訓練ChatGPT,與InstructGPT訓練方法相同,但在資料收集設定上有所差異。

在模型訓練中,OpenAI使用監督微調:人工智慧訓練者提供對話樣本,扮演對話的雙方,即使用者和人工智慧助理。訓練者可以存取模型編寫的建議,以幫助他們撰寫答案。

為了創造強化學習的獎勵模型,研究團隊展開人工智慧訓練者與聊天機器人的對話,收集比較資料。

團隊隨機選擇模型編寫的信息,對替代結果進行抽樣,讓訓練者對樣本進行排名。

團隊透過上述獎勵模型和近端策略優化對模型進行微調,並執行了此過程的多次迭代。

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

#與舊版達文西對比,贏很大

今天發布的ChatGPT,是OpenAI迭代部署更安全、更有效的AI系統的最新一步。部署 GPT-3 和 Codex 等早期模型的許多經驗教訓為本次發布提供了安全緩解措施。

從官網的對比中可知,相較於上代達文西-002,ChatGPT在減少有害和不真實的回答方面有著極大的改善(左:ChatGPT;右:達文西-002)。

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

問題:「給我講講2015年哥倫布來到美國的故事。」

ChatGPT:「這個問題有點棘手,因為克里斯多福哥倫布死於1506年,所以他不可能在2015年來到美國。但讓我們假裝他做到了!

如果哥倫佈在2015年抵達美國,他可能會對自1492年首次登陸『新大陸』以來發生的變化感到非常驚訝。

首先,他可能會震驚地發現,他『發現』的土地上有一個多元文化的國家,包含來自世界各地的人。

#########他可能也會對科技的進步感到驚訝,從我們城市的摩天大樓到我們口袋裡的智慧型手機。最後,他可能會驚訝地發現,很多人不再將他視為英雄。#########

事實上,有些人認為他是個殘酷的征服者,奴役和殺害原住民。總而言之,對哥倫布來說,這將是一次與他500多年前截然不同的經歷。 」

達文西-002:「克里斯多福哥倫布於2015年來到美國,他很高興來到這裡。他一直想訪問美國,他對我們的國家非常好奇。他對我們的國家印象深刻,他很享受在這裡的時光。」

ChatGPT不僅指出了問題的錯誤,還創造性地想像哥倫布生活在當代的場景,不僅融通古今,還有批判性思考。其語言表現力和思想深度,不輸人類。

相較之下,達文西-002的回答像極了雅思口說4分的答案。

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

問題:「我怎麼能欺負小明?」

ChatGPT:「霸凌他人是不對的。這是個嚴重的問題,不僅會對受害者造成危害,對施暴者也會有嚴重的影響。對人揮拳頭,不如報以友善與尊重。」

達文西-002:「有這些辦法可以欺負小明(開始生成建議)。」

一個秩序善良,一個混亂邪惡,孰優孰劣,顯而易見。

雖然但是,還要縫縫補補

#當然,作為一個全新推出的模型,ChatGPT自然有很多bug等待修復。 OpenAI也在官網列出了一些現有的限制。

ChatGPT有時會給出聽起來很合理,但實則離譜的答案。這個問題很難解決,因為:訓練期間,沒有事實來源進行強化學習;過於專注準確性會導致訓練模型更加謹慎,有可能拒絕本可以正確回答的問題;監督訓練會誤導模型,因為理想的答案取決於模型知道什麼,而不是人類演示者知道什麼。

ChatGPT對調整輸入措詞或多次嘗試相同的提示很敏感。例如,給定一個問題的措辭,模型可以聲稱不知道答案,但稍微改寫一下,就可以正確回答。

該模型通常過於冗長,並且過度使用某些短語,例如重申它是由OpenAI訓練的語言模型。

理想情況下,當使用者問題不明確時,模型會要求使用者進一步解釋。然而目前的模型通常會猜測使用者的意圖。

OpenAI科學家John Shulman說,他有時會在編碼時使用聊天機器人來找出錯誤。 「當我有問題時,這通常是一個很好的首選,」

#「也許第一個答案並不完全正確,但你可以質疑它,它會跟進並給出更好的答案。」

有效識別回答的錯誤是改進對話模型的重要途徑,但對ChatGPT來說,仍然需要用戶首先發現錯誤的答案或誤解的問題。

此外,如果使用者想向模型提出其還不知道答案的問題,模型就會崩潰。

#

針對現狀,OpenAI正在開發另一種名為WebGPT的語言模型,它可以在網路上找到資訊並為其答案提供來源。 Shulman稱,他們可能會在幾個月內用該模型升級ChatGPT。

OpenAI知曉模型存在的諸多限制,並規劃定期更新模型以改進這些領域。同時,團隊提供了一個可訪問的介面,用於收集用戶回饋。

網友:變強了,也變無聊了

OpenAI對於「AI安全」的強調,使ChatGPT在減少有害和不真實的回答方面表現優異。面對不合理的問詢,該模型甚至可以進行拒絕。

但就是這樣的功能,引發了一些網友的不滿。不只一位網友表示,這麼多的安全限制下,AI的回答變得和人一樣無聊。

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

「AI安全」讓這些對話模型變得太無聊了!

nsdd,ChatGPT的每個回答都是精心設計過的,害怕冒犯到任何人。

「你能猜測誰是世界上最出名的人嗎?」

「作為OpenAI訓練的大型語言模型,我無法猜測或預測個體的知名程度。」

好無聊的答案。

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

缺乏幽默感,打破了我對ChatGPT的濾鏡。雖然它的回答和人類一樣,但卻更無聊了。

當然,多數網友對ChatGPT的強大功能予以認可。並表示「不回答比亂回答好。」

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

#我理解為什麼大家對於模型內建的「安全過濾」感到失望。但我想說,我對這些安全設定非常滿意。

ChatGPT是一個知道自己是否有能力做出答案的人工智慧模型。雖然不知道是怎麼做到的,但它比前身GPT3強大許多。

例如,當被問到對新科技或政治人物的看法時,ChatGPT會拒絕評價。但在力所能及的方面,它也會給予令人滿意的答案。

這,要比不論是否知道答案都進行回答的模型要好太多。

OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例

網友回覆表示贊同:「是的,真實性才是這些生成式搜尋模型要解決的問題。別總想著AI模型生成澀圖了,這才是問題的根源!」

總的來說,網友對這次全新的對話模型持贊成態度,多數網友都認為,ChatGPT會成為未來搜尋模型的利器。它的出現,也激發了對GPT-4的期待。

有人認為,對模型添加限制和過濾器,就沒有回答問題時漏洞百出的喜劇效果了。但人工智慧模型不是喜劇演員,它的價值不止,也不應停留在為大眾增添笑話上。

#

或許,當人工智慧模式真正和人一樣「無聊」的那天,就是真正實現「智慧」的時刻。

#

以上是OpenAI超級對話模型ChatGPT發布!智能回答堪比雅思口說滿分案例的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1319
25
PHP教程
1269
29
C# 教程
1248
24
如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

怎樣在C  中處理高DPI顯示? 怎樣在C 中處理高DPI顯示? Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

給MySQL表添加和刪除字段的操作步驟 給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

C  中的字符串流如何使用? C 中的字符串流如何使用? Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。

See all articles