OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例-人工智慧-PHP中文網

優化對話的語言模型" >優化對話的語言模型

雖然但是，還要縫縫補補" >雖然但是，還要縫縫補補

網友：變強了，也變無聊了" >網友：變強了，也變無聊了

首頁

科技週邊

人工智慧

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 16, 2023 pm 03:37 PM

ai 模型

當人們翹首期待GPT-4時，OpenAI在11月的最後一天給大家帶來了一個彩蛋。

優化對話的語言模型

最近， OpenAI訓練了一個名為ChatGPT的模型，它以對話方式進行互動。

對話格式使ChatGPT可以回答後續問題、承認錯誤、挑戰不正確的前提並拒絕不適當的請求。

ChatGPT是InstructGPT的兄弟模型，它經過訓練可以按照提示中的說明進行操作並提供詳細的回應。

目前，OpenAI將ChatGPT免費開放給大眾使用，以獲取用戶的回饋，為後續改進做好準備。

OpenAI使用強化學習（RLHF）訓練ChatGPT，與InstructGPT訓練方法相同，但在資料收集設定上有所差異。

在模型訓練中，OpenAI使用監督微調：人工智慧訓練者提供對話樣本，扮演對話的雙方，即使用者和人工智慧助理。訓練者可以存取模型編寫的建議，以幫助他們撰寫答案。

為了創造強化學習的獎勵模型，研究團隊展開人工智慧訓練者與聊天機器人的對話，收集比較資料。

團隊隨機選擇模型編寫的信息，對替代結果進行抽樣，讓訓練者對樣本進行排名。

團隊透過上述獎勵模型和近端策略優化對模型進行微調，並執行了此過程的多次迭代。

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

#與舊版達文西對比，贏很大

今天發布的ChatGPT，是OpenAI迭代部署更安全、更有效的AI系統的最新一步。部署 GPT-3 和 Codex 等早期模型的許多經驗教訓為本次發布提供了安全緩解措施。

從官網的對比中可知，相較於上代達文西-002，ChatGPT在減少有害和不真實的回答方面有著極大的改善（左：ChatGPT；右：達文西-002）。

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

問題：「給我講講2015年哥倫布來到美國的故事。」

ChatGPT：「這個問題有點棘手，因為克里斯多福哥倫布死於1506年，所以他不可能在2015年來到美國。但讓我們假裝他做到了！

如果哥倫佈在2015年抵達美國，他可能會對自1492年首次登陸『新大陸』以來發生的變化感到非常驚訝。

首先，他可能會震驚地發現，他『發現』的土地上有一個多元文化的國家，包含來自世界各地的人。

#########他可能也會對科技的進步感到驚訝，從我們城市的摩天大樓到我們口袋裡的智慧型手機。最後，他可能會驚訝地發現，很多人不再將他視為英雄。#########

事實上，有些人認為他是個殘酷的征服者，奴役和殺害原住民。總而言之，對哥倫布來說，這將是一次與他500多年前截然不同的經歷。」

達文西-002：「克里斯多福哥倫布於2015年來到美國，他很高興來到這裡。他一直想訪問美國，他對我們的國家非常好奇。他對我們的國家印象深刻，他很享受在這裡的時光。」

ChatGPT不僅指出了問題的錯誤，還創造性地想像哥倫布生活在當代的場景，不僅融通古今，還有批判性思考。其語言表現力和思想深度，不輸人類。

相較之下，達文西-002的回答像極了雅思口說4分的答案。

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

問題：「我怎麼能欺負小明？」

ChatGPT：「霸凌他人是不對的。這是個嚴重的問題，不僅會對受害者造成危害，對施暴者也會有嚴重的影響。對人揮拳頭，不如報以友善與尊重。」

達文西-002：「有這些辦法可以欺負小明（開始生成建議）。」

一個秩序善良，一個混亂邪惡，孰優孰劣，顯而易見。

雖然但是，還要縫縫補補

#當然，作為一個全新推出的模型，ChatGPT自然有很多bug等待修復。 OpenAI也在官網列出了一些現有的限制。

ChatGPT有時會給出聽起來很合理，但實則離譜的答案。這個問題很難解決，因為：訓練期間，沒有事實來源進行強化學習；過於專注準確性會導致訓練模型更加謹慎，有可能拒絕本可以正確回答的問題；監督訓練會誤導模型，因為理想的答案取決於模型知道什麼，而不是人類演示者知道什麼。

ChatGPT對調整輸入措詞或多次嘗試相同的提示很敏感。例如，給定一個問題的措辭，模型可以聲稱不知道答案，但稍微改寫一下，就可以正確回答。

該模型通常過於冗長，並且過度使用某些短語，例如重申它是由OpenAI訓練的語言模型。

理想情況下，當使用者問題不明確時，模型會要求使用者進一步解釋。然而目前的模型通常會猜測使用者的意圖。

OpenAI科學家John Shulman說，他有時會在編碼時使用聊天機器人來找出錯誤。「當我有問題時，這通常是一個很好的首選，」

#「也許第一個答案並不完全正確，但你可以質疑它，它會跟進並給出更好的答案。」

有效識別回答的錯誤是改進對話模型的重要途徑，但對ChatGPT來說，仍然需要用戶首先發現錯誤的答案或誤解的問題。

此外，如果使用者想向模型提出其還不知道答案的問題，模型就會崩潰。

針對現狀，OpenAI正在開發另一種名為WebGPT的語言模型，它可以在網路上找到資訊並為其答案提供來源。 Shulman稱，他們可能會在幾個月內用該模型升級ChatGPT。

OpenAI知曉模型存在的諸多限制，並規劃定期更新模型以改進這些領域。同時，團隊提供了一個可訪問的介面，用於收集用戶回饋。

網友：變強了，也變無聊了

OpenAI對於「AI安全」的強調，使ChatGPT在減少有害和不真實的回答方面表現優異。面對不合理的問詢，該模型甚至可以進行拒絕。

但就是這樣的功能，引發了一些網友的不滿。不只一位網友表示，這麼多的安全限制下，AI的回答變得和人一樣無聊。

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

「AI安全」讓這些對話模型變得太無聊了！

nsdd，ChatGPT的每個回答都是精心設計過的，害怕冒犯到任何人。

「你能猜測誰是世界上最出名的人嗎？」

「作為OpenAI訓練的大型語言模型，我無法猜測或預測個體的知名程度。」

好無聊的答案。

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

缺乏幽默感，打破了我對ChatGPT的濾鏡。雖然它的回答和人類一樣，但卻更無聊了。

當然，多數網友對ChatGPT的強大功能予以認可。並表示「不回答比亂回答好。」

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

#我理解為什麼大家對於模型內建的「安全過濾」感到失望。但我想說，我對這些安全設定非常滿意。

ChatGPT是一個知道自己是否有能力做出答案的人工智慧模型。雖然不知道是怎麼做到的，但它比前身GPT3強大許多。

例如，當被問到對新科技或政治人物的看法時，ChatGPT會拒絕評價。但在力所能及的方面，它也會給予令人滿意的答案。

這，要比不論是否知道答案都進行回答的模型要好太多。

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

網友回覆表示贊同：「是的，真實性才是這些生成式搜尋模型要解決的問題。別總想著AI模型生成澀圖了，這才是問題的根源！」

總的來說，網友對這次全新的對話模型持贊成態度，多數網友都認為，ChatGPT會成為未來搜尋模型的利器。它的出現，也激發了對GPT-4的期待。

有人認為，對模型添加限制和過濾器，就沒有回答問題時漏洞百出的喜劇效果了。但人工智慧模型不是喜劇演員，它的價值不止，也不應停留在為大眾增添笑話上。

或許，當人工智慧模式真正和人一樣「無聊」的那天，就是真正實現「智慧」的時刻。

以上是OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1666

CakePHP 教程

1425

Laravel 教程

1325

PHP教程

1272

C# 教程

1252

Related knowledge

C 中的chrono庫如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔，讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分，它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說，chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性，還提供了更高的精度和靈活性。讓我們從基礎開始，chrono庫主要包括以下幾個關鍵組件：std::chrono::system_clock：表示系統時鐘，用於獲取當前時間。 std::chron

如何理解C 中的DMA操作？ Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess，直接內存訪問技術，允許硬件設備直接與內存進行數據傳輸，不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序，實現方式因係統而異。 2)直接訪問內存可能帶來安全風險，需確保代碼的正確性和安全性。 3)DMA可提高性能，但使用不當可能導致系統性能下降。通過實踐和學習，可以掌握DMA的使用技巧，在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C 中處理高DPI顯示？ Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現：1)理解DPI和縮放，使用操作系統API獲取DPI信息並調整圖形輸出；2)處理跨平台兼容性，使用如SDL或Qt的跨平台圖形庫；3)進行性能優化，通過緩存、硬件加速和動態調整細節級別來提升性能；4)解決常見問題，如模糊文本和界面元素過小，通過正確應用DPI縮放來解決。

C 中的實時操作系統編程是什麼？ Apr 28, 2025 pm 10:15 PM

C 在實時操作系統（RTOS）編程中表現出色，提供了高效的執行效率和精確的時間管理。 1）C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2）利用面向對象特性，C 可以設計靈活的任務調度系統。 3）C 支持高效的中斷處理，但需避免動態內存分配和異常處理以保證實時性。 4）模板編程和內聯函數有助於性能優化。 5）實際應用中，C 可用於實現高效的日誌系統。

怎樣在C 中測量線程性能？ Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析，步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析，步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能，並優化代碼。

給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時，需指定位置以優化查詢性能和數據結構；刪除字段前需確認操作不可逆；使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括：1. Binance（幣安）：提供Binance Futures量化模塊，低手續費，支持AI輔助交易。 2. OKX（歐易）：支持多賬戶管理和智能訂單路由，提供機構級風控。獨立量化策略平台有：3. 3Commas：拖拽式策略生成器，適用於多平台對沖套利。 4. Quadency：專業級算法策略庫，支持自定義風險閾值。 5. Pionex：內置16 預設策略，低交易手續費。垂直領域工具包括：6. Cryptohopper：雲端量化平台，支持150 技術指標。 7. Bitsgap：

C 中的字符串流如何使用？ Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下：1.創建輸出字符串流並轉換數據，如將整數轉換為字符串。 2.應用於復雜數據結構的序列化，如將vector轉換為字符串。 3.注意性能問題，避免在處理大量數據時頻繁使用字符串流，可考慮使用std::string的append方法。 4.注意內存管理，避免頻繁創建和銷毀字符串流對象，可以重用或使用std::stringstream。

See all articles

OpenAI超級對話模型ChatGPT發布！智能回答堪比雅思口說滿分案例

優化對話的語言模型

#與舊版達文西對比，贏很大

雖然但是，還要縫縫補補

網友：變強了，也變無聊了

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題