OpenAI總裁：GPT-4並不完美但絕對與眾不同-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

OpenAI總裁：GPT-4並不完美但絕對與眾不同

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 10, 2023 pm 04:11 PM

openai 人工智慧

OpenAI總裁：GPT-4並不完美但絕對與眾不同

3月16日消息，人工智慧研究公司OpenAI於昨日發布了備受期待的文本生成AI模型GPT-4。 OpenAI聯合創始人兼總裁格雷格·布羅克曼（Greg Brockman）在接受採訪時表示，GPT-4並不完美，但絕對與眾不同。

GPT-4在其前身GPT-3的基礎上，在許多關鍵方面進行了改進，例如提供了更多真實的陳述，並允許開發人員更容易控制其風格和行為。從某種意義上說，GPT-4也是多模式的，因為它可以理解圖像，並能為照片添加註釋，甚至詳細描述照片中的內容。

但GPT-4也有嚴重的缺陷。就像GPT-3一樣，該模型會產生「幻覺」（即模型聚合的文本與源文本無關或不夠準確），並會犯下基本的推理錯誤。 OpenAI在自己的部落格上舉了一個例子，GPT-4將“貓王”貓王（Elvis Presley）描述為“演員的兒子”，但實際上他的父母都不是演員。

當被要求將GPT-4與GPT-3進行比較時，布羅克曼只給了四個字回答：與眾不同。他解釋說：「GPT-4絕對與眾不同，儘管它還存在許多問題和錯誤。但你可以看到其在微積分或法律等學科技能方面的躍升。它在某些領域的表現曾經很糟糕，現在卻已經達到超越普通人的水準。」

測試結果支持了布羅克曼的觀點。在高考微積分考試中，GPT-4得4分(滿分5分)，GPT-3得1分，介於GPT-3和GPT-4之間的GPT-3.5也得4分。在模擬律師考試中，GPT-4成績進入了前10%行列，而GPT-3.5的分數在後10%左右徘徊。

同時，GPT-4更受人關注的地方在於上述的多模式。與GPT-3和GPT-3.5不同，它們只能接受文字提示，例如可以要求“寫一篇關於長頸鹿的文章”，而GPT-4可以同時接受圖像和文字提示來執行某些操作，例如識別在塞倫蓋蒂拍攝的長頸鹿影像，並給予基本的內容描述。

這是因為GPT-4是針對圖像和文字資料進行培訓的，而它的前身只針對文字進行了培訓。 OpenAI表示，培訓數據來自“各種合法授權的、公開可用的數據來源，其中可能包括公開可用的個人資訊”，但當被要求提供細節時，布羅克曼表示拒絕。訓練資料以前也曾讓OpenAI陷入法律糾紛。

GPT-4的影像理解能力給人留下了相當深刻的印象。例如，輸入提示「這張圖片有什麼好笑的？GPT-4會將整張圖片分解，並正確地解釋了這個笑話的笑話。

目前，只有一個合作夥伴可以使用GPT- 4的影像分析功能，這是一款針對視障人士的輔助應用程序，名為Be My Eyes。布羅克曼說，在OpenAI評估風險和利弊的過程中，無論何時，更廣泛的推廣都將是「緩慢而有意的」。

他也稱：「有些政策問題也需要解決，例如臉部辨識和如何處理人的影像。我們需要找出危險區域在哪裡，紅線在哪裡，然後隨著時間的推移找到解決方案。」

OpenAI在其文字到圖像轉換系統Dall-E 2上也遇到了類似倫理困境。在最初禁用該功能後，OpenAI允許客戶上傳人臉，以使用AI支援的圖像生成系統對其進行編輯。當時，OpenAI聲稱，其安全系統的升級使面部編輯功能成為可能，因為它將深度造假以及試圖創造色情、政治和暴力內容的潛在危害降至最低。

另一個長期問題是防止GPT-4在無意中被用於可能造成傷害的方式使用。該模型發布幾小時後，以色列網路安全新創公司Adversa AI發布了一篇部落格文章，演示了繞過OpenAI的內容過濾器並讓GPT-4生成釣魚電子郵件、對同性戀者的進攻性描述以及其他令人反感文本的方法。

這在語言模型領域並不是新問題。Facebook母公司Meta的聊天機器人BlenderBot和OpenAI的ChatGPT也曾被誘惑輸出不恰當的內容，甚至透露了它們內部工作的敏感細節。但包括記者在內的許多人曾希望，GPT-4可能會在這方面帶來重大改進。

當被問及GPT-4的健壯性時，布羅克曼強調，該模型已經經過了六個月的安全培訓。在內部測試中，它對OpenAI使用政策不允許的內容請求做出回應的可能性比GPT-3.5低82%，產生「事實」回應的可能性比GPT-3.5高40%。

布羅克曼說：「我們花了很多時間試圖了解GPT -4的能力。我們正在不斷更新，包括一系列改進，這樣模型就更具可擴展性，以適應人們希望它擁有的個性或模式。 ”

坦白說，早期的現實測試結果並不是那麼讓人滿意。除了Adversa AI測試之外，微軟的聊天機器人Bing Chat也被證明非常容易越獄。使用精心設計的輸入，使用者能夠讓該聊天機器人表達愛意，發出威脅傷害，為大屠殺辯護，並發明陰謀論。

布羅克曼並未否認GPT-4在這方面的不足，但他強調了該模型的新限制工具，包括被稱為「系統」訊息的API級功能。系統訊息本質上是為GPT-4的互動設定基調並建立界限的指令。例如，一個系統訊息可能是這樣寫的：「你是一位總是以蘇格拉底風格回答問題的導師。你永遠不會給學生答案，而是總是試著問正確的問題，幫助他們學會獨立思考。」

其思想是，系統訊息充當護欄，防止GPT-4偏離軌道。布羅克曼說：「真正弄清楚GPT-4的語氣、風格和實質一直是我們非常關注的問題。我認為我們開始更多地了解如何進行工程設計，如何擁有一個可重複的過程，讓你得到對人們真正有用的可預測結果。”

布羅克曼還提到了Evals，這是OpenAI最新的開源軟體框架，用於評估其AI模型的性能，這是OpenAI致力於“增強”其模型的標誌。 Evals允許使用者開發和運行評估模型(如GPT-4)的基準測試，同時檢查它們的性能，這是一種眾包的模型測試方法。

布羅克曼說：「有了Evals，我們可以更好地看到用戶關心的用例，並可以對其進行測試。我們之所以開源這個框架，部分原因是我們不再每每隔三個月發布一個新模型以不斷改進。你不會製造你不能測量的東西，對吧？但隨著我們推出新版模型，我們至少可以知道發生了哪些變化。」

#布羅克曼還被問道，OpenAI是否會補償人們用Evals測試它的模型？他不願就此做出承諾，但他確實指出，在有限的時間內，OpenAI允許提出申請的Eevals用戶提前訪問GPT-4 API。

布羅克曼也談到了GPT-4的上下文窗口，該窗口指的是模型在生成額外文本之前可以考慮的文本。 OpenAI正在測試一種版本的GPT-4，它可以「記住」大約50頁內容，是普通GPT-4「記憶體」的5倍，是GPT-3的8倍。

布羅克曼認為，擴展的上下文視窗會帶來新的、以前從未探索過的用例，特別是在企業中。他設想了一款為公司打造的AI聊天機器人，它可以利用來自不同來源(包括各部門員工)的背景和知識，以一種非常內行但具有對話性的方式回答問題。

這不是一個新概念。但布羅克曼認為，GPT-4的答案將比目前其他聊天機器人和搜尋引擎提供的答案有用得多。他說：「以前，模型根本不知道你是誰，你對什麼感興趣等。而擁有更大的上下文窗口肯定會讓它變得更強，從而大大增強它能為人們提供的支持。」（小小）

以上是OpenAI總裁：GPT-4並不完美但絕對與眾不同的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7504

CakePHP 教程

1378

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

編程新範式，當Spring Boot遇上OpenAI Feb 01, 2024 pm 09:18 PM

2023年，AI技術已成為熱門話題，對各行業產生了巨大影響，程式設計領域尤其如此。人們越來越認識到AI技術的重要性，Spring社群也不例外。隨著GenAI（GeneralArtificialIntelligence）技術的不斷進步，簡化具備AI功能的應用程式的創建變得至關重要和迫切。在這個背景下，"SpringAI"應運而生，旨在簡化開發AI功能應用程式的過程，使其變得簡單直觀，避免不必要的複雜性。透過"SpringAI"，開發者可以更輕鬆地建立具備AI功能的應用程序，將其變得更加易於使用和操作

選擇最適合資料的嵌入模型：OpenAI 和開源多語言嵌入的對比測試 Feb 26, 2024 pm 06:10 PM

OpenAI最近宣布推出他們的最新一代嵌入模型embeddingv3，他們聲稱這是效能最出色的嵌入模型，具備更高的多語言效能。這一批模型被劃分為兩種類型：規模較小的text-embeddings-3-small和更強大、體積較大的text-embeddings-3-large。這些模型的設計和訓練方式的資訊披露得很少,模型只能透過付費API存取。所以就出現了很多開源的嵌入模型但是這些開源的模型與OpenAI閉源模型相比如何呢？本文將對這些新模型與開源模型的效能進行實證比較。我們計劃建立一個數據

OpenAI超級對齊團隊遺作：兩個大模型博弈一番，輸出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型給的答案一點也看不懂，你敢用嗎？隨著機器學習系統在更重要的領域中得到應用，證明為什麼我們可以信任它們的輸出，並明確何時不應信任它們，變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是，要求系統對其輸出產生一種解釋，這種解釋對人類或另一個受信任的系統來說是可讀的，即可以完全理解以至於任何可能的錯誤都可以被發現。例如，為了建立對司法系統的信任，我們要求法院提供清晰易讀的書面意見，解釋並支持其決策。對於大型語言模型來說，我們也可以採用類似的方法。不過，在採用這種方法時，確保語言模型生

基於Rust的Zed編輯器已開源，內建對OpenAI和GitHub Copilot的支持 Feb 01, 2024 pm 02:51 PM

作者丨TimAnderson編譯丨諾亞出品|51CTO技術堆疊（微訊號：blog51cto）Zed編輯器專案目前仍處於預發布階段，已在AGPL、GPL和Apache許可下開源。此編輯器以高性能和多種AI輔助選擇為特色，但目前僅適用於Mac平台使用。內森·索博（NathanSobo）在一篇貼文中解釋道，Zed專案在GitHub上的程式碼庫中，編輯器部分採用了GPL許可，伺服器端元件則使用了AGPL許可證，而GPUI（GPU加速用戶介面）部分則採用了Apache2.0授權。 GPUI是Zed團隊開發的一款

沒等來OpenAI，等來了Open-Sora全面開源 Mar 18, 2024 pm 08:40 PM

不久前OpenAISora以其驚人的視訊生成效果迅速走紅，在一眾文生視訊模型中突顯重圍，成為全球矚目的焦點。繼2週前推出成本直降46%的Sora訓練推理復現流程後，Colossal-AI團隊全面開源全球首個類Sora架構視頻生成模型“Open-Sora1.0”，涵蓋了整個訓練流程，包括數據處理、所有訓練細節與模型權重，攜手全球AI熱愛者共同推動影片創作的新紀元。先睹為快，我們先看一段由Colossal-AI團隊發布的「Open-Sora1.0」模型生成的都市繁華掠影影片。 Open-Sora1.0

微軟、OpenAI 計畫 1 億美元投向人形機器人！網友紛紛喊話馬斯克 Feb 01, 2024 am 11:18 AM

微軟、OpenAI開年被曝預將大筆資金砸向人形機器人新創公司。其中，微軟計畫掏出9,500萬美元，OpenAI跟投500萬美元。彭博社消息稱，這家公司本輪預計共融資5億美元，投前估值或將達19億美元。是什麼吸引了他們？不妨先來看看這家公司的機器人成果。只見這個機器人通體銀黑，外觀酷似好萊塢科幻大片中的機器人形象：現在，他正在將一顆咖啡膠囊放進咖啡機裡：如果沒放正，還會自主調整，無需任何人為遠程遙控：不過一會兒，一杯咖啡就可以端走享用：有木有家人們已經認出來了，沒錯，這款機器人就是前段時間

本地運作效能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服務，太方便了！ Apr 15, 2024 am 09:01 AM

Ollama是一款超實用的工具，讓你能夠在本地輕鬆運行Llama2、Mistral、Gemma等開源模型。本文我將介紹如何使用Ollama實現對文本的向量化處理。如果你本地還沒有安裝Ollama，可以閱讀這篇文章。本文我們將使用nomic-embed-text[2]模型。它是一種文字編碼器，在短的上下文和長的上下文任務上，效能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。啟動nomic-embed-text服務當你已經成功安裝好o

突發！ OpenAI開除Ilya盟友，理由：涉嫌資訊外洩 Apr 15, 2024 am 09:01 AM

突發！ OpenAI開人了，理由：涉嫌資訊外洩。一位是失蹤的首席科學家Ilya盟友，超級對齊（Superalignment）團隊核心成員LeopoldAschenbrenner。另一位也不簡單，是LLM推理團隊研究員PavelIzmailov，曾經也在超級對齊團隊幹過。目前尚不清楚這倆到底洩漏了啥訊息。消息曝光後，不少網友表示「挺震驚」：不久前我還看過Aschenbrenner的貼文，感覺他正處於事業上升期，沒想到會有這樣的轉變。圖片還有網友認為：OpenAI失去Aschenbrenner，I

See all articles

OpenAI總裁：GPT-4並不完美但絕對與眾不同

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題