GPT-5要停？ OpenAI凌晨發文回應：保障AI安全，我們沒有「偷工減料」-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

GPT-5要停？ OpenAI凌晨發文回應：保障AI安全，我們沒有「偷工減料」

PHPz

Apr 07, 2023 pm 02:48 PM

人工智慧系統

近些天，對 OpenAI 來說，可謂是個「多事之秋」。

由於ChatGPT 及GPT-4 可能引發的安全問題，OpenAI 受到了來自外界的一些指責和阻撓：

馬斯克等上千人聯名呼籲「所有人工智慧實驗室應立即暫停訓練比GPT-4 更強大的大模型，這一時間至少為6 個月”；
意大利禁用ChatGPT，OpenAl“必須在20 天內通過其在歐洲的代表向他們通報公司執行此要求而採取的措施」；
ChatGPT 大面積封號；
ChatGPT Plus 停售；
......

這些事件表明，儘管AI 已經證明有能力為人類社會帶來諸多好處，但科技總是一把雙面刃，也會為人類社會帶來帶來真正的風險，AI 也不例外。

4 月 6 日，OpenAI 官方發布了一篇名為「Our approach to AI safety」的部落格文章，探討如何「安全地建構、部署和使用人工智慧系統」的方法。

GPT-5要停？ OpenAI凌晨發文回應：保障AI安全，我們沒有「偷工減料」

OpenAI 致力於維持強大的人工智慧安全和（人類社會的）廣泛受益。我們的人工智慧工具為今天的人們提供了許多好處。

來自世界各地的用戶告訴我們，ChatGPT 有助於提高他們的生產力，增強他們的創造力，並提供量身定制的學習體驗。

我們也意識到，像任何技術一樣，這些工具也有真正的風險——所以，我們努力確保在各個層面上將安全納入我們的系統。

1. 建立越來越安全的人工智慧系統

在發布任何新系統之前，我們都會進行嚴格的測試，讓外部專家參與反饋，並努力利用人類反饋的強化學習等技術改善模型的行為，並建立廣泛的安全和監測系統。

例如，在我們最新的模型 GPT-4 完成訓練後，我們所有員工花了 6 個多月的時間使其在公開發布前更加安全和一致。

我們認為，強大的人工智慧系統應該接受嚴格的安全評估。需要有監管來確保這種做法被採納，我們積極與政府接觸，探討這種監管可能採取的最佳形式。

2. 從真實世界的使用中學習，以改進保障措施

我們努力在部署前預防可預見的風險，然而，我們在實驗室中能學到的東西是有限的。儘管進行了廣泛的研究和測試，我們無法預測人們使用我們技術的所有有益方式，也無法預測人們濫用科技的所有方式。這就是為什麼我們相信，隨著時間的推移，從現實世界的使用中學習是創建和發布越來越安全的人工智慧系統的關鍵組成部分。

在有大量的保障措施下，我們謹慎地逐步發布新的人工智慧系統，將其推送給一個穩步擴大的人群，並根據我們學到的經驗不斷改進。

我們透過我們自己的服務和 API 提供我們最有能力的模型，讓開發者可以直接在他們的應用程式中使用這種技術。這使我們能夠監測濫用情況並採取行動，並不斷建立緩解措施，以應對人們濫用我們的系統的真實方式，而不僅僅是關於濫用可能會是什麼樣子的理論。

現實世界的使用也使我們制定了越來越細微的政策，以防止那些對人們構成真正風險的行為，同時也允許我們的技術有許多有益的用途。

至關重要的是，我們相信社會必須有時間來更新和調整，以適應能力越來越強的人工智慧，而每個受這種技術影響的人都應該在人工智慧的進一步發展中擁有重要的發言權。迭代部署幫助我們將各種利害關係人帶入關於採用人工智慧技術的對話中，比他們沒有親身經歷過這些工具的情況下更有效。

3. 保護兒童

關於安全的一個關鍵工作是保護兒童。我們要求使用我們的人工智慧工具的人必須是 18 歲或以上，或 13 歲或以上並得到父母的批准，我們正在研究驗證選項。

我們不允許我們的技術被用來產生仇恨、騷擾、暴力或成人內容，以及其他（有害）類別。我們的最新模型 GPT-4 與 GPT-3.5 相比，對不允許的內容請求的回應率降低了 82%，我們已經建立了一個強大的系統來監控濫用。 GPT-4 現在可供 ChatGPT Plus 用戶使用，我們希望隨著時間的推移，能讓更多人使用。

我們做了許多努力，盡量減少我們的模型產生傷害兒童的內容的可能性。例如，當使用者試圖向我們的圖像工具上傳兒童安全虐待資料時，我們會阻止這項動作，並向國家失蹤和受剝削兒童中心報告。

除了我們的預設安全護欄外，我們還與非營利性的可汗學院等開發商合作--該學院建立了一個由人工智慧驅動的助手，既是學生的虛擬導師，也是教師的課堂助手--為他們的使用情況量身訂做安全緩解措施。我們也正在開發一些功能，使開發者能夠為模型輸出設定更嚴格的標準，以更好地支援那些希望獲得此功能的開發者和使用者。

4. 尊重隱私

我們的大型語言模型是在一個廣泛的文本語料庫上訓練出來的，其中包括公開的、授權的內容，以及由人類審查者產生的內容。我們不使用數據來銷售我們的服務、廣告或建立人們的檔案，我們使用數據來使我們的模型對人們更有幫助。例如，ChatGPT 透過對人們與它的對話進行進一步的訓練來提高能力。

雖然我們的一些訓練資料包括公共互聯網上的個人信息，但我們希望我們的模型能夠了解這個世界，而不是私人。因此，我們努力在可行的情況下從訓練資料集中刪除個人訊息，對模型進行微調，以拒絕對私人資訊的請求，並對個人提出的從我們的系統中刪除其個人資訊的請求作出回應。這些步驟最大限度地減少了我們的模型可能產生包括私人資訊的內容的可能性。

5. 提高事實的準確性

大型語言模型根據它們先前看到的模式，包括使用者提供的文字輸入，預測、產生接下來的一系列的單字。在某些情況下，下一個最有可能的詞可能在事實上並不準確。

提高事實準確性是 OpenAI 和許多其他人工智慧開發者的一個重要工作，我們正在取得進展。透過利用使用者對被標記為不正確的 ChatGPT 輸出的回饋作為主要資料來源。

我們意識到，要進一步減少幻覺的可能性，以及引導大眾了解這些人工智慧工具目前的局限性，還有很多其他工作要做。

6. 持續的研究和參與

我們認為，解決人工智慧安全問題的實用方法是投入更多的時間和資源來研究有效的緩解措施和調整技術，並針對現實世界的濫用進行測試。

重要的是，我們認為，提高人工智慧的安全性和能力應該齊頭並進。到目前為止，我們最好的安全工作來自與我們能力最強的模型之間的合作，因為它們更善於遵循使用者的指示，更容易引導或「指導」。

隨著能力更強的模型的創建和部署，我們將越來越謹慎，隨著我們人工智慧系統的進一步發展，我們將繼續加強安全防範措施。

雖然我們為了更好地了解GPT-4 的能力、好處和風險，等了6 個多月才將其部署，但有時可能需要比這更長的時間來提高人工智慧系統的安全性。因此，政策制定者和人工智慧供應商將需要確保人工智慧的發展和部署在全球範圍內得到有效的管理，沒有人會為了盡快取得成功而「偷工減料」。這是一個艱鉅的挑戰，需要技術和製度上的創新，但這也是我們渴望做出的貢獻。

解決安全問題也需要廣泛的辯論、實驗和參與，包括在人工智慧系統行為的界限上。我們已經並將繼續促進利益相關者之間的合作和公開對話，以創建一個安全的人工智慧生態系統。

以上是GPT-5要停？ OpenAI凌晨發文回應：保障AI安全，我們沒有「偷工減料」的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1663

CakePHP 教程

1419

Laravel 教程

1313

PHP教程

1263

C# 教程

1237

Related knowledge

位元組跳動剪映推出 SVIP 超級會員：連續包年 499 元，提供多種 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日訊息，剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體，依託於抖音平台且基本面向該平台用戶製作短影片內容，並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級，推出全新SVIP，包含多種AI黑科技，例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面，剪映SVIP月費79元，年費599元（本站註：折合每月49.9元），連續包月則為59元每月，連續包年為499元每年（折合每月41.6元）。此外，剪映官方也表示，為提升用戶體驗，向已訂閱了原版VIP

华为乾崑 ADS3.0 智驾系统 8 月上市享界 S9 首发搭载 Jul 30, 2024 pm 02:17 PM

7月29日，在AITO问界第四十万台新车下线仪式上，华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东出席发表演讲并宣布，问界系列车型将于今年8月迎来华为乾崑ADS3.0版本的上市，并计划在8月至9月间陆续推送升级。8月6日即将发布的享界S9将首发华为ADS3.0智能驾驶系统。华为乾崑ADS3.0版本在激光雷达的辅助下，将大幅提升智驾能力，具备融合端到端的能力，并采用GOD(通用障碍物识别)/PDP(预测决策规控)全新端到端架构，提供车位到车位智驾领航NCA功能，并升级CAS3.0全

使用Rag和Sem-Rag提供上下文增強AI編碼助手 Jun 10, 2024 am 11:08 AM

透過將檢索增強生成和語意記憶納入AI編碼助手，提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG，作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助，但由於依賴對軟體語言和編寫軟體最常見模式的整體理解，因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題，但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議，以便將程式碼接受到應

七個很酷的GenAI & LLM技術性面試問題 Jun 07, 2024 am 10:06 AM

想了解更多AIGC的內容，請造訪：51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫，這些問題需要跳脫常規思維。大語言模型（LLM）在數據科學、生成式人工智慧（GenAI）和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能，並在許多產業中推動了效率和創新性的提升，成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛，它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據，LLM能夠產生文本

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 Jun 11, 2024 pm 03:57 PM

大型語言模型（LLM）是在龐大的文字資料庫上訓練的，在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中，然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時，模型實際上停止學習。對模型進行對齊或進行指令調優，讓模型學習如何充分利用這些知識，以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的，儘管模型可以透過RAG存取外部內容，但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的，模型會遇到額外的實際知識並將其整合

你所不知道的機器學習五大學派 Jun 05, 2024 pm 08:51 PM

機器學習是人工智慧的重要分支，它賦予電腦從數據中學習的能力，並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用，從影像辨識和自然語言處理到推薦系統和詐欺偵測，它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論，其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學（Symbolism），又稱符號主義，強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程，透過現有的

為大模型提供全新科學複雜問答基準與評估體系，UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答（QA）資料集在推動自然語言處理（NLP）研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型，也可以有效評估大語言模型（LLM）的能力，尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集，涵蓋了醫學、化學、生物等領域，但這些數據集仍有一些不足之處。其一，資料形式較為單一，大多數為多項選擇題（multiple-choicequestions），它們易於進行評估，但限制了模型的答案選擇範圍，無法充分測試模型的科學問題解答能力。相比之下，開放式問答

SK 海力士 8 月 6 日將展示 AI 相關新品：12 層 HBM3E、321-high NAND 等 Aug 01, 2024 pm 09:40 PM

本站8月1日消息，SK海力士今天（8月1日）發布博文，宣布將出席8月6日至8日，在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024，展示諸多新一代產品。未來記憶體和儲存高峰會（FutureMemoryandStorage）簡介前身是主要面向NAND供應商的快閃記憶體高峰會（FlashMemorySummit），在人工智慧技術日益受到關注的背景下，今年重新命名為未來記憶體和儲存高峰會（FutureMemoryandStorage），以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在

See all articles

GPT-5要停？ OpenAI凌晨發文回應：保障AI安全，我們沒有「偷工減料」

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題