OpenAI發文介紹如何確保AI安全：政府監管是必要的-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

OpenAI發文介紹如何確保AI安全：政府監管是必要的

王林

Apr 07, 2023 pm 07:01 PM

chatgpt openai

OpenAI發文介紹如何確保AI安全：政府監管是必要的

4月6日消息，美國當地時間週三，OpenAI發帖，詳細介紹了其確保AI安全的方法，包括進行安全評估、改善發布後的保障措施、保護兒童、尊重隱私等。該公司表示，確保AI系統的建置、部署和安全使用對實現其使命至關重要。

以下是OpenAI貼文的全文：

OpenAI致力於確保強大的AI安全，讓盡可能多的人受益。我們知道，我們的AI工具為當今人們提供了許多幫助。世界各地的使用者向我們回饋，ChatGPT有助於提高他們的工作效率、增強他們的創造力，並提供量身定制的學習體驗。但我們也意識到，與任何技術一樣，這些工具也存在真正的風險。因此，我們正在努力確保在各個系統層面上的安全性。

打造更安全的人工智慧#系統

正在推出在任何新的人工智慧系統之前，我們都會進行嚴格的測試，徵求外部專家的意見，並透過人工回饋的強化學習等技術來改善模型的表現。同時，我們也建立了廣泛的安全和監控系統。

以我們最新的模型GPT-4為例，完成訓練後，我們在整個公司範圍內進行了長達6個月的測試，以確保其在公開發布之前更加安全可靠。

我們認為，強大的人工智慧系統應該接受嚴格的安全評估。監管是必要的，以確保這種做法被廣泛採納。因此，我們積極與各國政府接觸，並探討最佳的監管形式。

從實際使用中學習，提高保障措施

我們盡力在系統部署之前預防可預見的風險，但實驗室中的學習永遠有限。我們廣泛研究和測試，但無法預測人們會如何使用我們的技術，或濫用它。因此，我們認為從實際使用中學習，是創建和發布越來越安全的人工智慧系統的關鍵組成部分。

我們謹慎地將新的人工智慧系統逐步發布給人群，並採取實質的保障措施，並根據我們學到的教訓不斷改進。

我們提供自己服務和API中最強大的模型，以便開發人員可以直接將技術整合到他們的應用程式中。這使我們能夠監控濫用行為並採取行動，同時制定應對措施。這樣，我們可以採取實際行動，而不只是在理論上想像如何應對。

實際使用中的經驗也促使我們制定了越來越細化的政策，以應對對人們構成真正風險的行為，同時仍然允許我們的技術以更有益的方式使用。

我們認為，社會需要更多時間適應日益強大的人工智慧，每個受其影響的人都應該在人工智慧的進一步發展方面擁有發言權。迭代部署有助於不同利害關係人更有效地參與人工智慧技術的對話中，而擁有使用這些工具的第一手經驗至關重要。

保護兒童

我們的安全工作關注重點之一是保護兒童。我們要求使用我們的人工智慧工具的人必須年滿18歲或以上，或在父母同意的情況下年滿13歲或以上。目前，我們正在研究驗證功能。

我們不允許我們的技術用於產生仇恨、騷擾、暴力或成人等內容。與GPT-3.5相比，最新的GPT-4對受限內容請求做出回應的可能性降低了82%。我們已經建立了強大的系統來監控濫用行為。 GPT-4現在可供ChatGPT Plus的訂戶使用，我們希望隨著時間的推移能讓更多人體驗它。

我們已經採取重大措施，最大限度地減少我們的模型產生傷害兒童內容的可能性。例如，當用戶試圖將兒童安全虐待材料上傳到我們的圖像生成工具時，我們會阻止它並向國家失踪和受剝削兒童中心報告此事。

除了預設的安全防護，我們與非營利組織可汗學院(Khan Academy)等開發機構合作，為他們量身定制了安全措施。可汗學院已經開發了一款人工智慧助手，它可以作為學生的虛擬導師，也可以作為教師的課堂助手。我們也致力於開發允許開發者為模型輸出設定更嚴格標準的功能，以更好地支援需要此類功能的開發者和使用者。

尊重隱私

我們的大型語言模型是在廣泛的文本語料庫上進行訓練的，其中包括公開可用的內容、獲得授權的內容以及由人類審核人員產生的內容。我們不利用這些資料來銷售我們的服務或廣告，也不用它們來建立個人檔案。我們只是利用這些數據來讓我們的模型更好地為人們提供幫助，例如透過與人們進行更多對話來提高ChatGPT的智慧水平。

儘管我們的許多訓練資料中包括可以在公共網路上獲得的個人訊息，但我們希望我們的模型了解的是整個世界，而不是個人。因此，我們致力於在可行的情況下從訓練資料集中刪除個人訊息，微調模型以拒絕個人資訊的查詢請求，並回應個人從我們的系統中刪除其個人資訊的請求。這些措施將我們的模型產生包含個人資訊的回應的可能性降至最低。

提高事實準確度

現今的大型語言模型，基於先前的模式和使用者輸入的文本，可以預測下一個可能要使用的詞彙。但在某些情況下，下一個最有可能出現的詞彙實際上可能存在事實性錯誤。

提高事實準確性是OpenAI和許多其他AI研究機構關注的重點之一，我們正在取得進展。透過利用被標記為不正確的ChatGPT輸出的用戶回饋作為主要數據來源，我們提高了GPT-4的事實準確性。相較於GPT-3.5，GPT-4更可能產生符合事實的內容，提高幅度達40%。

當用戶註冊使用該工具時，我們努力做到盡可能透明，以避免ChatGPT可能給予錯誤回應。然而，我們已經認識到，要進一步降低誤解的可能性，並教育大眾了解這些AI工具目前的局限性，還有很多工作要做。

持續的研究和參與

我們認為，解決AI安全問題的一個切實可行方法是，投入更多的時間和資源來研究有效的緩解和校準技術，並針對現實世界可能被濫用的情況進行測試。

重要的是，我們認為提高AI的安全性和能力應該同時進行。我們迄今為止最好的安全工作來自於與我們最有能力的模型合作，因為它們更擅長遵循用戶的指示，更容易駕馭或「引導」它們。

我們將越來越謹慎地創建和部署能力更強的模型，並將隨著AI系統的發展而繼續加強安全預防措施。

雖然我們等了6個多月才部署GPT-4，以便更好地了解其功能、好處和風險，但有時可能需要更長的時間來提高AI系統的安全性。因此，政策制定者和AI開發商需要確保AI的開發和部署在全球範圍內得到有效監管，這樣就沒有人會為了保持領先而採取捷徑。這是一項艱鉅的挑戰，需要技術和製度創新，但我們渴望為此做出貢獻。

解決AI安全問題也需要廣泛的辯論、實驗和參與，包括為AI系統的行為設定界限。我們已經並將繼續促進利益相關者之間的合作和開放對話，以創建更安全的AI生態系統。

以上是OpenAI發文介紹如何確保AI安全：政府監管是必要的的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7886

Java教學

1649

CakePHP 教程

1410

Laravel 教程

1301

PHP教程

1246

Related knowledge

ChatGPT 現在允許免費用戶使用 DALL-E 3 產生每日限制的圖像 Aug 09, 2024 pm 09:37 PM

DALL-E 3 於 2023 年 9 月正式推出，是比其前身大幅改進的車型。它被認為是迄今為止最好的人工智慧圖像生成器之一，能夠創建具有複雜細節的圖像。然而，在推出時，它不包括

編程新範式，當Spring Boot遇上OpenAI Feb 01, 2024 pm 09:18 PM

2023年，AI技術已成為熱門話題，對各行業產生了巨大影響，程式設計領域尤其如此。人們越來越認識到AI技術的重要性，Spring社群也不例外。隨著GenAI（GeneralArtificialIntelligence）技術的不斷進步，簡化具備AI功能的應用程式的創建變得至關重要和迫切。在這個背景下，"SpringAI"應運而生，旨在簡化開發AI功能應用程式的過程，使其變得簡單直觀，避免不必要的複雜性。透過"SpringAI"，開發者可以更輕鬆地建立具備AI功能的應用程序，將其變得更加易於使用和操作

選擇最適合資料的嵌入模型：OpenAI 和開源多語言嵌入的對比測試 Feb 26, 2024 pm 06:10 PM

OpenAI最近宣布推出他們的最新一代嵌入模型embeddingv3，他們聲稱這是效能最出色的嵌入模型，具備更高的多語言效能。這一批模型被劃分為兩種類型：規模較小的text-embeddings-3-small和更強大、體積較大的text-embeddings-3-large。這些模型的設計和訓練方式的資訊披露得很少,模型只能透過付費API存取。所以就出現了很多開源的嵌入模型但是這些開源的模型與OpenAI閉源模型相比如何呢？本文將對這些新模型與開源模型的效能進行實證比較。我們計劃建立一個數據

手機怎麼安裝chatgpt Mar 05, 2024 pm 02:31 PM

安裝步驟：1、在ChatGTP官網或手機商店下載ChatGTP軟體；2、開啟後在設定介面中，選擇語言為中文；3、在對局介面中，選擇人機對局並設定中文相譜；4 、開始後在聊天視窗中輸入指令，即可與軟體互動。

OpenAI超級對齊團隊遺作：兩個大模型博弈一番，輸出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型給的答案一點也看不懂，你敢用嗎？隨著機器學習系統在更重要的領域中得到應用，證明為什麼我們可以信任它們的輸出，並明確何時不應信任它們，變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是，要求系統對其輸出產生一種解釋，這種解釋對人類或另一個受信任的系統來說是可讀的，即可以完全理解以至於任何可能的錯誤都可以被發現。例如，為了建立對司法系統的信任，我們要求法院提供清晰易讀的書面意見，解釋並支持其決策。對於大型語言模型來說，我們也可以採用類似的方法。不過，在採用這種方法時，確保語言模型生

基於Rust的Zed編輯器已開源，內建對OpenAI和GitHub Copilot的支持 Feb 01, 2024 pm 02:51 PM

作者丨TimAnderson編譯丨諾亞出品|51CTO技術堆疊（微訊號：blog51cto）Zed編輯器專案目前仍處於預發布階段，已在AGPL、GPL和Apache許可下開源。此編輯器以高性能和多種AI輔助選擇為特色，但目前僅適用於Mac平台使用。內森·索博（NathanSobo）在一篇貼文中解釋道，Zed專案在GitHub上的程式碼庫中，編輯器部分採用了GPL許可，伺服器端元件則使用了AGPL許可證，而GPUI（GPU加速用戶介面）部分則採用了Apache2.0授權。 GPUI是Zed團隊開發的一款

本地運作效能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服務，太方便了！ Apr 15, 2024 am 09:01 AM

Ollama是一款超實用的工具，讓你能夠在本地輕鬆運行Llama2、Mistral、Gemma等開源模型。本文我將介紹如何使用Ollama實現對文本的向量化處理。如果你本地還沒有安裝Ollama，可以閱讀這篇文章。本文我們將使用nomic-embed-text[2]模型。它是一種文字編碼器，在短的上下文和長的上下文任務上，效能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。啟動nomic-embed-text服務當你已經成功安裝好o

沒等來OpenAI，等來了Open-Sora全面開源 Mar 18, 2024 pm 08:40 PM

不久前OpenAISora以其驚人的視訊生成效果迅速走紅，在一眾文生視訊模型中突顯重圍，成為全球矚目的焦點。繼2週前推出成本直降46%的Sora訓練推理復現流程後，Colossal-AI團隊全面開源全球首個類Sora架構視頻生成模型“Open-Sora1.0”，涵蓋了整個訓練流程，包括數據處理、所有訓練細節與模型權重，攜手全球AI熱愛者共同推動影片創作的新紀元。先睹為快，我們先看一段由Colossal-AI團隊發布的「Open-Sora1.0」模型生成的都市繁華掠影影片。 Open-Sora1.0

See all articles

OpenAI發文介紹如何確保AI安全：政府監管是必要的

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題