OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 15, 2023 pm 12:41 PM

網路爬蟲 openai 資料訓練

據報道，OpenAI最近推出了一個新功能，允許網站阻止其網路爬蟲從其網站上抓取資料以訓練GPT模型，以應對資料隱私和版權等問題

GPTBot是OpenAI開發的網路爬蟲程序，它能夠自動搜尋和提取網路上的信息，並將網頁內容保存下來，以供訓練GPT模型使用

OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

根據OpenAI的部落格文章，網站管理員可以透過在其網站的Robots.txt檔案中禁止GPTBot訪問，或透過封鎖其IP位址來阻止GPTBot從網站上抓取資料。 OpenAI也指出，使用GPTBot使用者代理程式抓取的網頁可能會被用於改進未來的模型，同時會過濾掉付費存取、已知收集個人識別資訊（PII），或違反OpenAI政策的文字來源。對於符合排除標準的來源，允許GPTBot存取網站將有助於提高AI模型的準確性、通用能力和安全性

以上是OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7926

Java教學

1652

CakePHP 教程

1411

Laravel 教程

1303

PHP教程

1250

Related knowledge

編程新範式，當Spring Boot遇上OpenAI Feb 01, 2024 pm 09:18 PM

2023年，AI技術已成為熱門話題，對各行業產生了巨大影響，程式設計領域尤其如此。人們越來越認識到AI技術的重要性，Spring社群也不例外。隨著GenAI（GeneralArtificialIntelligence）技術的不斷進步，簡化具備AI功能的應用程式的創建變得至關重要和迫切。在這個背景下，"SpringAI"應運而生，旨在簡化開發AI功能應用程式的過程，使其變得簡單直觀，避免不必要的複雜性。透過"SpringAI"，開發者可以更輕鬆地建立具備AI功能的應用程序，將其變得更加易於使用和操作

選擇最適合資料的嵌入模型：OpenAI 和開源多語言嵌入的對比測試 Feb 26, 2024 pm 06:10 PM

OpenAI最近宣布推出他們的最新一代嵌入模型embeddingv3，他們聲稱這是效能最出色的嵌入模型，具備更高的多語言效能。這一批模型被劃分為兩種類型：規模較小的text-embeddings-3-small和更強大、體積較大的text-embeddings-3-large。這些模型的設計和訓練方式的資訊披露得很少,模型只能透過付費API存取。所以就出現了很多開源的嵌入模型但是這些開源的模型與OpenAI閉源模型相比如何呢？本文將對這些新模型與開源模型的效能進行實證比較。我們計劃建立一個數據

OpenAI超級對齊團隊遺作：兩個大模型博弈一番，輸出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型給的答案一點也看不懂，你敢用嗎？隨著機器學習系統在更重要的領域中得到應用，證明為什麼我們可以信任它們的輸出，並明確何時不應信任它們，變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是，要求系統對其輸出產生一種解釋，這種解釋對人類或另一個受信任的系統來說是可讀的，即可以完全理解以至於任何可能的錯誤都可以被發現。例如，為了建立對司法系統的信任，我們要求法院提供清晰易讀的書面意見，解釋並支持其決策。對於大型語言模型來說，我們也可以採用類似的方法。不過，在採用這種方法時，確保語言模型生

基於Rust的Zed編輯器已開源，內建對OpenAI和GitHub Copilot的支持 Feb 01, 2024 pm 02:51 PM

作者丨TimAnderson編譯丨諾亞出品|51CTO技術堆疊（微訊號：blog51cto）Zed編輯器專案目前仍處於預發布階段，已在AGPL、GPL和Apache許可下開源。此編輯器以高性能和多種AI輔助選擇為特色，但目前僅適用於Mac平台使用。內森·索博（NathanSobo）在一篇貼文中解釋道，Zed專案在GitHub上的程式碼庫中，編輯器部分採用了GPL許可，伺服器端元件則使用了AGPL許可證，而GPUI（GPU加速用戶介面）部分則採用了Apache2.0授權。 GPUI是Zed團隊開發的一款

本地運作效能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服務，太方便了！ Apr 15, 2024 am 09:01 AM

Ollama是一款超實用的工具，讓你能夠在本地輕鬆運行Llama2、Mistral、Gemma等開源模型。本文我將介紹如何使用Ollama實現對文本的向量化處理。如果你本地還沒有安裝Ollama，可以閱讀這篇文章。本文我們將使用nomic-embed-text[2]模型。它是一種文字編碼器，在短的上下文和長的上下文任務上，效能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。啟動nomic-embed-text服務當你已經成功安裝好o

沒等來OpenAI，等來了Open-Sora全面開源 Mar 18, 2024 pm 08:40 PM

不久前OpenAISora以其驚人的視訊生成效果迅速走紅，在一眾文生視訊模型中突顯重圍，成為全球矚目的焦點。繼2週前推出成本直降46%的Sora訓練推理復現流程後，Colossal-AI團隊全面開源全球首個類Sora架構視頻生成模型“Open-Sora1.0”，涵蓋了整個訓練流程，包括數據處理、所有訓練細節與模型權重，攜手全球AI熱愛者共同推動影片創作的新紀元。先睹為快，我們先看一段由Colossal-AI團隊發布的「Open-Sora1.0」模型生成的都市繁華掠影影片。 Open-Sora1.0

微軟、OpenAI 計畫 1 億美元投向人形機器人！網友紛紛喊話馬斯克 Feb 01, 2024 am 11:18 AM

微軟、OpenAI開年被曝預將大筆資金砸向人形機器人新創公司。其中，微軟計畫掏出9,500萬美元，OpenAI跟投500萬美元。彭博社消息稱，這家公司本輪預計共融資5億美元，投前估值或將達19億美元。是什麼吸引了他們？不妨先來看看這家公司的機器人成果。只見這個機器人通體銀黑，外觀酷似好萊塢科幻大片中的機器人形象：現在，他正在將一顆咖啡膠囊放進咖啡機裡：如果沒放正，還會自主調整，無需任何人為遠程遙控：不過一會兒，一杯咖啡就可以端走享用：有木有家人們已經認出來了，沒錯，這款機器人就是前段時間

突發！ OpenAI開除Ilya盟友，理由：涉嫌資訊外洩 Apr 15, 2024 am 09:01 AM

突發！ OpenAI開人了，理由：涉嫌資訊外洩。一位是失蹤的首席科學家Ilya盟友，超級對齊（Superalignment）團隊核心成員LeopoldAschenbrenner。另一位也不簡單，是LLM推理團隊研究員PavelIzmailov，曾經也在超級對齊團隊幹過。目前尚不清楚這倆到底洩漏了啥訊息。消息曝光後，不少網友表示「挺震驚」：不久前我還看過Aschenbrenner的貼文，感覺他正處於事業上升期，沒想到會有這樣的轉變。圖片還有網友認為：OpenAI失去Aschenbrenner，I

See all articles

OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題