首頁 > 科技週邊 > 人工智慧 > OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

WBOY
發布: 2023-08-15 12:41:05
轉載
869 人瀏覽過

據報道,OpenAI最近推出了一個新功能,允許網站阻止其網路爬蟲從其網站上抓取資料以訓練GPT模型,以應對資料隱私和版權等問題

GPTBot是OpenAI開發的網路爬蟲程序,它能夠自動搜尋和提取網路上的信息,並將網頁內容保存下來,以供訓練GPT模型使用

OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練

根據OpenAI的部落格文章,網站管理員可以透過在其網站的Robots.txt檔案中禁止GPTBot訪問,或透過封鎖其IP位址來阻止GPTBot從網站上抓取資料。 OpenAI也指出,使用GPTBot使用者代理程式抓取的網頁可能會被用於改進未來的模型,同時會過濾掉付費存取、已知收集個人識別資訊(PII),或違反OpenAI政策的文字來源。對於符合排除標準的來源,允許GPTBot存取網站將有助於提高AI模型的準確性、通用能力和安全性

以上是OpenAI限製網路爬蟲存取以保護資料免被用於AI模型訓練的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:sohu.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板