明牌:OpenAI 發布帶有「身分識別」的網路爬蟲工具 GPTBot

王林
發布: 2023-08-12 17:21:06
轉載
1143 人瀏覽過

本站 8 月 8 日消息,OpenAI 昨日發布了旗下網路爬蟲工具 GPTBot。官方宣稱,該 GPTBot 工具能夠在註重版權的基礎上,使用透明的方式收集網頁信息,來訓練 OpenAI 旗下的各 AI 模型

OpenAI 表示,GPTBot 使用專有網頁UA 表示其爬蟲身分,完整UA 字串為(Mozilla / 5.0 AppleWebKit / 537.36 / KHTML, like Gecko; compatible; GPTBot / 1.0; https://openai.com/ gptbot),任何網站管理者都可以自由允許或阻止該爬蟲工具進行資料收集。

明牌:OpenAI 发布带有“身份标识”的网络爬虫工具 GPTBot
▲ 圖源OpenAI

明牌:OpenAI 发布带有“身份标识”的网络爬虫工具 GPTBot
▲ 圖源OpenAI

OpenAI 聲稱,若網站管理員不希望被爬蟲蒐集資料,管理員可以在網站伺服器的robots.txt 檔案中完全禁止GPTBot 抓取訊息,或自行決定GPTBot 抓取網站上的指定資訊

OpenAI之前因被指控侵犯隱私問題而備受業界批評,現在推出了GPTBot爬蟲工具,這可以看作是對外界批評的回應,並且有助於行業建立AI訓練用爬蟲工具的相關基準。據報道,OpenAI最近註冊了GPT-5商標,這款GPTBot爬蟲工具也有望為GPT-5的相關模型訓練提供支持

本站文章中包含的對外跳轉鏈接(如超鏈接、二維碼、口令等形式)僅用於提供更多信息,節省篩選時間,結果僅供參考。請注意,所有文章均帶有此廣告聲明

以上是明牌:OpenAI 發布帶有「身分識別」的網路爬蟲工具 GPTBot的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:ithome.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!