Selon les rapports, OpenAI a récemment lancé une nouvelle fonctionnalité qui permet aux sites Web d'empêcher leurs robots d'exploration de récupérer les données de leurs sites Web pour former les modèles GPT à traiter des problèmes tels que la confidentialité des données et les droits d'auteur
GPTBot est un programme d'exploration de sites Web développé par OpenAI. Il peut rechercher et extraire automatiquement des informations sur Internet et enregistrer du contenu Web pour l'utiliser dans la formation de modèles GPT
.
Selon le billet de blog OpenAI, les administrateurs de sites Web peuvent empêcher GPTBot de récupérer les données du site Web en désactivant l'accès à GPTBot dans le fichier Robots.txt de leur site Web ou en bloquant son adresse IP. OpenAI a également noté que les pages Web récupérées à l'aide de l'agent utilisateur GPTBot pourraient être utilisées pour améliorer les modèles futurs, tout en filtrant les sources de texte dont l'accès est payant, connues pour collecter des informations personnellement identifiables (PII) ou qui violent les politiques d'OpenAI. Pour les sources qui répondent aux critères d'exclusion, autoriser GPTBot à accéder au site Web contribuera à améliorer la précision, les capacités générales et la sécurité des modèles d'IA
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!