Selon les informations de ce site du 1er août, le PDG de Reddit, Steve Huffman, a récemment déclaré que si des entreprises telles que Microsoft souhaitent continuer à explorer les données du site Web, elles doivent payer. Reddit a déjà conclu des accords avec Google et OpenAI.
Image via Pexels
Image via Pexels
Hoffman a noté que sans ces accords, Reddit n'a aucun contrôle ni visibilité sur la façon dont ses données sont utilisées, les obligeant à bloquer les entreprises qui ne veulent pas accepter les conditions dans lesquelles leurs données sont utilisées. Il a pointé du doigt trois sociétés, Microsoft, Anthropic et Perplexity, pour avoir refusé de négocier et a qualifié leur blocage de « très gênant ».
Ces derniers mois, Reddit a multiplié ses efforts pour sévir contre les scrapers. Début juillet, Reddit a mis à jour son fichier robots.txt pour bloquer les robots d'exploration non autorisés. Il a été découvert plus tard que le contenu de Reddit n'apparaissait que dans les résultats de recherche Google et n'était pas visible sur d'autres moteurs de recherche tels que Bing.
Hoffman a accusé Microsoft d'utiliser les données Reddit pour entraîner l'IA sans autorisation, de résumer le contenu Reddit dans les résultats de recherche Bing et même de vendre ces données à d'autres moteurs de recherche via l'API Bing. Il a également répondu aux remarques précédentes du responsable de l'IA de Microsoft, Mustafa Suleiman, selon lesquelles les données publiques sur Internet étaient des « logiciels libres », affirmant que des entreprises telles que Microsoft pensaient que tout le contenu sur Internet était libre d'utilisation et que c'était la leur.
Ce site a remarqué qu'en réponse à la disparition des résultats de recherche Reddit de Bing, la directrice de la recherche de Microsoft, Jody Ribas, a déclaré sur les réseaux sociaux que Reddit bloquait les robots d'exploration de Bing et favorisait un autre moteur de recherche, affectant ainsi la concurrence entre Bing et les moteurs de recherche basés sur Bing. La porte-parole de Microsoft, Caitlin Lawton, a également déclaré que la société respectait le souhait des sites Web de ne pas voir leur contenu utilisé dans des modèles d'IA générative.
Hoffman a utilisé SearchGPT d'OpenAI comme exemple pour souligner l'importance des accords payants. Plus tôt cette année, Reddit et OpenAI ont conclu un accord pour permettre à SearchGPT d'afficher le contenu Reddit. Le porte-parole de Reddit, Tim Rutschmidt, a déclaré qu'aucun des accords de licence de contenu actuels n'implique des droits exclusifs d'utilisation des données.
La demande de paiement de Reddit est similaire à celle des éditeurs de médias traditionnels qui espèrent également gagner des revenus en autorisant l'utilisation du contenu pour l'IA générative. Hoffman estime que l'échange de valeurs traditionnel des moteurs de recherche a changé. La recherche, les résumés et la formation s'intègrent, et le modèle consistant à simplement s'appuyer sur l'exploration de contenu en échange de trafic est devenu flou.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!