Laut Nachrichten dieser Website vom 1. August erklärte Reddit-CEO Steve Huffman kürzlich, dass Unternehmen wie Microsoft zahlen müssen, wenn sie die Daten der Website weiterhin crawlen wollen. Reddit hat zuvor Vereinbarungen mit Google und OpenAI getroffen.
Bild über Pexels
Bild über Pexels
Hoffman stellte fest, dass Reddit ohne diese Vereinbarungen keine Kontrolle oder Transparenz darüber hat, wie seine Daten verwendet werden, was sie dazu zwingt, Unternehmen zu blockieren, die nicht bereit sind, die Bedingungen zu akzeptieren, zu denen ihre Daten verwendet werden. Er machte drei Unternehmen, Microsoft, Anthropic und Perplexity, dafür verantwortlich, dass sie Verhandlungen verweigerten, und bezeichnete deren Blockade als „sehr problematisch“.
In den letzten Monaten hat Reddit seine Bemühungen verstärkt, gegen Scraper vorzugehen. Anfang Juli hat Reddit seine robots.txt-Datei aktualisiert, um nicht autorisierte Webcrawler zu blockieren. Später stellte sich heraus, dass Reddit-Inhalte nur in den Google-Suchergebnissen auftauchten und in anderen Suchmaschinen wie Bing nicht sichtbar waren.
Hoffman beschuldigte Microsoft, Reddit-Daten ohne Genehmigung zum Trainieren von KI zu verwenden, Reddit-Inhalte in Bing-Suchergebnissen zusammenzufassen und diese Daten sogar über die Bing-API an andere Suchmaschinen zu verkaufen. Er antwortete auch auf die früheren Äußerungen von Microsofts KI-Chef Mustafa Suleiman, dass öffentliche Internetdaten „freie Software“ seien, und sagte, dass Unternehmen wie Microsoft glauben, dass alle Inhalte im Internet für sie kostenlos nutzbar seien und dass dies ihre wahre Position sei.
Diese Website hat festgestellt, dass Microsoft-Suchdirektor Jody Ribas als Reaktion auf das Verschwinden der Reddit-Suchergebnisse von Bing in den sozialen Medien sagte, dass Reddit die Crawler von Bing blockiert und eine andere Suchmaschine bevorzugt habe, was sich auf Bing und die Konkurrenz der Bing-basierten Suchmaschinen ausgewirkt habe. Microsoft-Sprecherin Caitlin Lawton sagte außerdem, das Unternehmen respektiere den Wunsch von Websites, ihre Inhalte nicht in generativen KI-Modellen zu verwenden.
Hoffman nutzte SearchGPT von OpenAI als Beispiel, um die Bedeutung bezahlter Vereinbarungen hervorzuheben. Anfang des Jahres haben Reddit und OpenAI eine Vereinbarung getroffen, um SearchGPT die Anzeige von Reddit-Inhalten zu ermöglichen. Reddit-Sprecher Tim Rutschmidt sagte, dass keine der aktuellen Inhaltslizenzvereinbarungen exklusive Datennutzungsrechte beinhaltet.
Reddits Zahlungsaufforderung ähnelt der Zahlungsaufforderung traditioneller Medienverlage, die ebenfalls Einnahmen durch die Nutzung von Inhalten für generative KI erhoffen. Hoffman glaubt, dass sich der traditionelle Werteaustausch von Suchmaschinen verändert hat. Suche, Zusammenfassung und Schulung werden integriert, und das Modell, sich einfach auf das Crawlen von Inhalten im Austausch für Traffic zu verlassen, ist verschwommen.
Das obige ist der detaillierte Inhalt vonReddit-CEO: Microsoft und andere Unternehmen müssen für das Scrapen von Daten zahlen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!