Laut Nachrichten vom 19. April haben Microsoft, Google und OpenAI Benutzerchatdaten in Reddit-Foren verwendet, um neue Systeme für künstliche Intelligenz zu entwickeln. Nun plant Reddit, von diesen Unternehmen Lizenzgebühren zu verlangen.
Reddit war schon immer eine Drehscheibe für die Diskussion aktueller Themen im Internet. Täglich besuchen etwa 57 Millionen Menschen die Website, um über eine Vielzahl von Themen zu diskutieren, darunter Make-up-Tipps, Videospiele und automatische Autowaschanlagen.
In den letzten Jahren sind Chats in Reddit-Foren zu kostenlosen Schulungstools für Unternehmen wie Google, OpenAI und Microsoft zur Entwicklung künstlicher Intelligenzsysteme geworden. Mittlerweile glauben viele in der Branche, dass diese künstlichen Intelligenzsysteme das nächste große Ding in der Technologiebranche sein werden.
Reddit plant daher, Unternehmen zu belasten, die Technologien für künstliche Intelligenz entwickeln. Viele Unternehmen laden Forum-Chats über Anwendungsprogrammierschnittstellen (APIs) herunter und verarbeiten sie. Am Dienstag gab Reddit bekannt, dass es plant, Unternehmen für die Nutzung seiner API Gebühren in Rechnung zu stellen.
Reddit-Gründer und CEO Steve Huffman sagte in einem Interview: „Die Datenbank von Reddit ist in der Tat wertvoll, und wir müssen diesen Wert nicht kostenlos den größten Unternehmen der Welt zur Verfügung stellen.“
Der Schritt von Reddit ist das erste Mal, dass a Das soziale Netzwerk hat OpenAI und andere ausdrücklich für den offenen Zugang zur Entwicklung künstlicher Intelligenzsysteme wie ChatGPT verantwortlich gemacht. Neue KI-Systeme wie ChatGPT könnten eines Tages ein großes Geschäft werden, aber sie werden Unternehmen wie Reddit nicht viel helfen. Im Gegenteil: Diese künstlichen Intelligenzsysteme können auch automatisch Chat-Inhalte generieren und zu Konkurrenten von Reddit werden.
Reddit bereitet sich auf einen möglichen Börsengang in diesem Jahr vor. Das Unternehmen wurde 2005 gegründet und setzt derzeit hauptsächlich auf Plattformwerbung und E-Commerce-Transaktionen, um Gewinne zu erzielen. Reddit sagte, dass man die Abrechnungsdetails der API-Schnittstelle finalisiert und den Preis in den nächsten Wochen bekannt geben wird.
Heutzutage sind groß angelegte Sprachmodelle zu einem wichtigen Bestandteil der Entwicklung neuer Technologien für künstliche Intelligenz geworden, und auch Benutzer-Chat-Inhalte in Reddit-Foren sind zu einem wertvollen Gut geworden.
Einer der zugrunde liegenden Algorithmen von Bard, dem Chatbot für künstliche Intelligenz von Google, wurde mithilfe von Reddit-Chatdaten trainiert. Gleichzeitig verwendet ChatGPT von OpenAI auch Reddit-Daten als eine der Informationen für das Training großer Sprachmodelle.
Darüber hinaus beginnen auch andere Unternehmen den Wert der auf der Plattform gespeicherten Chatinhalte und Bilder zu erkennen. Der Bildhosting-Dienst Shutterstock hat Bilddaten an OpenAI verkauft, was zur Entwicklung von DALL-E beigetragen hat, einem künstlichen Intelligenzsystem, das Bilder auf der Grundlage einfacher Texteingaben generieren kann.
Derzeit nutzen Tausende von Unternehmen und Entwicklern, ob groß oder klein, APIs, um Millionen von Chats auf der Twitter-Plattform zu verfolgen. Letzten Monat sagte Elon Musk, der Besitzer der persönlichen Social-Media-Plattform Twitter, dass er die derzeitige Art der Nutzung der Twitter-API ändern würde und für die Nutzung der API Gebühren in Höhe von Zehntausenden bis Hunderttausenden erhebt. Als Grund für die Änderung nannte Musk jedoch keine großen Sprachmodelle.
Um Modelle kontinuierlich zu verbessern, benötigen Unternehmen der künstlichen Intelligenz zwei wichtige Faktoren: leistungsstarke Rechenleistung und eine große Menge an verfügbaren Daten. Einige große Entwicklungsunternehmen für künstliche Intelligenz verfügen in der Regel über genügend Rechenleistung, suchen aber dennoch im Internet nach den Daten, die sie zur Verbesserung ihrer Algorithmen benötigen. Dazu gehören Ressourcen wie Wikipedia, verschiedene digitalisierte Bücher, wissenschaftliche Artikel und Chats in Reddit-Foren.
Unternehmen wie Google, OpenAI und Microsoft haben noch nicht auf den Gebührenplan von Reddit reagiert.
Reddit steht seit langem in einer co-abhängigen Beziehung zu Suchmaschinen wie Google und Bing. Sie beziehen automatisch Reddit-Seiteninformationen, indizieren sie und zeigen dann relevante Informationen auf den Suchergebnisseiten an. Obwohl diese automatische Crawling-Methode möglicherweise nicht bei allen Websites beliebt ist, kann Reddit in den Suchergebnissen einen hohen Rang einnehmen.
Groß angelegte Sprachmodelle sind völlig anders. Sie müssen so viele Daten wie möglich erhalten, damit neue Systeme der künstlichen Intelligenz erstellt werden können.
Reddit glaubt, dass seine Forendaten besonders wertvoll sind, weil sie ständig aktualisiert werden. Diese Art von Frische und Relevanz ist genau das, was große Sprachmodellalgorithmen benötigen, um die besten Ergebnisse zu erzielen, sagte Huffman.
„Reddit ist ein besserer Ort zum Chatten als irgendwo anders im Internet“, sagt Huffman. „Es gibt viele Dinge auf der Website, die man nur privat oder gar nicht sagen würde.“
Hoffman betonte auch, dass die API für Anwendungsentwickler, die Anwendungen erstellen möchten, die den Menschen bei der Nutzung von Reddit helfen, immer noch kostenlos ist. Entwickler können beispielsweise Tools wie APIs kostenlos nutzen, um Roboter zu entwickeln, die automatisch verfolgen, ob Benutzerkommentare den Regeln für die Veröffentlichung von Inhalten entsprechen. Auch Personen, die Reddit-Daten für akademische Forschung oder nichtkommerzielle Zwecke studieren, haben weiterhin freien Zugang zu den Daten.
Reddit hofft auch, mehr maschinelles Lernen in den Forenbetrieb zu integrieren. Beispielsweise kann Reddit maschinelles Lernen nutzen, um die Verwendung von durch künstliche Intelligenz generierten Texten auf der Plattform zu erkennen und Labels hinzuzufügen, um Benutzer darüber zu informieren, welche Kommentare von Robotern stammen. Reddit versprach außerdem, die Softwaretools für Forummoderatoren zu verbessern, um ihnen bei der Überwachung von Bots von Drittanbietern in ihren Foren zu helfen.
Aber für KI-Macher ist Reddit der Meinung, dass es an der Zeit ist, zu zahlen.
„Es ist unser eigenes Problem, Mehrwert zu schaffen, indem wir die Daten von Reddit löschen, aber unseren Benutzern keine Entschädigung gewähren“, sagte Huffman. „Jetzt ist ein guter Zeitpunkt für uns, das Management zu stärken.“ (Chenchen)
Das obige ist der detaillierte Inhalt vonReddit bezahlt Unternehmen wie OpenAI, um die unangemessene Nutzung von Benutzerchats zu verhindern. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!