Diese Seite berichtete am 10. November, dass OpenAI mit Organisationen zusammenarbeiten wird, um öffentliche/private Datensätze für das Training von KI-Modellen zu generieren. Die Datenpartnerschaft zielt darauf ab, „mehr Organisationen in die Lage zu versetzen, die Zukunft der KI zu steuern“. und „von nützlicheren Modellen profitieren“.
Diese Seite erfuhr aus einem Blog, dass OpenAI sagte: „Um KI letztendlich sicherer zu machen und der gesamten Menschheit zugute zu kommen, hoffen wir, dass KI-Modelle alle Themen, Branchen, Kulturen und Sprachen tiefgreifend verstehen können, was ein möglichst breites Spektrum an Trainingsdatenerfassung erfordert.“ .“
Im Rahmen des Datenpartnerschaftsprogramms sagt OpenAI, dass es „groß angelegte“ Datensätze sammeln wird, die „die menschliche Gesellschaft widerspiegeln“ und derzeit online nicht leicht zugänglich sind. Während das Unternehmen plant, mit mehreren Modalitäten zu arbeiten, einschließlich Bildern, Audio und Video, sucht es insbesondere nach Daten , die „menschliche Absichten zum Ausdruck bringen“ (z. B. langes Schreiben oder Konversation) in verschiedenen Sprachen, Themen und Formaten.
OpenAI sagt, dass es mit Organisationen zusammenarbeiten wird, indem es eine Kombination aus optischen Zeichenerkennungs- und automatischen Spracherkennungstools verwendet, um Trainingsdaten zu digitalisieren und bei Bedarf sensible oder persönliche Informationen zu entfernen.
OpenAI hofft, zwei Arten von Datensätzen zu erstellen: einen öffentlichen Open-Source-Datensatz, der von jedem zum Trainieren von KI-Modellen verwendet werden kann, und einen Satz privater Datensätze , der zum Trainieren proprietärer KI-Modelle verwendet werden kann.
OpenAI sagt, dass der private Satz für Organisationen gedacht ist, die ihre Daten privat halten möchten, aber möchten, dass die Modelle von OpenAI ihre Domäne besser verstehen. OpenAI hat bisher mit der isländischen Regierung und Miðeind ehf zusammengearbeitet, um die Fähigkeiten von GPT-4 für isländische Sprecher zu verbessern. und arbeitet mit dem Liberty Legal Project zusammen, um das Verständnis seines Modells für Rechtsdokumente zu verbessern.
Das obige ist der detaillierte Inhalt vonOpenAI sucht Partner, um Datensätze für das Training von KI-Modellen zu generieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!