Feinabstimmung spielt eine entscheidende Rolle bei der Entwicklung wertvoller KI-Tools. Dieser Prozess der Verfeinerung vorab trainierter Modelle mithilfe gezielterer Datensätze ermöglicht es Benutzern, das Verständnis des Modells für professionelle Inhalte erheblich zu verbessern, sodass Benutzer dem Modell vorgefertigtes Wissen für bestimmte Aufgaben hinzufügen können.
Dieser Prozess kann zwar einige Zeit in Anspruch nehmen, ist aber oft dreimal kostengünstiger als das Training eines Modells von Grund auf. Dieser Wert spiegelt sich in der jüngsten Ankündigung von OpenAI wider, sein Programm für benutzerdefinierte Modelle und verschiedene neue Funktionen für seine Feinabstimmungs-API zu erweitern.
OpenAI kündigte erstmals im August 2023 die Einführung der Self-Service-Feinoptimierungs-API für GPT-3 an und erhielt eine begeisterte Resonanz von der KI-Community. OpenAI berichtet, dass Tausende von Gruppen APIs genutzt haben, um Zehntausende Modelle zu trainieren, beispielsweise durch die Verwendung bestimmter Programmiersprachen, um Code zu generieren, Texte in bestimmten Formaten zusammenzufassen oder personalisierte Inhalte basierend auf dem Benutzerverhalten zu erstellen.
Seit ihrem Start im August 2023 hat die Job-Matching- und Rekrutierungsplattform Indeed erhebliche Erfolge erzielt. Um Arbeitssuchende mit relevanten Stellenangeboten zusammenzubringen, sendet Indeed personalisierte Empfehlungen an Benutzer. Durch die Feinabstimmung von GPT 3.5 Turbo, um eine genauere Erklärung des Prozesses zu erhalten und die Anzahl der Token in Warnungen um 80 % reduzieren zu können. Dadurch ist die Zahl der Nachrichten, die das Unternehmen jeden Monat an Arbeitssuchende sendet, von weniger als 1 Million auf etwa 20 Millionen gestiegen.
Neue API-Funktionen zur Feinabstimmung bauen auf diesem Erfolg auf und verbessern hoffentlich die Funktionalität für zukünftige Benutzer:
Epochenbasierte Prüfpunkterstellung: Generieren Sie automatisch in jeder Trainingsepoche einen vollständigen, fein abgestimmten Modellprüfpunkt. Dies reduziert den Bedarf für eine spätere Umschulung, insbesondere bei Überanpassung.
Comparity Playground: Eine neue parallele Playground-Benutzeroberfläche zum Vergleichen von Modellqualität und -leistung, die eine manuelle Bewertung der Ausgabe mehrerer Modelle oder die Feinabstimmung von Schnappschüssen für eine einzelne Eingabeaufforderung ermöglicht.
Drittanbieter-Integrationen: Unterstützt Integrationen mit Drittanbieter-Plattformen (beginnend mit Berechtigungen und Abweichungen), sodass Entwickler detaillierte Feinabstimmungsdaten mit dem Rest des Stacks teilen können.
Umfassende Validierungsmetriken: Möglichkeit, Metriken wie Verlust und Genauigkeit für den gesamten Validierungsdatensatz zu berechnen, um die Modellqualität besser zu verstehen.
Hyperparameter-Konfiguration: Möglichkeit, verfügbare Hyperparameter über das Dashboard zu konfigurieren (nicht nur über die API oder das SDK).
Feinabstimmung der Dashboard-Verbesserungen: einschließlich der Möglichkeit, Hyperparameter zu konfigurieren, detailliertere Trainingsmetriken anzuzeigen und Jobs aus früheren Konfigurationen erneut auszuführen.
Aufbauend auf den bisherigen Erfolgen ist OpenAI davon überzeugt, dass diese neuen Funktionen Entwicklern eine detailliertere Kontrolle über ihre Feinabstimmungsbemühungen ermöglichen werden.
OpenAI hat basierend auf der Einführung am DevDay im November 2023 auch den benutzerdefinierten Modellplan verbessert. Eine der wichtigsten Veränderungen ist das Aufkommen der unterstützten Feinabstimmung, einer Möglichkeit, wertvolle Techniken über die API-Feinabstimmung hinaus zu nutzen, wie etwa das Hinzufügen zusätzlicher Hyperparameter und verschiedener Parameter-Effektiver Feinabstimmungsmethoden (PEFT) in größerem Maßstab.
SK Telecom ist ein Beispiel dafür, wie das volle Potenzial dieses Dienstes ausgeschöpft wird. Der Telekommunikationsbetreiber hat mehr als 30 Millionen Nutzer in Südkorea und wollte daher ein Modell der künstlichen Intelligenz anpassen, das als Telekommunikations-Kundendienstexperte fungieren kann.
Durch die Feinabstimmung von GPT-4 in Zusammenarbeit mit OpenAI, um sich auf Konversationen im Zusammenhang mit der koreanischen Telekommunikation zu konzentrieren, verbesserte sich die Qualität der Konversationszusammenfassung von SK Telecom um 35 % und die Genauigkeit der Absichtserkennung stieg um 33 %. Beim Vergleich ihres neuen, fein abgestimmten Modells mit dem verallgemeinerten GPT-4 verbesserte sich ihr Zufriedenheitswert ebenfalls von 3,6 auf 4,5 von 5.
OpenAI bietet außerdem die Möglichkeit, benutzerdefinierte Modelle für Unternehmen zu erstellen, die eine tiefgreifende Feinabstimmung domänenspezifischer Wissensmodelle benötigen. Eine Partnerschaft mit dem juristischen KI-Unternehmen Harvey zeigt den Wert dieser Funktion. Juristische Arbeiten erfordern viele leseintensive Dokumente, und Harvey wollte LLMs (Large Language Models) verwenden, um Informationen aus diesen Dokumenten zu synthetisieren und sie Anwälten zur Überprüfung vorzulegen. Viele Gesetze sind jedoch komplex und kontextabhängig, und Harvey hofft, mit OpenAI zusammenarbeiten zu können, um ein individuell trainiertes Modell zu erstellen, das neue Erkenntnisse und Argumentationsmethoden in das Basismodell integrieren kann.
Harvey hat sich mit OpenAI zusammengetan und das Äquivalent von 10 Milliarden Daten-Tokens hinzugefügt, um dieses Fallrechtsmodell individuell zu trainieren. Durch die Hinzufügung der für fundierte rechtliche Urteile erforderlichen kontextuellen Tiefe verbesserte das resultierende Modell die sachlichen Antworten um 83 %.
KI-Tools sind niemals eine „Allheilmittel“-Lösung. Die Anpassbarkeit ist der Kern des Nutzens dieser Technologie, und die Arbeit von OpenAI bei der Feinabstimmung und Anpassung von Trainingsmodellen wird dazu beitragen, die Organisationen, die bereits von dem Tool profitieren, zu erweitern.
Das obige ist der detaillierte Inhalt vonOpenAI bietet neue Feinabstimmungs- und Anpassungsmöglichkeiten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!