


OpenAI bietet neue Feinabstimmungs- und Anpassungsmöglichkeiten
Feinabstimmung spielt eine entscheidende Rolle bei der Entwicklung wertvoller KI-Tools. Dieser Prozess der Verfeinerung vorab trainierter Modelle mithilfe gezielterer Datensätze ermöglicht es Benutzern, das Verständnis des Modells für professionelle Inhalte erheblich zu verbessern, sodass Benutzer dem Modell vorgefertigtes Wissen für bestimmte Aufgaben hinzufügen können.
Dieser Prozess kann zwar einige Zeit in Anspruch nehmen, ist aber oft dreimal kostengünstiger als das Training eines Modells von Grund auf. Dieser Wert spiegelt sich in der jüngsten Ankündigung von OpenAI wider, sein Programm für benutzerdefinierte Modelle und verschiedene neue Funktionen für seine Feinabstimmungs-API zu erweitern.
Neue Funktionen der Self-Service-Feinoptimierungs-API
OpenAI kündigte erstmals im August 2023 die Einführung der Self-Service-Feinoptimierungs-API für GPT-3 an und erhielt eine begeisterte Resonanz von der KI-Community. OpenAI berichtet, dass Tausende von Gruppen APIs genutzt haben, um Zehntausende Modelle zu trainieren, beispielsweise durch die Verwendung bestimmter Programmiersprachen, um Code zu generieren, Texte in bestimmten Formaten zusammenzufassen oder personalisierte Inhalte basierend auf dem Benutzerverhalten zu erstellen.
Seit ihrem Start im August 2023 hat die Job-Matching- und Rekrutierungsplattform Indeed erhebliche Erfolge erzielt. Um Arbeitssuchende mit relevanten Stellenangeboten zusammenzubringen, sendet Indeed personalisierte Empfehlungen an Benutzer. Durch die Feinabstimmung von GPT 3.5 Turbo, um eine genauere Erklärung des Prozesses zu erhalten und die Anzahl der Token in Warnungen um 80 % reduzieren zu können. Dadurch ist die Zahl der Nachrichten, die das Unternehmen jeden Monat an Arbeitssuchende sendet, von weniger als 1 Million auf etwa 20 Millionen gestiegen.
Neue API-Funktionen zur Feinabstimmung bauen auf diesem Erfolg auf und verbessern hoffentlich die Funktionalität für zukünftige Benutzer:
Epochenbasierte Prüfpunkterstellung: Generieren Sie automatisch in jeder Trainingsepoche einen vollständigen, fein abgestimmten Modellprüfpunkt. Dies reduziert den Bedarf für eine spätere Umschulung, insbesondere bei Überanpassung.
Comparity Playground: Eine neue parallele Playground-Benutzeroberfläche zum Vergleichen von Modellqualität und -leistung, die eine manuelle Bewertung der Ausgabe mehrerer Modelle oder die Feinabstimmung von Schnappschüssen für eine einzelne Eingabeaufforderung ermöglicht.
Drittanbieter-Integrationen: Unterstützt Integrationen mit Drittanbieter-Plattformen (beginnend mit Berechtigungen und Abweichungen), sodass Entwickler detaillierte Feinabstimmungsdaten mit dem Rest des Stacks teilen können.
Umfassende Validierungsmetriken: Möglichkeit, Metriken wie Verlust und Genauigkeit für den gesamten Validierungsdatensatz zu berechnen, um die Modellqualität besser zu verstehen.
Hyperparameter-Konfiguration: Möglichkeit, verfügbare Hyperparameter über das Dashboard zu konfigurieren (nicht nur über die API oder das SDK).
Feinabstimmung der Dashboard-Verbesserungen: einschließlich der Möglichkeit, Hyperparameter zu konfigurieren, detailliertere Trainingsmetriken anzuzeigen und Jobs aus früheren Konfigurationen erneut auszuführen.
Aufbauend auf den bisherigen Erfolgen ist OpenAI davon überzeugt, dass diese neuen Funktionen Entwicklern eine detailliertere Kontrolle über ihre Feinabstimmungsbemühungen ermöglichen werden.
Unterstützte Feinabstimmung und benutzerdefinierte Trainingsmodelle
OpenAI hat basierend auf der Einführung am DevDay im November 2023 auch den benutzerdefinierten Modellplan verbessert. Eine der wichtigsten Veränderungen ist das Aufkommen der unterstützten Feinabstimmung, einer Möglichkeit, wertvolle Techniken über die API-Feinabstimmung hinaus zu nutzen, wie etwa das Hinzufügen zusätzlicher Hyperparameter und verschiedener Parameter-Effektiver Feinabstimmungsmethoden (PEFT) in größerem Maßstab.
SK Telecom ist ein Beispiel dafür, wie das volle Potenzial dieses Dienstes ausgeschöpft wird. Der Telekommunikationsbetreiber hat mehr als 30 Millionen Nutzer in Südkorea und wollte daher ein Modell der künstlichen Intelligenz anpassen, das als Telekommunikations-Kundendienstexperte fungieren kann.
Durch die Feinabstimmung von GPT-4 in Zusammenarbeit mit OpenAI, um sich auf Konversationen im Zusammenhang mit der koreanischen Telekommunikation zu konzentrieren, verbesserte sich die Qualität der Konversationszusammenfassung von SK Telecom um 35 % und die Genauigkeit der Absichtserkennung stieg um 33 %. Beim Vergleich ihres neuen, fein abgestimmten Modells mit dem verallgemeinerten GPT-4 verbesserte sich ihr Zufriedenheitswert ebenfalls von 3,6 auf 4,5 von 5.
OpenAI bietet außerdem die Möglichkeit, benutzerdefinierte Modelle für Unternehmen zu erstellen, die eine tiefgreifende Feinabstimmung domänenspezifischer Wissensmodelle benötigen. Eine Partnerschaft mit dem juristischen KI-Unternehmen Harvey zeigt den Wert dieser Funktion. Juristische Arbeiten erfordern viele leseintensive Dokumente, und Harvey wollte LLMs (Large Language Models) verwenden, um Informationen aus diesen Dokumenten zu synthetisieren und sie Anwälten zur Überprüfung vorzulegen. Viele Gesetze sind jedoch komplex und kontextabhängig, und Harvey hofft, mit OpenAI zusammenarbeiten zu können, um ein individuell trainiertes Modell zu erstellen, das neue Erkenntnisse und Argumentationsmethoden in das Basismodell integrieren kann.
Harvey hat sich mit OpenAI zusammengetan und das Äquivalent von 10 Milliarden Daten-Tokens hinzugefügt, um dieses Fallrechtsmodell individuell zu trainieren. Durch die Hinzufügung der für fundierte rechtliche Urteile erforderlichen kontextuellen Tiefe verbesserte das resultierende Modell die sachlichen Antworten um 83 %.
KI-Tools sind niemals eine „Allheilmittel“-Lösung. Die Anpassbarkeit ist der Kern des Nutzens dieser Technologie, und die Arbeit von OpenAI bei der Feinabstimmung und Anpassung von Trainingsmodellen wird dazu beitragen, die Organisationen, die bereits von dem Tool profitieren, zu erweitern.
Das obige ist der detaillierte Inhalt vonOpenAI bietet neue Feinabstimmungs- und Anpassungsmöglichkeiten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Diese Seite berichtete am 27. Juni, dass Jianying eine von FaceMeng Technology, einer Tochtergesellschaft von ByteDance, entwickelte Videobearbeitungssoftware ist, die auf der Douyin-Plattform basiert und grundsätzlich kurze Videoinhalte für Benutzer der Plattform produziert Windows, MacOS und andere Betriebssysteme. Jianying kündigte offiziell die Aktualisierung seines Mitgliedschaftssystems an und führte ein neues SVIP ein, das eine Vielzahl von KI-Schwarztechnologien umfasst, wie z. B. intelligente Übersetzung, intelligente Hervorhebung, intelligente Verpackung, digitale menschliche Synthese usw. Preislich beträgt die monatliche Gebühr für das Clipping von SVIP 79 Yuan, die Jahresgebühr 599 Yuan (Hinweis auf dieser Website: entspricht 49,9 Yuan pro Monat), das fortlaufende Monatsabonnement beträgt 59 Yuan pro Monat und das fortlaufende Jahresabonnement beträgt 499 Yuan pro Jahr (entspricht 41,6 Yuan pro Monat). Darüber hinaus erklärte der Cut-Beamte auch, dass diejenigen, die den ursprünglichen VIP abonniert haben, das Benutzererlebnis verbessern sollen

Verbessern Sie die Produktivität, Effizienz und Genauigkeit der Entwickler, indem Sie eine abrufgestützte Generierung und ein semantisches Gedächtnis in KI-Codierungsassistenten integrieren. Übersetzt aus EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, Autor JanakiramMSV. Obwohl grundlegende KI-Programmierassistenten natürlich hilfreich sind, können sie oft nicht die relevantesten und korrektesten Codevorschläge liefern, da sie auf einem allgemeinen Verständnis der Softwaresprache und den gängigsten Mustern beim Schreiben von Software basieren. Der von diesen Coding-Assistenten generierte Code eignet sich zur Lösung der von ihnen zu lösenden Probleme, entspricht jedoch häufig nicht den Coding-Standards, -Konventionen und -Stilen der einzelnen Teams. Dabei entstehen häufig Vorschläge, die geändert oder verfeinert werden müssen, damit der Code in die Anwendung übernommen wird

Large Language Models (LLMs) werden auf riesigen Textdatenbanken trainiert und erwerben dort große Mengen an realem Wissen. Dieses Wissen wird in ihre Parameter eingebettet und kann dann bei Bedarf genutzt werden. Das Wissen über diese Modelle wird am Ende der Ausbildung „verdinglicht“. Am Ende des Vortrainings hört das Modell tatsächlich auf zu lernen. Richten Sie das Modell aus oder verfeinern Sie es, um zu erfahren, wie Sie dieses Wissen nutzen und natürlicher auf Benutzerfragen reagieren können. Aber manchmal reicht Modellwissen nicht aus, und obwohl das Modell über RAG auf externe Inhalte zugreifen kann, wird es als vorteilhaft angesehen, das Modell durch Feinabstimmung an neue Domänen anzupassen. Diese Feinabstimmung erfolgt mithilfe von Eingaben menschlicher Annotatoren oder anderer LLM-Kreationen, wobei das Modell auf zusätzliches Wissen aus der realen Welt trifft und dieses integriert

Wenn die Antwort des KI-Modells überhaupt unverständlich ist, würden Sie es wagen, sie zu verwenden? Da maschinelle Lernsysteme in immer wichtigeren Bereichen eingesetzt werden, wird es immer wichtiger zu zeigen, warum wir ihren Ergebnissen vertrauen können und wann wir ihnen nicht vertrauen sollten. Eine Möglichkeit, Vertrauen in die Ausgabe eines komplexen Systems zu gewinnen, besteht darin, vom System zu verlangen, dass es eine Interpretation seiner Ausgabe erstellt, die für einen Menschen oder ein anderes vertrauenswürdiges System lesbar ist, d. h. so vollständig verständlich, dass mögliche Fehler erkannt werden können gefunden. Um beispielsweise Vertrauen in das Justizsystem aufzubauen, verlangen wir von den Gerichten, dass sie klare und lesbare schriftliche Stellungnahmen abgeben, die ihre Entscheidungen erläutern und stützen. Für große Sprachmodelle können wir auch einen ähnlichen Ansatz verfolgen. Stellen Sie bei diesem Ansatz jedoch sicher, dass das Sprachmodell generiert wird

Herausgeber | Der Frage-Antwort-Datensatz (QA) von ScienceAI spielt eine entscheidende Rolle bei der Förderung der Forschung zur Verarbeitung natürlicher Sprache (NLP). Hochwertige QS-Datensätze können nicht nur zur Feinabstimmung von Modellen verwendet werden, sondern auch effektiv die Fähigkeiten großer Sprachmodelle (LLMs) bewerten, insbesondere die Fähigkeit, wissenschaftliche Erkenntnisse zu verstehen und zu begründen. Obwohl es derzeit viele wissenschaftliche QS-Datensätze aus den Bereichen Medizin, Chemie, Biologie und anderen Bereichen gibt, weisen diese Datensätze immer noch einige Mängel auf. Erstens ist das Datenformular relativ einfach, die meisten davon sind Multiple-Choice-Fragen. Sie sind leicht auszuwerten, schränken jedoch den Antwortauswahlbereich des Modells ein und können die Fähigkeit des Modells zur Beantwortung wissenschaftlicher Fragen nicht vollständig testen. Im Gegensatz dazu offene Fragen und Antworten

Herausgeber |. KX Im Bereich der Arzneimittelforschung und -entwicklung ist die genaue und effektive Vorhersage der Bindungsaffinität von Proteinen und Liganden für das Arzneimittelscreening und die Arzneimitteloptimierung von entscheidender Bedeutung. Aktuelle Studien berücksichtigen jedoch nicht die wichtige Rolle molekularer Oberflächeninformationen bei Protein-Ligand-Wechselwirkungen. Auf dieser Grundlage schlugen Forscher der Universität Xiamen ein neuartiges Framework zur multimodalen Merkmalsextraktion (MFE) vor, das erstmals Informationen über Proteinoberfläche, 3D-Struktur und -Sequenz kombiniert und einen Kreuzaufmerksamkeitsmechanismus verwendet, um verschiedene Modalitäten zu vergleichen Ausrichtung. Experimentelle Ergebnisse zeigen, dass diese Methode bei der Vorhersage von Protein-Ligand-Bindungsaffinitäten Spitzenleistungen erbringt. Darüber hinaus belegen Ablationsstudien die Wirksamkeit und Notwendigkeit der Proteinoberflächeninformation und der multimodalen Merkmalsausrichtung innerhalb dieses Rahmens. Verwandte Forschungen beginnen mit „S

Laut Nachrichten dieser Website vom 5. Juli veröffentlichte GlobalFoundries am 1. Juli dieses Jahres eine Pressemitteilung, in der die Übernahme der Power-Galliumnitrid (GaN)-Technologie und des Portfolios an geistigem Eigentum von Tagore Technology angekündigt wurde, in der Hoffnung, seinen Marktanteil in den Bereichen Automobile und Internet auszubauen Anwendungsbereiche für Rechenzentren mit künstlicher Intelligenz, um höhere Effizienz und bessere Leistung zu erforschen. Da sich Technologien wie generative künstliche Intelligenz (GenerativeAI) in der digitalen Welt weiterentwickeln, ist Galliumnitrid (GaN) zu einer Schlüssellösung für nachhaltiges und effizientes Energiemanagement, insbesondere in Rechenzentren, geworden. Auf dieser Website wurde die offizielle Ankündigung zitiert, dass sich das Ingenieurteam von Tagore Technology im Rahmen dieser Übernahme mit GF zusammenschließen wird, um die Galliumnitrid-Technologie weiterzuentwickeln. G

Laut Nachrichten dieser Website vom 1. August hat SK Hynix heute (1. August) einen Blogbeitrag veröffentlicht, in dem es ankündigt, dass es am Global Semiconductor Memory Summit FMS2024 teilnehmen wird, der vom 6. bis 8. August in Santa Clara, Kalifornien, USA, stattfindet viele neue Technologien Generation Produkt. Einführung des Future Memory and Storage Summit (FutureMemoryandStorage), früher Flash Memory Summit (FlashMemorySummit), hauptsächlich für NAND-Anbieter, im Zusammenhang mit der zunehmenden Aufmerksamkeit für die Technologie der künstlichen Intelligenz wurde dieses Jahr in Future Memory and Storage Summit (FutureMemoryandStorage) umbenannt Laden Sie DRAM- und Speicheranbieter und viele weitere Akteure ein. Neues Produkt SK Hynix wurde letztes Jahr auf den Markt gebracht
