Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten-KI-php.cn

Inhaltsverzeichnis

6 tolle Tipps gibt es hier

Strategie 1: Klare Anweisungen schreiben

Strategie 2: Referenztext bereitstellen

Strategie 3: Komplexe Aufgaben aufteilen

Strategie 4: Geben Sie GPT Zeit zum „Nachdenken“

Strategie 5: Unterstützung durch andere Tools

Strategie Sechs: Änderungen systematisch testen

Heim

Technologie-Peripheriegeräte

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 14, 2023 am 08:35 AM

gpt-4 开发

Das offizielle GPT-4-Benutzerhandbuch ist jetzt verfügbar!

Du hast richtig gehört, dieses Mal musst du dir keine Notizen machen, OpenAI hat persönlich eines für dich organisiert.

Es wird gesagt, dass die 6-monatige Nutzungserfahrung aller zusammengetragen wurde und die Tipps und Tricks von Ihnen, mir und ihm alle darin integriert sind.

Obwohl es zusammenfassend nur sechs Hauptstrategien gibt, sollten die Details nicht vage sein.

Nicht nur normale GPT-4-Benutzer können in diesem Cheatbook Tipps und Tricks erhalten, sondern vielleicht finden auch Anwendungsentwickler Inspiration.

Netizens kommentierten nacheinander und gaben ihre eigenen „Reflexionen nach dem Lesen“:

So interessant! Zusammenfassend umfassen die Kernideen dieser Techniken zwei Hauptpunkte. Zuerst müssen wir konkreter schreiben und einige detaillierte Tipps geben. Zweitens können wir diese komplexen Aufgaben in kleine Eingabeaufforderungen aufteilen, die erledigt werden müssen.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

OpenAI gab an, dass dieser Leitfaden derzeit nur für GPT-4 gilt. (Können Sie es natürlich auch auf anderen GPT-Modellen ausprobieren?)

Beeilen Sie sich und sehen Sie, was für gute Dinge in diesem geheimen Buch stecken.

6 tolle Tipps gibt es hier

Strategie 1: Klare Anweisungen schreiben

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Du musst wissen, dass das Model nicht „Gedanken lesen“ kann, also musst du deine Anforderungen klar formulieren.

Wenn die Modellausgabe zu wortreich wird, können Sie sie um eine prägnante und klare Antwort bitten. Wenn die Ausgabe hingegen zu einfach ist, können Sie ohne Umschweife verlangen, dass sie auf professionellem Niveau geschrieben wird.

Wenn Sie mit dem Format der GPT-Ausgabe nicht zufrieden sind, zeigen Sie ihm zuerst das erwartete Format und bitten Sie es, es auf die gleiche Weise auszugeben.

Kurz gesagt: Versuchen Sie, das GPT-Modell nicht von selbst erraten zu lassen, damit die Ergebnisse, die Sie erhalten, eher Ihren Erwartungen entsprechen.

Praktische Tipps:

1. Nur mit Details erhalten Sie relevantere Antworten

Um eine starke Korrelation zwischen Ausgabe und Eingabe zu gewährleisten, können alle wichtigen Detailinformationen in das Modell eingespeist werden.

Wenn Sie beispielsweise möchten, dass GPT-4: das Besprechungsprotokoll zusammenfasst

, können Sie dem Ausdruck so viele Details wie möglich hinzufügen:

Zusammenfassen des Besprechungsprotokolls in einem Textabsatz. Schreiben Sie dann eine Markdown-Liste, in der die Teilnehmer und ihre wichtigsten Punkte aufgeführt sind. Wenn die Teilnehmer schließlich Vorschläge für die nächsten Schritte haben, listen Sie diese auf.

2. Bitten Sie das Model, eine bestimmte Rolle zu spielen

Durch die Änderung der Systemnachricht wird GPT-4 leichter eine bestimmte Rolle spielen und diese ernster nehmen, als in einem Gespräch danach zu fragen.

Wenn angegeben ist, auf eine Datei zu antworten, muss jeder Absatz in der Datei interessante Kommentare enthalten:

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

3. Verwenden Sie Trennzeichen, um verschiedene Teile der Eingabe deutlich zu kennzeichnen.

Verwenden Sie „“-Trennzeichen, z B. als „dreifache Anführungszeichen“, und Abschnittstitel kennzeichnen unterschiedliche Teile des Textes, sodass das Modell ihn leichter unterschiedlich verarbeiten kann. Bei komplexen Aufgaben ist dieses Markierungsdetail besonders wichtig.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

4. Geben Sie klar an, welche Schritte zur Erledigung der Aufgabe erforderlich sind.

Manche Aufgaben sind effektiver, wenn sie Schritt für Schritt erledigt werden. Daher ist es besser, eine Reihe von Schritten klar zu spezifizieren, damit das Modell ihnen leichter folgen und die gewünschten Ergebnisse ausgeben kann. Legen Sie beispielsweise die Antwortschritte in der Systemnachricht fest.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

5. Geben Sie Beispiele an

Wenn Sie möchten, dass die Modellausgabe einem bestimmten Stil folgt, der nicht gut beschrieben ist, können Sie Beispiele bereitstellen. Nachdem Sie beispielsweise ein Beispiel bereitgestellt haben, müssen Sie ihm nur sagen: „Bring mir Geduld bei“, und es wird es entsprechend dem Stil des Beispiels anschaulich beschreiben.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

6. Geben Sie die erforderliche Ausgabelänge an

Sie können das Modell auch bitten, gezielt zu generieren, wie viele Wörter, Sätze, Absätze, Aufzählungszeichen usw. Wenn das Modell jedoch aufgefordert wird, eine bestimmte Anzahl von Wörtern/Zeichen zu generieren, ist es möglicherweise nicht so genau.

Strategie 2: Referenztext bereitstellen

Wenn es um esoterische Themen, Zitate, URLs usw. geht, kann es sein, dass das GPT-Modell ernsthaft Unsinn redet.

Stellen Sie Referenztext für GPT-4 bereit, der das Auftreten fiktiver Antworten reduzieren und den Inhalt der Antworten zuverlässiger machen kann.

Praktische Tipps:

1. Lassen Sie das Modell anhand von Referenzmaterialien antworten.

Wenn wir dem Modell einige glaubwürdige Informationen zu der Frage liefern können, können wir es anweisen, die bereitgestellten Informationen zur Organisation zu verwenden die Antwort.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

2. Lassen Sie das Modell Referenzmaterialien zitieren, um zu antworten

Wenn die relevanten Informationen in der obigen Dialogeingabe ergänzt wurden, können wir das Modell auch direkt bitten, die bereitgestellten Informationen in der Antwort zu zitieren .

Hier ist zu beachten, dass das Modell so programmiert werden kann, dass es die in der Ausgabe referenzierten Teile überprüft.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Strategie 3: Komplexe Aufgaben aufteilen

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Im Gegensatz dazu weist GPT-4 eine höhere Fehlerquote bei der Bearbeitung komplexer Aufgaben auf.

Wir können jedoch eine clevere Strategie anwenden, um diese komplexen Aufgaben in einen Arbeitsablauf mit einer Reihe einfacher Aufgaben umzuwandeln.

Auf diese Weise kann die Ausgabe der vorherigen Aufgabe verwendet werden, um die Eingabe der nachfolgenden Aufgabe zu konstruieren.

Genau wie die Zerlegung eines komplexen Systems in eine Reihe modularer Komponenten in der Softwareentwicklung kann auch die Zerlegung einer Aufgabe in mehrere Module zu einer besseren Leistung des Modells führen.

Praktische Tipps:

1. Absichten klassifizieren

Für eine große Anzahl unabhängiger Aufgaben, die unterschiedliche Situationen bewältigen müssen, können Sie diese Aufgaben zunächst klassifizieren.

Ermitteln Sie dann anhand der Klassifizierung die erforderlichen Anweisungen.

Für eine Kundendienstanwendung können beispielsweise Anfragen kategorisiert werden (Abrechnung, technischer Support, Kontoverwaltung, allgemeine Anfragen usw.).

Wenn ein Benutzer fragt:

Ich muss mein Internet wieder zum Laufen bringen.

Entsprechend der Klassifizierung der Benutzeranfragen können die spezifischen Anforderungen des Benutzers gesperrt werden und GPT-4 kann für den nächsten Schritt spezifischere Anweisungen bereitgestellt werden.

Angenommen, ein Benutzer benötigt Hilfe bei der „Fehlerbehebung“.

Sie können den nächsten Schritt festlegen:

Bitten Sie den Benutzer zu überprüfen, ob alle Kabel zum Router angeschlossen sind ...

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

2. Frühere Gespräche zusammenfassen oder filtern

Aufgrund von GPT - Das Dialogfenster von 4 ist begrenzt. Der Kontext darf nicht zu lang sein und kann nicht unbegrenzt in einem Dialogfenster fortgesetzt werden.

Aber es gibt keine Lösung.

Eine Möglichkeit, dies zu tun, besteht darin, frühere Gespräche zusammenzufassen. Sobald die Länge des Eingabetextes einen vorgegebenen Schwellenwert erreicht, kann eine Abfrage ausgelöst werden, die einen Teil der Konversation zusammenfasst, und der zusammengefasste Teil kann Teil der Systemnachricht werden.

Zusätzlich können frühere Gespräche direkt im Hintergrund während des Gesprächs zusammengefasst werden.

Ein anderer Ansatz besteht darin, frühere Gespräche abzurufen und dabei eine einbettungsbasierte Suche für einen effizienten Wissensabruf zu verwenden.

3. Fassen Sie lange Dokumente Absatz für Absatz zusammen und erstellen Sie rekursiv eine vollständige Zusammenfassung.

Das Problem ist, dass der Text zu lang ist.

Wenn Sie beispielsweise möchten, dass GPT-4 ein Buch zusammenfasst, können Sie eine Reihe von Abfragen verwenden, um jeden Teil des Buchs zusammenzufassen.

Verknüpfen Sie dann die Teilübersichten, um sie zusammenzufassen und eine allgemeine Antwort zu bilden.

Dieser Vorgang kann rekursiv durchgeführt werden, bis das gesamte Buch zusammengefasst ist.

Aber einige Teile müssen möglicherweise Informationen aus dem vorherigen Teil übernehmen, um die nachfolgenden Teile zu verstehen. Hier ist ein Trick:

Wenn Sie den aktuellen Inhalt zusammenfassen, fassen Sie den Inhalt vor dem aktuellen Inhalt im Text zusammen, um eine Zusammenfassung zu erstellen.

Einfach ausgedrückt: Verwenden Sie die „Zusammenfassung“ des vorherigen Abschnitts + des aktuellen Abschnitts und fassen Sie dann zusammen.

OpenAI hat zuvor auch ein auf GPT-3 trainiertes Modell verwendet, um die Wirkung der Zusammenfassung von Büchern zu untersuchen.

Strategie 4: Geben Sie GPT Zeit zum „Nachdenken“

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Wenn Sie aufgefordert werden, 17 mal 28 zu berechnen, kennen Sie die Antwort möglicherweise nicht sofort, können sie aber nach einiger Zeit berechnen.

Wenn GPT-4 eine Frage erhält, nimmt es sich nicht die Zeit, sorgfältig nachzudenken, sondern versucht, sofort eine Antwort zu geben, was zu Denkfehlern führen kann.

Bevor Sie das Modell also um eine Antwort bitten, können Sie es zunächst bitten, eine Reihe von Argumentationsprozessen durchzuführen, um ihm zu helfen, durch Argumentation zur richtigen Antwort zu gelangen.

Praktische Tipps:

1. Lassen Sie das Modell die Lösung formulieren

Manchmal stellen Sie möglicherweise fest, dass wir bessere Ergebnisse erzielen, wenn wir das Modell explizit anweisen, von ersten Prinzipien aus zu argumentieren, bevor wir zu Schlussfolgerungen gelangen.

Nehmen wir zum Beispiel an, wir möchten, dass das Modell die Lösung eines Schülers für ein mathematisches Problem bewertet.

Der direkteste Weg besteht darin, das Modell einfach zu fragen, ob die Antwort des Schülers richtig ist.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Im Bild oben hält GPT-4 die Lösung des Schülers für richtig.

Aber tatsächlich ist der Plan des Studenten falsch.

Zu diesem Zeitpunkt können Sie das Modell auffordern, eine eigene Lösung zu generieren, damit das Modell dies erfolgreich erkennt.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Nachdem das Modell seine eigene Lösung und Begründung generiert hatte, erkannte es, dass die Lösung des vorherigen Schülers falsch war.

2. Versteckter Argumentationsprozess

Lassen Sie das Modell, wie oben erwähnt, Überlegungen anstellen und Lösungen bereitstellen.

Aber in einigen Anwendungen ist der Argumentationsprozess, durch den das Modell zur endgültigen Antwort gelangt, nicht für die Weitergabe an Benutzer geeignet.

Zum Beispiel in der Hausaufgabennachhilfe möchten wir die Schüler weiterhin dazu ermutigen, eigene Lösungen für Probleme zu formulieren und dann zu den richtigen Antworten zu gelangen. Aber die Argumentation des Modells über die Lösung des Schülers kann dem Schüler die Antwort offenbaren.

Zu diesem Zeitpunkt muss das Modell eine Strategie des „inneren Monologs“ implementieren, die es dem Modell ermöglicht, die Teile der Ausgabe, die vor dem Benutzer verborgen werden sollen, in ein strukturiertes Format zu bringen.

Dann wird die Ausgabe analysiert und nur ein Teil davon sichtbar gemacht, bevor sie dem Benutzer präsentiert wird.

Wie das folgende Beispiel:

Lassen Sie das Modell zunächst seine eigene Lösung formulieren (da die des Schülers möglicherweise falsch ist) und vergleichen Sie sie dann mit der Lösung des Schülers.

Wenn der Schüler in irgendeinem Schritt seiner Antwort einen Fehler macht, lassen Sie das Modell einen Hinweis für diesen Schritt geben, anstatt dem Schüler die vollständig richtige Lösung zu geben.

Wenn der Schüler immer noch falsch liegt, fahren Sie mit dem vorherigen Schritt fort.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Es ist auch möglich, die „Abfrage“-Strategie zu verwenden, bei der die Ausgabe aller Abfragen außer dem letzten Schritt vor dem Benutzer verborgen bleibt.

Zuerst können wir das Modell bitten, das Problem selbst zu lösen. Da für diese erste Abfrage keine studentische Lösung erforderlich ist, kann sie weggelassen werden. Dies bietet auch den zusätzlichen Vorteil, dass die Lösungen des Modells nicht durch studentische Lösungsverzerrungen beeinflusst werden.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Als nächstes können wir das Modell alle verfügbaren Informationen verwenden lassen, um die Richtigkeit der Lösung des Schülers zu bewerten.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Schließlich können wir das Modell seine eigene Analyse verwenden lassen, um die Mentorrolle zu konstruieren.

Du bist Mathe-Nachhilfelehrer. Wenn ein Schüler falsch antwortet, fragen Sie den Schüler nach, ohne die Antwort preiszugeben. Wenn der Schüler richtig antwortet, geben Sie ihm einfach einen ermutigenden Kommentar.

3. Fragen Sie das Modell, ob Inhalt fehlt.

Angenommen, wir bitten GPT-4, einen Auszug aus der Quelldatei aufzulisten, der sich auf ein bestimmtes Problem bezieht, und muss dann entscheiden, ob mit dem Schreiben fortgefahren werden soll . Ein Auszug oder ein Stopp.

Wenn die Quelldatei groß ist, stoppt das Modell häufig vorzeitig und listet nicht alle relevanten Auszüge auf.

In diesem Fall ist es oft möglich, dass das Modell nachfolgende Abfragen durchführt, um Auszüge zu finden, die ihm bei der vorherigen Verarbeitung entgangen sind.

Mit anderen Worten: Der vom Modell generierte Text kann sehr lang sein und nicht auf einmal generiert werden. Sie können ihn also überprüfen lassen und den fehlenden Inhalt ergänzen.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Strategie 5: Unterstützung durch andere Tools

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

GPT-4 ist mächtig, aber nicht allmächtig.

Wir können andere Tools verwenden, um die Mängel von GPT-4 zu beheben.

Zum Beispiel kombiniert mit einem Text-Retrieval-System oder der Verwendung einer Code-Ausführungs-Engine.

Wenn wir GPT-4 um die Beantwortung einer Frage bitten und es Aufgaben gibt, die von anderen Tools zuverlässiger und effizienter erledigt werden können, können wir diese Aufgaben an sie auslagern. Dadurch können nicht nur ihre jeweiligen Vorteile voll zur Geltung gebracht werden, sondern auch GPT-4 kann seine beste Leistung erbringen.

Praktische Tipps:

1. Nutzen Sie die einbettungsbasierte Suche, um eine effiziente Wissenssuche zu erreichen

Dieser Tipp wurde oben erwähnt.

Wenn in der Eingabe des Modells zusätzliche externe Informationen bereitgestellt werden, hilft dies dem Modell, bessere Antworten zu generieren.

Wenn ein Benutzer beispielsweise eine Frage zu einem bestimmten Film stellt, kann es nützlich sein, Informationen über den Film (z. B. Schauspieler, Regisseur usw.) zur Eingabe in das Modell hinzuzufügen.

Einbettungen können verwendet werden, um einen effizienten Wissensabruf zu ermöglichen, wobei relevante Informationen dynamisch zur Eingabe des Modells hinzugefügt werden können, während das Modell ausgeführt wird.

Texteinbettung ist ein Vektor, der die Relevanz von Textzeichenfolgen misst. Ähnliche oder verwandte Zeichenfolgen werden enger miteinander verbunden als nicht verwandte Zeichenfolgen. In Verbindung mit der Existenz schneller Vektorsuchalgorithmen bedeutet dies, dass Einbettungen verwendet werden können, um einen effizienten Wissensabruf zu erreichen.

Insbesondere kann der Textkorpus in mehrere Teile unterteilt werden und jeder Teil kann eingebettet und gespeichert werden. Anschließend kann bei einer gegebenen Abfrage eine Vektorsuche durchgeführt werden, um die eingebetteten Textteile im Korpus zu finden, die für die Abfrage am relevantesten sind.

2. Verwenden Sie die Codeausführung für genauere Berechnungen oder rufen Sie externe APIs auf.

Sie können sich für genaue Berechnungen nicht ausschließlich auf das Modell selbst verlassen.

Auf Wunsch kann das Modell angewiesen werden, Code zu schreiben und auszuführen, anstatt autonome Berechnungen durchzuführen.

Sie können das Modell anweisen, den auszuführenden Code in ein bestimmtes Format zu bringen. Nachdem die Ausgabe generiert wurde, kann der Code extrahiert und ausgeführt werden. Nachdem die Ausgabe generiert wurde, kann der Code extrahiert und ausgeführt werden. Schließlich kann die Ausgabe der Code-Ausführungs-Engine (d. h. des Python-Interpreters) bei Bedarf als nächste Eingabe verwendet werden.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Ein weiteres tolles Anwendungsszenario für die Codeausführung ist der Aufruf externer APIs.

Wenn dem Modell die korrekte Verwendung einer API mitgeteilt wird, kann es Code schreiben, der diese API verwendet.

Modellen kann der Umgang mit der API beigebracht werden, indem ihnen Dokumentation und/oder Codebeispiele gezeigt werden.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Hier ist eine besondere Warnung von OpenAI⚠️:

Das Ausführen von modellgeneriertem Code ist von Natur aus unsicher und in jeder Anwendung, die dies versucht, sollten Vorsichtsmaßnahmen getroffen werden. Insbesondere ist eine Sandbox-Codeausführungsumgebung erforderlich, um den Schaden zu begrenzen, den nicht vertrauenswürdiger Code verursachen kann.

Strategie Sechs: Änderungen systematisch testen

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Manchmal ist es schwierig festzustellen, ob eine Änderung ein System besser oder schlechter macht.

Man kann anhand einiger Beispiele erkennen, welches besser ist, aber bei einer kleinen Stichprobengröße ist es schwer zu sagen, ob es sich um eine echte Verbesserung oder nur um Zufall handelt.

Vielleicht kann diese „Änderung“ die Wirksamkeit einiger Eingaben verbessern, aber die Wirksamkeit anderer Eingaben verringern.
Bewertungsverfahren (oder „Bewertungen“) sind sehr nützlich für die Optimierung des Systemdesigns. Eine gute Auswertung weist die folgenden Merkmale auf:

1) repräsentiert die reale Nutzung (oder zumindest eine Vielzahl von Nutzungen)

2) enthält viele Testfälle, um eine größere statistische Aussagekraft zu erreichen (siehe Tabelle unten)

3 ) Einfach zu automatisieren oder wiederholen

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Die Auswertung der Ausgabe kann durch einen Computer, einen Menschen oder eine Kombination aus beidem erfolgen. Computer können automatisch anhand objektiver Kriterien bewerten oder einige subjektive oder unscharfe Kriterien verwenden, z. B. Modelle zur Bewertung von Modellen verwenden.

OpenAI bietet ein Open-Source-Software-Framework – OpenAI Evals, das Tools zum Erstellen automatischer Bewertungen bereitstellt.

Modellbasierte Auswertung ist sinnvoll, wenn es eine Reihe gleich hochwertiger Ergebnisse gibt.

Praktische Tipps:

1. Bewerten Sie die Modellausgabe anhand von Goldstandard-Antworten

Gehen Sie davon aus, dass sich die richtige Antwort auf eine bekannte Frage auf einen bestimmten Satz bekannter Fakten beziehen sollte.

Wir können das Modell dann fragen, wie viele erforderliche Fakten in der Antwort enthalten sind.

Anhand der folgenden Systemmeldung

gibt man beispielsweise die notwendigen gesicherten Fakten:

Neil Armstrong war der erste Mann, der den Mond betrat.

Das Datum, an dem Neil Armstrong zum ersten Mal auf dem Mond landete, war der 21. Juli 1969.

Wenn die Antwort die angegebenen Fakten enthält, antwortet das Modell mit „Ja“. Andernfalls antwortet das Modell mit „Nein“ und lässt das Modell schließlich zählen, wie viele „Ja“-Antworten es gibt:

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Das Folgende ist eine Beispieleingabe, die zwei etablierte Fakten (sowohl Ereignisse als auch Zeit) enthält:

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Eine Beispieleingabe, die nur eine etablierte Tatsache erfüllt (keine Zeit):

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Die folgende Beispieleingabe enthält keine etablierte Tatsache:

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Dieses modellbasierte Modell gibt es viele mögliche Variationen der Bewertungsmethode, und es ist notwendig, den Grad der Überschneidung zwischen der Kandidatenantwort und der Standardantwort zu verfolgen und zu verfolgen, ob die Kandidatenantwort mit der Standardantwort in Konflikt steht.

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Gefällt mir diese Beispieleingabe unten, die minderwertige Antworten enthält, aber nicht im Widerspruch zur Expertenantwort (Standardantwort) steht:

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Hier ist diese Beispieleingabe, deren Antwort mit der des Experten übereinstimmt Antwort Die Antwort ist ein direkter Widerspruch (denken Sie, Neil Armstrong war der zweite Mann, der den Mond betrat):

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Die letzte ist eine Beispieleingabe mit der richtigen Antwort, die auch mehr Details als nötig liefert (die Zeit ist genau 02:56 und weist darauf hin, dass es sich um ein monumentales Ereignis in der Geschichte der Menschheit handelt):

Die umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten

Portal: https://github.com/openai/evals(OpenAI Evals)

Das obige ist der detaillierte Inhalt vonDie umfassendste Strategie für GPT-4 ist hier! OpenAI wird offiziell veröffentlicht und alle in sechs Monaten gesammelten Erfahrungen sind enthalten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Assassin's Creed Shadows: Seashell Riddle -Lösung

3 Wochen vor By DDD

Was ist neu in Windows 11 KB5054979 und wie Sie Update -Probleme beheben

2 Wochen vor By DDD

Wo kann man die Kransteuerungsschlüsselkarten in Atomfall finden

3 Wochen vor By DDD

<🎜>: Dead Rails - wie man jede Herausforderung abschließt

4 Wochen vor By DDD

Atomfall Guide: Gegenstandsstandorte, Questführer und Tipps

1 Monate vor By DDD

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7677

CakePHP-Tutorial

1393

C#-Tutorial

1207

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

Related knowledge

Das weltweit leistungsstärkste Open-Source-MoE-Modell ist da, mit chinesischen Fähigkeiten, die mit GPT-4 vergleichbar sind, und der Preis beträgt nur fast ein Prozent von GPT-4-Turbo May 07, 2024 pm 04:13 PM

Stellen Sie sich ein Modell der künstlichen Intelligenz vor, das nicht nur die Fähigkeit besitzt, die traditionelle Datenverarbeitung zu übertreffen, sondern auch eine effizientere Leistung zu geringeren Kosten erzielt. Dies ist keine Science-Fiction, DeepSeek-V2[1], das weltweit leistungsstärkste Open-Source-MoE-Modell, ist da. DeepSeek-V2 ist ein leistungsstarkes MoE-Sprachmodell (Mix of Experts) mit den Merkmalen eines wirtschaftlichen Trainings und einer effizienten Inferenz. Es besteht aus 236B Parametern, von denen 21B zur Aktivierung jedes Markers verwendet werden. Im Vergleich zu DeepSeek67B bietet DeepSeek-V2 eine stärkere Leistung, spart gleichzeitig 42,5 % der Trainingskosten, reduziert den KV-Cache um 93,3 % und erhöht den maximalen Generierungsdurchsatz auf das 5,76-fache. DeepSeek ist ein Unternehmen, das sich mit allgemeiner künstlicher Intelligenz beschäftigt

Vier empfohlene KI-gestützte Programmiertools Apr 22, 2024 pm 05:34 PM

Dieses KI-gestützte Programmiertool hat in dieser Phase der schnellen KI-Entwicklung eine große Anzahl nützlicher KI-gestützter Programmiertools zu Tage gefördert. KI-gestützte Programmiertools können die Entwicklungseffizienz verbessern, die Codequalität verbessern und Fehlerraten reduzieren. Sie sind wichtige Helfer im modernen Softwareentwicklungsprozess. Heute wird Dayao Ihnen 4 KI-gestützte Programmiertools vorstellen (und alle unterstützen die C#-Sprache). https://github.com/YSGStudyHards/DotNetGuide1.GitHubCopilotGitHubCopilot ist ein KI-Codierungsassistent, der Ihnen hilft, Code schneller und mit weniger Aufwand zu schreiben, sodass Sie sich mehr auf Problemlösung und Zusammenarbeit konzentrieren können. Git

Der Ameca der zweiten Generation ist da! Er kann fließend mit dem Publikum kommunizieren, sein Gesichtsausdruck ist realistischer und er kann Dutzende Sprachen sprechen. Mar 04, 2024 am 09:10 AM

Der humanoide Roboter Ameca wurde auf die zweite Generation aufgerüstet! Kürzlich erschien auf der World Mobile Communications Conference MWC2024 erneut der weltweit fortschrittlichste Roboter Ameca. Rund um den Veranstaltungsort lockte Ameca zahlreiche Zuschauer an. Mit dem Segen von GPT-4 kann Ameca in Echtzeit auf verschiedene Probleme reagieren. „Lass uns tanzen.“ Auf die Frage, ob sie Gefühle habe, antwortete Ameca mit einer Reihe von Gesichtsausdrücken, die sehr lebensecht aussahen. Erst vor wenigen Tagen stellte EngineeredArts, das britische Robotikunternehmen hinter Ameca, die neuesten Entwicklungsergebnisse des Teams vor. Im Video verfügt der Roboter Ameca über visuelle Fähigkeiten und kann den gesamten Raum und bestimmte Objekte sehen und beschreiben. Das Erstaunlichste ist, dass sie es auch kann

Nach 750.000 Runden Einzelkampf zwischen großen Modellen gewann GPT-4 die Meisterschaft und Llama 3 belegte den fünften Platz Apr 23, 2024 pm 03:28 PM

Zu Llama3 wurden neue Testergebnisse veröffentlicht – die große Modellbewertungs-Community LMSYS veröffentlichte eine große Modell-Rangliste, die Llama3 auf dem fünften Platz belegte und mit GPT-4 den ersten Platz in der englischen Kategorie belegte. Das Bild unterscheidet sich von anderen Benchmarks. Diese Liste basiert auf Einzelkämpfen zwischen Modellen, und die Bewerter aus dem gesamten Netzwerk machen ihre eigenen Vorschläge und Bewertungen. Am Ende belegte Llama3 den fünften Platz auf der Liste, gefolgt von drei verschiedenen Versionen von GPT-4 und Claude3 Super Cup Opus. In der englischen Einzelliste überholte Llama3 Claude und punktgleich mit GPT-4. Über dieses Ergebnis war Metas Chefwissenschaftler LeCun sehr erfreut und leitete den Tweet weiter

Welcher KI-Programmierer ist der beste? Entdecken Sie das Potenzial von Devin, Tongyi Lingma und SWE-Agent Apr 07, 2024 am 09:10 AM

Am 3. März 2022, weniger als einen Monat nach der Geburt von Devin, dem weltweit ersten KI-Programmierer, entwickelte das NLP-Team der Princeton University einen Open-Source-KI-Programmierer-SWE-Agenten. Es nutzt das GPT-4-Modell, um Probleme in GitHub-Repositorys automatisch zu lösen. Die Leistung des SWE-Agenten auf dem SWE-Bench-Testsatz ist ähnlich wie die von Devin, er benötigt durchschnittlich 93 Sekunden und löst 12,29 % der Probleme. Durch die Interaktion mit einem dedizierten Terminal kann der SWE-Agent Dateiinhalte öffnen und durchsuchen, die automatische Syntaxprüfung verwenden, bestimmte Zeilen bearbeiten sowie Tests schreiben und ausführen. (Hinweis: Der obige Inhalt stellt eine geringfügige Anpassung des Originalinhalts dar, die Schlüsselinformationen im Originaltext bleiben jedoch erhalten und überschreiten nicht die angegebene Wortbeschränkung.) SWE-A

Erfahren Sie, wie Sie mobile Anwendungen mit der Go-Sprache entwickeln Mar 28, 2024 pm 10:00 PM

Tutorial zur Entwicklung mobiler Anwendungen in der Go-Sprache Da der Markt für mobile Anwendungen weiterhin boomt, beginnen immer mehr Entwickler damit, sich mit der Verwendung der Go-Sprache für die Entwicklung mobiler Anwendungen zu befassen. Als einfache und effiziente Programmiersprache hat die Go-Sprache auch großes Potenzial für die Entwicklung mobiler Anwendungen gezeigt. In diesem Artikel wird detailliert beschrieben, wie die Go-Sprache zum Entwickeln mobiler Anwendungen verwendet wird, und es werden spezifische Codebeispiele angehängt, um den Lesern den schnellen Einstieg und die Entwicklung eigener mobiler Anwendungen zu erleichtern. 1. Vorbereitung Bevor wir beginnen, müssen wir die Entwicklungsumgebung und die Tools vorbereiten. Kopf

Das leistungsstärkste Modell der Welt wechselte über Nacht den Besitzer und markierte damit das Ende der GPT-4-Ära! Claude 3 hat GPT-5 im Voraus durchgelesen und einen Aufsatz mit 10.000 Wörtern in 3 Sekunden gelesen. Sein Verständnis kommt dem des Menschen nahe. Mar 06, 2024 pm 12:58 PM

Die Lautstärke ist verrückt, die Lautstärke ist verrückt und das große Modell hat sich wieder verändert. Gerade eben wechselte das leistungsstärkste KI-Modell der Welt über Nacht den Besitzer und GPT-4 wurde vom Altar genommen. Anthropic hat die neueste Claude3-Modellreihe veröffentlicht. Eine Satzbewertung: Sie zerschmettert GPT-4 wirklich! In Bezug auf multimodale Indikatoren und Sprachfähigkeitsindikatoren gewinnt Claude3. In den Worten von Anthropic haben die Modelle der Claude3-Serie neue Branchenmaßstäbe in den Bereichen Argumentation, Mathematik, Codierung, Mehrsprachenverständnis und Vision gesetzt! Anthropic ist ein Startup-Unternehmen, das von Mitarbeitern gegründet wurde, die aufgrund unterschiedlicher Sicherheitskonzepte von OpenAI „abgelaufen“ sind. Ihre Produkte haben OpenAI immer wieder hart getroffen. Dieses Mal musste sich Claude3 sogar einer großen Operation unterziehen.

Zusammenfassung der fünf beliebtesten Go-Sprachbibliotheken: wesentliche Tools für die Entwicklung Feb 22, 2024 pm 02:33 PM

Zusammenfassung der fünf beliebtesten Go-Sprachbibliotheken: wesentliche Werkzeuge für die Entwicklung, die spezifische Codebeispiele erfordern Seit ihrer Geburt hat die Go-Sprache große Aufmerksamkeit und Anwendung gefunden. Als aufstrebende effiziente und prägnante Programmiersprache ist die schnelle Entwicklung von Go untrennbar mit der Unterstützung umfangreicher Open-Source-Bibliotheken verbunden. In diesem Artikel werden fünf beliebte Go-Sprachbibliotheken vorgestellt. Diese Bibliotheken spielen eine wichtige Rolle bei der Go-Entwicklung und bieten Entwicklern leistungsstarke Funktionen und praktische Entwicklungserfahrung. Um die Verwendung und Funktion dieser Bibliotheken besser zu verstehen, werden wir sie gleichzeitig anhand konkreter Codebeispiele erläutern.

See all articles