


Das Team von Tian Yuandong hat die zweite Version des DOC von „Long Story Generator' veröffentlicht: Die Kohärenz wurde erheblich verbessert und der Spaß um 20,7 % gesteigert!
Vor einiger Zeit veröffentlichte das Team von Dr. Tian Yuandong auf der EMNLP2022 ein Story-Generator-Framework Re3 (Recursive Reprompting and Revision), das auf einem umfangreichen Sprachmodell basiert. Mit dem großen Modell können Geschichten mit bis zu 7.500 Wörtern generiert werden.
Kürzlich hat das Autorenteam von Re3 die zweite Version des Long-Story-Generierungs-Frameworks DOC (Detailed Outline Control) veröffentlicht, das eine hierarchische Gliederung verwendet, um die Geschichte detaillierter zu beschreiben, und fein abgestimmtes OPT verwendet Das -350m-Modell führt eine kohärentere Fortsetzung des generierten Inhalts durch. Im Gegensatz dazu bewerteten Menschen DOC als schreibfähiger als die vorherige Generation Re3.
Papierlink: https://arxiv.org/abs/2212.10077
Papierlink: https://github.com/yangkevin2/doc-story-generation
DOC besteht aus zwei komplementären Komponenten:
1. Detaillierte Gliederung: Erstellen Sie eine detailliertere, hierarchisch strukturierte Gliederung, die die kreative Arbeit vom Hauptentwurfsprozess trennt. Gehen Sie zur Planungsphase Controller stellt sicher, dass detailliertere Gliederungen weiterhin eine Rolle im Generierungsprozess spielen können, indem er die Story-Absätze so steuert, dass sie mit den Gliederungsdetails übereinstimmen.
Bei der menschlichen Auswertung automatisch generierter Geschichten erzielte DOC einen absoluten Gewinn von 22,5 % bei der Handlungskonsistenz, einen 28,2 %igen Anstieg bei der Gliederungsrelevanz und einen 20,7 %igen Anstieg beim Interesse, was deutlich besser war als die vorherige Re3-Basislinie Modell, und die menschlichen Bewerter glauben auch, dass DOC in einer interaktiven Produktionsumgebung einfacher zu steuern ist.
Kevin Yang, der Erstautor des Artikels, ist Doktorand im vierten Jahr an der University of California, Berkeley. Sein Hauptforschungsinteresse gilt der kontrollierbaren Textgenerierung in natürlicher Sprache in strukturierten Umgebungen, beispielsweise unter Verwendung strukturierter kontrollierbarer Methoden Generierung zur Verbesserung der Textkonsistenz.Der zweite Autor, Dr. Tian Yuandong, ist Forscher und leitender Manager am Meta Artificial Intelligence Research Institute. Zu seinen Forschungsinteressen gehören Deep Reinforcement Learning und seine Anwendung in Spielen sowie die theoretische Analyse von Deep-Learning-Modellen. Er erhielt seinen Bachelor- und Master-Abschluss 2005 und 2008 von der Shanghai Jiao Tong University und promovierte 2013 am Robotics Institute der Carnegie Mellon University in den Vereinigten Staaten.
DOC Framework
Mit der kontinuierlichen Weiterentwicklung der Technologie natürlicher Sprache nähert sich das Verständnis kurzer Texte durch groß angelegte Sprachmodelle allmählich dem Engpass, und die Menschen interessieren sich allmählich für die Generierung längerer Texte, beispielsweise für die Generierung Tausender Texte Wörter auf einmal.
Im Vergleich zu kurzen Textgenerierungsaufgaben enthält Langtext auch mehr Inhalt und Einschränkungen. Das Modell muss die Gesamtkonsistenz und die langfristige Sachkonsistenz aufrechterhalten und auch die Relevanz für die Prämisse oder den Plan der Benutzerausgabe aufrechterhalten.Im Vergleich zum Menschen weisen Story-Generierungssysteme wie Re3 in vielen Aspekten immer noch Mängel auf, wie z. B. die Unfähigkeit, die Kohärenz der Handlung über große Entfernungen zu gewährleisten, globale Inkonsistenzen, vom festgelegten Plan abweichende Story-Inhalte usw.
Um diese Lücke zu schließen, verbessert das „Detailed Outline Control“ (DOC)-Framework die langfristige Konsistenz durch zwei komplementäre Ansätze und verwendet gleichzeitig die übergeordnete Planungs-, Entwurfs- und Revisionsstruktur von Re3.
Detaillierter Outliner
Anstatt neue Handlungspunkte zu improvisieren, könnte ein Autor in der groben Gliederungsphase eine kohärente übergreifende Handlung planen und dabei eine erweiterte Gliederung verwenden, um während des Entwurfsprozesses detailliertere Anleitungen zu geben.

In der Entwurfsphase nutzten die Forscher die Gliederungsrelevanz und die Neuordnung der Textkohärenz aus der Re3-Umschreibungsphase, um zu erkennen, wann das aktuelle Gliederungsprojekt einen Absatz eines Artikels abgeschlossen hat, und um ein frühzeitiges Stoppen basierend auf der Bewertungsschwelle zu erreichen .
Die Gliederung enthält vollständige Einstellungen und relevante Charaktere, und jedes Gliederungselement wird sorgfältig auf Relevanz und Kohärenz im Kontext überprüft.
In der strukturierten Eingabeaufforderung hebt das Modell die aktuellen Einstellungen und Änderungen in den Einstellungen hervor und ruft außerdem Rollenbeschreibungen basierend auf den in der Gliederung erkannten Rollen ab.

Im Gegensatz dazu wählt Re3 während des Entwurfsprozesses dynamisch relevante Charaktere für jedes Segment aus und verfolgt keine Setup-Informationen, was zu unerwarteten Änderungen im Story-Setup führen kann
Detaillierte Steuerung
Der zweite Die Komponente, der detaillierte Controller, sorgt für die Treue zur detaillierten Gliederung, indem sie die Absatzgenerierung auf der Grundlage der entsprechenden Gliederungselemente steuert.
Da die detaillierte Gliederung viele überlappende weiche Einschränkungen auferlegt, muss der detaillierte Controller eine ausreichende Kontrollstärke ausüben. Gleichzeitig muss sich der detaillierte Controller auch an flexible Eingaben in natürlicher Sprache anpassen und bei Verwendung des Stands der Technik generiert werden. Kunst groß angelegte Sprachmodelle.
Also implementierten die Forscher den detaillierten Controller als OPT350m-basierten Controller und entwarfen ein kontrastives Trainingsprogramm, um die Zusammenfassung an das Absatzpräfix anzupassen.

Am wichtigsten ist, dass die Forscher auch viele fließende harte Verneinungen erstellt haben, um zu ermöglichen, dass die generierten Absätze nicht nur zu Beginn, sondern auch durchgehend für das Thema relevant sind.
Experimenteller Teil
Im Experiment ist die Eingabe in das Modell nur eine kurze englische Prämisse, normalerweise 30-60 Wörter, und die Ausgabe ist eine vollständige Geschichte.
Die Forscher haben keine weiteren Regelbeschränkungen eingeführt, da die Definition von „Story“ noch nicht klar ist, geschweige denn die Definition von „guter Story“ und die Qualität hauptsächlich auf manuellen Bewertungsindikatoren beruht.
verwendet bei der Bewertung hauptsächlich drei Indikatoren, die eher zum Vergleich von Absätzen als von vollständigen Geschichten geeignet sind:
1. Kohärenz, der Prozentsatz der Absätze, bei denen menschliche Kommentatoren die Handlung für kohärent halten;
2 . Relevanz, der Prozentsatz der Absätze, die den entsprechenden Gliederungseintrag erfüllen
3. Interessantität, der Prozentsatz der Absätze, die als interessant beurteilt werden.
Zu den verglichenen Basismodellen gehören Re3, ROLLING-OPT und ROLLING-GPT.

Wie aus den experimentellen Ergebnissen ersichtlich ist, glauben Annotatoren im Vergleich zu Re3, dass das von DOC generierte Diagramm kohärenter und relevanter für die Gliederung ist und eine höhere Verbesserung aufweist als die ROLLING-Grundlinie.
Und die Ergebnisse bestätigen die Korrektheit des Modelldesigns, d. h. Handlungskohärenz und Gliederungsrelevanz profitieren von der Verlagerung kreativer Arbeit von der Planung auf den Entwurf sowie verbesserte Kontrollmechanismen.
Und überraschenderweise waren die Kommentatoren auch der Meinung, dass die DOC-Absätze deutlich interessanter seien. Die Forscher glaubten, dass dies eine Verbesserung sei, die durch die detaillierteren (ereignisorientierteren) Umrisse erzielt wurde. Weitere Ablationsexperimente unterstützten diese Hypothese ebenfalls.
Die qualitative Analyse ergab jedoch auch, dass das Modell noch viel Raum für weitere Verbesserungen bietet.
Im Gegensatz zu RE3 weicht DOC normalerweise nicht wesentlich von der Gliederung der obersten Ebene ab, während RE3 manchmal fast vollständig vom Thema abweicht, DOC jedoch häufig nicht den Teilen der detaillierten Gliederung auf niedrigerer Ebene folgt.
Es gibt immer noch Probleme mit der internen Konsistenz in DOC und RE3, und gelegentliche Fehler in detaillierten Gliederungen können sich besonders negativ auswirken und zu größeren Kaskadenfehlern während des Entwurfsprozesses führen.
Darüber hinaus sind die Umrisse im DOC oft inkonsistent im Detaillierungsgrad, wobei einige zu vage sind und andere überdehnt wirken.

Darüber hinaus können die vom Modell erkannten Einstellungen und Zeichen manchmal falsch oder unvollständig sein. Das folgende Beispiel zeigt eine stark gekürzte Geschichte, die DOC auf der Grundlage der obigen Gliederung geschrieben hat.







Das obige ist der detaillierte Inhalt vonDas Team von Tian Yuandong hat die zweite Version des DOC von „Long Story Generator' veröffentlicht: Die Kohärenz wurde erheblich verbessert und der Spaß um 20,7 % gesteigert!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Nach tatsächlichen Tests hat der AI-ID-Fotogenerator eine gute Leistung gezeigt und seine leistungsstarken Funktionen sind erstaunlich. Sie müssen sich wirklich keine Sorgen mehr um das Aufnehmen von Fotos machen! Dieser Satz wird wie folgt umgeschrieben: Verwenden Sie die Chuzhan AI-Software (das Urheberrecht und die Interpretationsrechte liegen bei Chuzhan AI und werden nur zur Darstellung des erzeugten Effekts verwendet). Skizzenmodus: Ob in der täglichen Arbeit oder in Geschäftsbürosituationen, ein professionelles Image ist entscheidend. Ein schönes Ausweisfoto kann das professionelle Image einer Person verbessern. Durch KI generierte Ausweisfotos entsprechen nicht nur herkömmlichen Fotostandards, sondern können auch die einzigartigen Gesichtszüge einer Person wiederherstellen. Die KI-Technologie kann Gesichtskonturen, Hautfarbe, Beleuchtung und andere Details intelligent identifizieren, um das am besten geeignete Ausweisfoto zu erstellen. Ob Aussehen oder Temperament, es kann perfekt dargestellt werden und einen tiefen ersten Eindruck bei den Menschen hinterlassen. KI generiert mit einem Klick Ausweisfotos.

Wie schreibe ich einen einfachen Generator für Schülerleistungsberichte mit Java? Der Student Performance Report Generator ist ein Tool, das Lehrern und Erziehern dabei hilft, schnell Berichte über die Schülerleistung zu erstellen. In diesem Artikel wird erläutert, wie Sie mit Java einen einfachen Generator für Schülerleistungsberichte schreiben. Zuerst müssen wir das Studentenobjekt und das Studentennotenobjekt definieren. Das Schülerobjekt enthält grundlegende Informationen wie den Namen und die Schülernummer des Schülers, während das Schülerergebnisobjekt Informationen wie die Fachnoten und die Durchschnittsnote des Schülers enthält. Das Folgende ist die Definition eines einfachen Studentenobjekts: öffentlich

Wenn Sie den besten kostenlosen Generator für KI-Animationskunst suchen, können Sie Ihre Suche beenden. Die Welt der Anime-Kunst fasziniert das Publikum seit Jahrzehnten mit ihren einzigartigen Charakterdesigns, faszinierenden Farben und fesselnden Handlungen. Allerdings erfordert die Erstellung von Anime-Kunst Talent, Geschick und viel Zeit. Dank der kontinuierlichen Weiterentwicklung der künstlichen Intelligenz (KI) können Sie jetzt mithilfe des besten kostenlosen KI-Animationskunstgenerators die Welt der Animationskunst erkunden, ohne sich mit komplexen Technologien befassen zu müssen. Dies eröffnet Ihnen neue Möglichkeiten, Ihrer Kreativität freien Lauf zu lassen. Was ist ein KI-Generator für Anime-Kunst? Der AI Animation Art Generator nutzt hochentwickelte Algorithmen und Techniken des maschinellen Lernens, um eine umfangreiche Datenbank mit Animationswerken zu analysieren. Durch diese Algorithmen lernt und identifiziert das System verschiedene Animationsstile

Generatoren in PHP7: Wie kann man große Datenmengen effizient verarbeiten und Speicher sparen? Überblick: PHP7 führt Generatoren als leistungsstarkes Werkzeug im Hinblick auf die Verarbeitung großer Datenmengen und die Speichereinsparung ein. Generatoren sind eine besondere Art von Funktion in der PHP-Sprache. Im Gegensatz zu gewöhnlichen Funktionen können Generatoren die Ausführung anhalten und Zwischenergebnisse zurückgeben, anstatt alle Ergebnisse auf einmal zurückzugeben. Dadurch ist der Generator ideal für die Verarbeitung großer Datenmengen, reduziert den Speicherverbrauch und verbessert die Verarbeitungseffizienz. In diesem Artikel werden Studierende vorgestellt

So schreiben Sie einen einfachen QR-Code-Generator mit PHP QR-Codes sind in der modernen Gesellschaft weit verbreitet. Sie können Informationen schnell übertragen und das Benutzererlebnis verbessern. In diesem Artikel zeige ich Ihnen, wie Sie mit PHP einen einfachen QR-Code-Generator schreiben. 1. Installieren Sie die erforderlichen Tools und Bibliotheken. Bevor wir beginnen, müssen wir sicherstellen, dass die folgenden Tools und Bibliotheken installiert wurden: PHP: Stellen Sie sicher, dass die neueste Version von PHP installiert ist. Sie können die aktuelle PHP-Version überprüfen, indem Sie PHP ausführen -v-Befehl. Komponist: C

Das Konzept des Generators (Generator) wurde in PHP7 eingeführt, das eine Methode zum effizienten Umgang mit großen Datenmengen und verzögertem Laden bietet. Dieser Artikel beginnt mit Konzepten und Prinzipien, kombiniert mit spezifischen Codebeispielen, um die Verwendung und Vorteile von Generatoren in PHP7 vorzustellen. Ein Generator ist eine spezielle Funktion, die nicht alle Daten auf einmal zurückgibt, sondern Daten bei Bedarf generiert. Wenn die Funktion die yield-Anweisung ausführt, wird der aktuell generierte Wert zurückgegeben und der Status der Funktion gespeichert. Wenn die Generatorfunktion das nächste Mal aufgerufen wird, wird die Funktion ausgeführt

Nachdem ChatGPT mit dem Internet verbunden werden konnte, führte OpenAI auch schnell einen Codegenerator ein. Mit der Unterstützung dieses Plug-Ins kann ChatGPT sogar ein eigenes maschinelles Lernmodell generieren. Letzten Freitag gab OpenAI gerade die schockierende Nachricht bekannt, dass ChatGPT eine Verbindung zum Internet und zu Plug-Ins von Drittanbietern herstellen kann! Zusätzlich zu Plug-ins von Drittanbietern führte OpenAI auch sein eigenes Plug-in „Code Interpreter“ ein und bot mehrere spezielle Anwendungsfälle: Lösung quantitativer und qualitativer mathematischer Probleme und schnelle Konvertierung von Dateiformaten; Darüber hinaus demonstrierte Greg Brockman, dass ChatGPT auch hochgeladene Videodateien verarbeiten kann. Und ein Bestsellerautor namens Andrew Mayne

Generatoren in PHP7: Wie kann man große Datenmengen effizient verarbeiten und die Codeausführung beschleunigen? Mit der Entwicklung des Internets wird die Datenmenge, mit der wir konfrontiert sind, immer größer, und die Verarbeitung großer Datenmengen ist zu einer wichtigen Aufgabe für Entwickler geworden. Generator wurde in PHP7 eingeführt, was uns eine Möglichkeit bietet, große Datenmengen effizient zu verarbeiten und die Codeausführung zu beschleunigen. Ein Generator ist ein spezieller Iterator in PHP. Mit einem Generator können Sie Werte einzeln in einer Schleife generieren, ohne alle Zahlen auf einmal zu laden.
