Vor einiger Zeit veröffentlichte das Team von Dr. Tian Yuandong auf der EMNLP2022 ein Story-Generator-Framework Re3 (Recursive Reprompting and Revision), das auf einem umfangreichen Sprachmodell basiert. Mit dem großen Modell können Geschichten mit bis zu 7.500 Wörtern generiert werden.
Kürzlich hat das Autorenteam von Re3 die zweite Version des Long-Story-Generierungs-Frameworks DOC (Detailed Outline Control) veröffentlicht, das eine hierarchische Gliederung verwendet, um die Geschichte detaillierter zu beschreiben, und fein abgestimmtes OPT verwendet Das -350m-Modell führt eine kohärentere Fortsetzung des generierten Inhalts durch. Im Gegensatz dazu bewerteten Menschen DOC als schreibfähiger als die vorherige Generation Re3.
Papierlink: https://arxiv.org/abs/2212.10077
Papierlink: https://github.com/yangkevin2/doc-story-generation
DOC besteht aus zwei komplementären Komponenten:
1. Detaillierte Gliederung: Erstellen Sie eine detailliertere, hierarchisch strukturierte Gliederung, die die kreative Arbeit vom Hauptentwurfsprozess trennt. Gehen Sie zur Planungsphase Controller stellt sicher, dass detailliertere Gliederungen weiterhin eine Rolle im Generierungsprozess spielen können, indem er die Story-Absätze so steuert, dass sie mit den Gliederungsdetails übereinstimmen.
Bei der menschlichen Auswertung automatisch generierter Geschichten erzielte DOC einen absoluten Gewinn von 22,5 % bei der Handlungskonsistenz, einen 28,2 %igen Anstieg bei der Gliederungsrelevanz und einen 20,7 %igen Anstieg beim Interesse, was deutlich besser war als die vorherige Re3-Basislinie Modell, und die menschlichen Bewerter glauben auch, dass DOC in einer interaktiven Produktionsumgebung einfacher zu steuern ist.
Kevin Yang, der Erstautor des Artikels, ist Doktorand im vierten Jahr an der University of California, Berkeley. Sein Hauptforschungsinteresse gilt der kontrollierbaren Textgenerierung in natürlicher Sprache in strukturierten Umgebungen, beispielsweise unter Verwendung strukturierter kontrollierbarer Methoden Generierung zur Verbesserung der Textkonsistenz.Der zweite Autor, Dr. Tian Yuandong, ist Forscher und leitender Manager am Meta Artificial Intelligence Research Institute. Zu seinen Forschungsinteressen gehören Deep Reinforcement Learning und seine Anwendung in Spielen sowie die theoretische Analyse von Deep-Learning-Modellen. Er erhielt seinen Bachelor- und Master-Abschluss 2005 und 2008 von der Shanghai Jiao Tong University und promovierte 2013 am Robotics Institute der Carnegie Mellon University in den Vereinigten Staaten.
DOC Framework
Mit der kontinuierlichen Weiterentwicklung der Technologie natürlicher Sprache nähert sich das Verständnis kurzer Texte durch groß angelegte Sprachmodelle allmählich dem Engpass, und die Menschen interessieren sich allmählich für die Generierung längerer Texte, beispielsweise für die Generierung Tausender Texte Wörter auf einmal.
Im Vergleich zu kurzen Textgenerierungsaufgaben enthält Langtext auch mehr Inhalt und Einschränkungen. Das Modell muss die Gesamtkonsistenz und die langfristige Sachkonsistenz aufrechterhalten und auch die Relevanz für die Prämisse oder den Plan der Benutzerausgabe aufrechterhalten.Im Vergleich zum Menschen weisen Story-Generierungssysteme wie Re3 in vielen Aspekten immer noch Mängel auf, wie z. B. die Unfähigkeit, die Kohärenz der Handlung über große Entfernungen zu gewährleisten, globale Inkonsistenzen, vom festgelegten Plan abweichende Story-Inhalte usw.
Um diese Lücke zu schließen, verbessert das „Detailed Outline Control“ (DOC)-Framework die langfristige Konsistenz durch zwei komplementäre Ansätze und verwendet gleichzeitig die übergeordnete Planungs-, Entwurfs- und Revisionsstruktur von Re3.
Detaillierter Outliner
Der detaillierte Outliner verfeinert zunächst eine kurze anfängliche Gliederung in eine detailliertere, hierarchische Gliederung. Der Grund für diesen Entwurf ist, dass menschliche Autoren möglicherweise ein langes Dokument entwerfen, bevor sie es iterativ verfeinern und erweitern ein kurzer erster Abriss.Anstatt neue Handlungspunkte zu improvisieren, könnte ein Autor in der groben Gliederungsphase eine kohärente übergreifende Handlung planen und dabei eine erweiterte Gliederung verwenden, um während des Entwurfsprozesses detailliertere Anleitungen zu geben.
In der Entwurfsphase nutzten die Forscher die Gliederungsrelevanz und die Neuordnung der Textkohärenz aus der Re3-Umschreibungsphase, um zu erkennen, wann das aktuelle Gliederungsprojekt einen Absatz eines Artikels abgeschlossen hat, und um ein frühzeitiges Stoppen basierend auf der Bewertungsschwelle zu erreichen .
Die Gliederung enthält vollständige Einstellungen und relevante Charaktere, und jedes Gliederungselement wird sorgfältig auf Relevanz und Kohärenz im Kontext überprüft.
In der strukturierten Eingabeaufforderung hebt das Modell die aktuellen Einstellungen und Änderungen in den Einstellungen hervor und ruft außerdem Rollenbeschreibungen basierend auf den in der Gliederung erkannten Rollen ab.
Im Gegensatz dazu wählt Re3 während des Entwurfsprozesses dynamisch relevante Charaktere für jedes Segment aus und verfolgt keine Setup-Informationen, was zu unerwarteten Änderungen im Story-Setup führen kann
Der zweite Die Komponente, der detaillierte Controller, sorgt für die Treue zur detaillierten Gliederung, indem sie die Absatzgenerierung auf der Grundlage der entsprechenden Gliederungselemente steuert.
Da die detaillierte Gliederung viele überlappende weiche Einschränkungen auferlegt, muss der detaillierte Controller eine ausreichende Kontrollstärke ausüben. Gleichzeitig muss sich der detaillierte Controller auch an flexible Eingaben in natürlicher Sprache anpassen und bei Verwendung des Stands der Technik generiert werden. Kunst groß angelegte Sprachmodelle.
Also implementierten die Forscher den detaillierten Controller als OPT350m-basierten Controller und entwarfen ein kontrastives Trainingsprogramm, um die Zusammenfassung an das Absatzpräfix anzupassen.
Am wichtigsten ist, dass die Forscher auch viele fließende harte Verneinungen erstellt haben, um zu ermöglichen, dass die generierten Absätze nicht nur zu Beginn, sondern auch durchgehend für das Thema relevant sind.
Im Experiment ist die Eingabe in das Modell nur eine kurze englische Prämisse, normalerweise 30-60 Wörter, und die Ausgabe ist eine vollständige Geschichte.
Die Forscher haben keine weiteren Regelbeschränkungen eingeführt, da die Definition von „Story“ noch nicht klar ist, geschweige denn die Definition von „guter Story“ und die Qualität hauptsächlich auf manuellen Bewertungsindikatoren beruht.
verwendet bei der Bewertung hauptsächlich drei Indikatoren, die eher zum Vergleich von Absätzen als von vollständigen Geschichten geeignet sind:
1. Kohärenz, der Prozentsatz der Absätze, bei denen menschliche Kommentatoren die Handlung für kohärent halten;
2 . Relevanz, der Prozentsatz der Absätze, die den entsprechenden Gliederungseintrag erfüllen
3. Interessantität, der Prozentsatz der Absätze, die als interessant beurteilt werden.
Zu den verglichenen Basismodellen gehören Re3, ROLLING-OPT und ROLLING-GPT.
Wie aus den experimentellen Ergebnissen ersichtlich ist, glauben Annotatoren im Vergleich zu Re3, dass das von DOC generierte Diagramm kohärenter und relevanter für die Gliederung ist und eine höhere Verbesserung aufweist als die ROLLING-Grundlinie.
Und die Ergebnisse bestätigen die Korrektheit des Modelldesigns, d. h. Handlungskohärenz und Gliederungsrelevanz profitieren von der Verlagerung kreativer Arbeit von der Planung auf den Entwurf sowie verbesserte Kontrollmechanismen.
Und überraschenderweise waren die Kommentatoren auch der Meinung, dass die DOC-Absätze deutlich interessanter seien. Die Forscher glaubten, dass dies eine Verbesserung sei, die durch die detaillierteren (ereignisorientierteren) Umrisse erzielt wurde. Weitere Ablationsexperimente unterstützten diese Hypothese ebenfalls.
Die qualitative Analyse ergab jedoch auch, dass das Modell noch viel Raum für weitere Verbesserungen bietet.
Im Gegensatz zu RE3 weicht DOC normalerweise nicht wesentlich von der Gliederung der obersten Ebene ab, während RE3 manchmal fast vollständig vom Thema abweicht, DOC jedoch häufig nicht den Teilen der detaillierten Gliederung auf niedrigerer Ebene folgt.
Es gibt immer noch Probleme mit der internen Konsistenz in DOC und RE3, und gelegentliche Fehler in detaillierten Gliederungen können sich besonders negativ auswirken und zu größeren Kaskadenfehlern während des Entwurfsprozesses führen.
Darüber hinaus sind die Umrisse im DOC oft inkonsistent im Detaillierungsgrad, wobei einige zu vage sind und andere überdehnt wirken.
Darüber hinaus können die vom Modell erkannten Einstellungen und Zeichen manchmal falsch oder unvollständig sein. Das folgende Beispiel zeigt eine stark gekürzte Geschichte, die DOC auf der Grundlage der obigen Gliederung geschrieben hat.
Das obige ist der detaillierte Inhalt vonDas Team von Tian Yuandong hat die zweite Version des DOC von „Long Story Generator' veröffentlicht: Die Kohärenz wurde erheblich verbessert und der Spaß um 20,7 % gesteigert!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!