


L'équipe de Tian Yuandong a sorti la deuxième version du DOC de « Long Story Generator » : la cohérence a été grandement améliorée, et le plaisir a augmenté de 20,7 % !
Il y a quelque temps, l'équipe du Dr Tian Yuandong a publié un cadre de générateur d'histoires Re3 (Recursive Reprompting and Revision) basé sur un modèle de langage à grande échelle lors de l'EMNLP2022. En concevant des invites, le modèle peut générer des histoires cohérentes sans avoir besoin d'affiner. Ajustez le grand modèle. Des histoires allant jusqu’à 7 500 mots peuvent être générées.
Récemment, l'équipe d'auteurs de Re3 a publié la deuxième version du cadre de génération d'histoires longuesDOC (Detailed Outline Control), qui utilise un plan hiérarchique pour décrire l'histoire plus en détail et utilise un OPT affiné. -Le modèle 350m effectue une continuation plus cohérente du contenu généré. En revanche, les évaluations humaines ont évalué DOC comme plus capable d'écrire que la génération précédente Re3.
Lien papier : https://arxiv.org/abs/2212.10077
Lien papier : https://github.com/yangkevin2/doc-story-generation
DOC est composé de deux éléments complémentaires :
1. Outliner détailléCréer un plan plus détaillé et structuré de manière hiérarchique qui sépare le travail créatif du processus de rédaction principal. Passer à l'étape de planification
2. contrôleur garantit que des plans plus détaillés peuvent toujours jouer un rôle dans le processus de génération en contrôlant les paragraphes de l'histoire pour qu'ils soient cohérents avec les détails du plan.
Dans l'évaluation humaine des histoires générées automatiquement, DOC a réalisé un gain absolu de 22,5 % en cohérence de l'intrigue, une augmentation de 28,2 % en pertinence des grandes lignes et une augmentation de 20,7 % en intérêt, ce qui était nettement meilleur que la référence Re3 précédente. modèle, et les évaluateurs humains pensent également que DOC est plus facile à contrôler dans un environnement de production interactif.
Kevin Yang, le premier auteur de l'article, est un doctorant de quatrième année à l'Université de Californie à Berkeley. Son principal intérêt de recherche est la génération de texte en langage naturel contrôlable dans des contextes structurés, comme l'utilisation de méthodes structurées de contrôle. génération pour améliorer la cohérence textuelle du texte.
Le deuxième auteur, le Dr Tian Yuandong, est chercheur et cadre supérieur au Meta Artificial Intelligence Research Institute. Ses intérêts de recherche incluent l'apprentissage par renforcement profond et son application dans les jeux, ainsi que l'analyse théorique des modèles d'apprentissage profond. Il a obtenu sa licence et sa maîtrise à l'Université Jiao Tong de Shanghai en 2005 et 2008, et son doctorat à l'Institut de robotique de l'Université Carnegie Mellon aux États-Unis en 2013.
DOC FrameworkAvec le développement continu de la technologie du langage naturel, la compréhension des textes courts par des modèles linguistiques à grande échelle se rapproche progressivement du goulot d'étranglement, et les gens s'intéressent progressivement à la génération de textes plus longs, par exemple en générant des milliers de mots à la fois.
Par rapport aux tâches de génération de texte court, le texte long contient également plus de contenu et de restrictions. Le modèle doit maintenir une cohérence globale, une cohérence factuelle à long terme, et également maintenir sa pertinence par rapport à la prémisse ou au plan de sortie de l'utilisateur.
Par rapport aux humains, les systèmes de génération d'histoires comme Re3 présentent encore des lacunes sur de nombreux aspects, comme l'incapacité de garantir la cohérence de l'intrigue sur de longues distances, des incohérences globales, un contenu de l'histoire s'écartant du plan établi, etc.
Pour combler cette lacune, le cadre de contrôle des grandes lignes détaillées (DOC) améliore la cohérence à long terme grâce à deux approches complémentaires tout en réutilisant la structure de planification-rédaction-révision de haut niveau de Re3.
Detailed Outliner
Tout d'abord, le plan détaillé affine un court plan initial en un plan hiérarchique plus détaillé. La raison de cette conception est que les auteurs humains peuvent rédiger un long document avant de l'affiner et de l'étendre de manière itérative. un bref aperçu initial.
Plutôt que d'improviser de nouveaux points d'intrigue, un écrivain peut planifier une intrigue globale cohérente au stade de l'esquisse de haut niveau, en utilisant un aperçu élargi pour fournir des conseils plus détaillés pendant le processus de rédaction.
Au cours de la phase de rédaction, les chercheurs ont réutilisé la réorganisation de la pertinence du plan et de la cohérence du texte de l'étape de réécriture Re3 pour détecter quand le projet de plan en cours a terminé un paragraphe d'article et obtenir un arrêt précoce en fonction du seuil de score.
Il y a des paramètres complets et des caractères pertinents dans le plan, et chaque élément du plan est soigneusement examiné pour sa pertinence et sa cohérence dans son contexte.
Dans l'invite structurée, le modèle met en évidence les paramètres actuels, les modifications apportées aux paramètres et récupère également les descriptions de rôle en fonction des rôles détectés dans le plan.
En revanche, Re3 sélectionne dynamiquement les personnages pertinents pour chaque segment pendant le processus de rédaction et ne suit pas les informations de configuration, ce qui peut entraîner des changements inattendus dans la configuration de l'histoire
Contrôleur détaillé
Le deuxième Le composant, le contrôleur détaillé, maintient la fidélité au plan détaillé en contrôlant la génération de paragraphes en fonction des éléments de plan correspondants.
Étant donné que le plan détaillé impose de nombreuses contraintes souples qui se chevauchent, le contrôleur détaillé doit exercer une force de contrôle suffisante. Dans le même temps, le contrôleur détaillé doit également s'adapter à une saisie flexible en langage naturel et être généré lors de l'utilisation de l'état de l'art. des modèles de langage artistiques à grande échelle.
Les chercheurs ont donc implémenté le contrôleur détaillé en tant que contrôleur basé sur OPT350m et ont conçu un programme de formation contrasté pour aligner le résumé sur le préfixe du paragraphe.
Plus important encore, les chercheurs ont également construit de nombreux négatifs durs et fluides pour que les paragraphes générés soient pertinents non seulement par rapport au sujet au début, mais également tout au long.
Partie expérimentale
Dans l'expérience, l'entrée dans le modèle n'est qu'une courte prémisse en anglais, généralement de 30 à 60 mots, et la sortie est une histoire complète.
Les chercheurs n'ont pas imposé plus de contraintes réglementaires car la définition de « histoire » n'est pas encore claire, encore moins la définition de « bonne histoire », et la qualité repose principalement sur des indicateurs d'évaluation manuels.
utilise principalement trois indicateurs en évaluation, qui sont plus adaptés pour comparer des paragraphes plutôt que des histoires complètes :
1 Cohérence, le pourcentage de paragraphes où les annotateurs humains jugent que l'intrigue est cohérente ; 2 .
Pertinence, le pourcentage de paragraphes jugés conformes à l'entrée de plan correspondante ; 3
Intérêt, le pourcentage de paragraphes jugés intéressants. Les modèles de base comparés incluent Re3, ROLLING-OPT et ROLLING-GPT.
Comme le montrent les résultats expérimentaux, par rapport à Re3, les annotateurs estiment que le tracé généré par DOC est plus cohérent, plus pertinent par rapport au plan et présente une amélioration plus élevée que la ligne de base ROLLING.
Et les résultats confirment l'exactitude de la conception du modèle, c'est-à-dire que la cohérence de l'intrigue et la pertinence des contours bénéficient du déplacement du travail créatif de la planification à la rédaction, ainsi que de mécanismes de contrôle améliorés.
Et étonnamment, les annotateurs pensaient également que les paragraphes DOC étaient significativement plus intéressants. Les chercheurs pensaient qu'il s'agissait d'une amélioration apportée par les contours plus détaillés (plus basés sur les événements). D'autres expériences d'ablation ont également soutenu cette hypothèse.
Cependant, l'analyse qualitative a également révélé que le modèle dispose encore d'une énorme marge d'amélioration.
Contrairement à RE3, DOC ne s'écarte généralement pas de manière significative du plan de niveau supérieur, tandis que RE3 s'éloigne parfois presque complètement du sujet, mais DOC ne parvient souvent pas à suivre les parties de niveau inférieur du plan détaillé.
Il existe encore des problèmes de cohérence interne dans DOC et RE3, et des erreurs occasionnelles dans les grandes lignes détaillées peuvent avoir un impact particulièrement négatif, conduisant à des erreurs en cascade plus importantes au cours du processus de rédaction.
De plus, les grandes lignes du DOC sont souvent incohérentes en termes de niveau de détail, certaines étant trop vagues et d'autres semblant trop développées.
De plus, les paramètres et les personnages détectés par le modèle peuvent parfois être incorrects ou incomplets, et l'exemple ci-dessous montre une histoire fortement abrégée écrite par DOC sur la base du plan ci-dessus.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Après des tests réels, le générateur de photos AI ID a bien fonctionné et ses fonctions puissantes sont étonnantes. Vous n'avez vraiment plus à vous soucier de prendre des photos ! Cette phrase est réécrite comme suit : Utilisez le logiciel Chuzhan AI (les droits d'auteur et d'interprétation appartiennent à Chuzhan AI et ne sont utilisés que pour montrer l'effet généré) en mode croquis : Que ce soit dans le travail quotidien ou dans un bureau d'affaires, l'image professionnelle est cruciale. Une belle photo d’identité peut valoriser son image professionnelle. Les photos d'identité générées par l'IA répondent non seulement aux normes photographiques traditionnelles, mais peuvent également restaurer les traits uniques du visage d'une personne. La technologie IA peut identifier intelligemment les contours du visage, la couleur de la peau, l'éclairage et d'autres détails pour générer la photo d'identité la plus appropriée. Qu'il s'agisse de l'apparence ou du tempérament, il peut être parfaitement affiché et laisser une première impression profonde aux gens. L'IA génère des photos d'identité en un seul clic.

Comment rédiger un générateur simple de rapports sur les performances des étudiants en utilisant Java ? Student Performance Report Generator est un outil qui aide les enseignants ou les éducateurs à générer rapidement des rapports sur les performances des élèves. Cet article explique comment utiliser Java pour rédiger un simple générateur de rapports sur les performances des étudiants. Tout d’abord, nous devons définir l’objet étudiant et l’objet note étudiant. L'objet étudiant contient des informations de base telles que le nom et le numéro de l'étudiant, tandis que l'objet score de l'étudiant contient des informations telles que les résultats des matières et la note moyenne de l'étudiant. Voici la définition d'un objet étudiant simple : public

Si vous êtes impatient de trouver le meilleur générateur gratuit d'art d'animation IA, vous pouvez mettre fin à votre recherche. Le monde de l’art anime captive le public depuis des décennies avec ses personnages uniques, ses couleurs captivantes et ses intrigues captivantes. Cependant, créer de l’art anime nécessite du talent, des compétences et beaucoup de temps. Cependant, avec le développement continu de l'intelligence artificielle (IA), vous pouvez désormais explorer le monde de l'art d'animation sans avoir à vous plonger dans des technologies complexes à l'aide du meilleur générateur d'art d'animation IA gratuit. Cela vous ouvrira de nouvelles possibilités pour libérer votre créativité. Qu'est-ce qu'un générateur d'art anime IA ? L'AI Animation Art Generator utilise des algorithmes sophistiqués et des techniques d'apprentissage automatique pour analyser une vaste base de données d'œuvres d'animation. Grâce à ces algorithmes, le système apprend et identifie différents styles d'animation

Comment écrire un simple générateur de code QR via PHP Les codes QR sont devenus très courants dans la société moderne. Ils peuvent transmettre rapidement des informations et améliorer l'expérience utilisateur. Dans cet article, je vais vous présenter comment écrire un simple générateur de code QR en utilisant PHP. 1. Installez les outils et bibliothèques nécessaires Avant de commencer, nous devons nous assurer que les outils et bibliothèques suivants ont été installés : PHP : Assurez-vous que la dernière version de PHP est installée. Vous pouvez vérifier la version actuelle de PHP en exécutant le fichier php. Commande -v. Compositeur : C

Le concept de générateur (Generator) a été introduit dans PHP7, qui fournit une méthode pour gérer efficacement de grandes quantités de données et le chargement paresseux. Cet article commencera par des concepts et des principes, combinés à des exemples de code spécifiques, pour présenter l'utilisation et les avantages des générateurs en PHP7. Un générateur est une fonction spéciale qui, au lieu de renvoyer toutes les données en même temps, génère des données à la demande. Lorsque la fonction exécute l'instruction rendement, la valeur actuellement générée sera renvoyée et l'état de la fonction sera enregistré. La prochaine fois que la fonction génératrice sera appelée, la fonction

Générateurs en PHP7 : Comment gérer efficacement des données à grande échelle et économiser de la mémoire ? Présentation : PHP7 présente les générateurs comme un outil puissant en termes de traitement de données à grande échelle et d'économie de mémoire. Les générateurs sont un type spécial de fonction dans le langage PHP. Contrairement aux fonctions ordinaires, les générateurs peuvent suspendre l'exécution et renvoyer des résultats intermédiaires au lieu de renvoyer tous les résultats en même temps. Cela rend le générateur idéal pour traiter de gros lots de données, réduisant ainsi l'utilisation de la mémoire et améliorant l'efficacité du traitement. Cet article présentera aux étudiants

Une fois ChatGPT connecté à Internet, OpenAI a également rapidement introduit un générateur de code. Avec la prise en charge de ce plug-in, ChatGPT peut même générer son propre modèle d'apprentissage automatique. Vendredi dernier, OpenAI vient d'annoncer la nouvelle choquante selon laquelle ChatGPT peut se connecter à Internet et se connecter à des plug-ins tiers ! En plus des plug-ins tiers, OpenAI a également introduit son propre plug-in « Code Interpreter » et a proposé plusieurs cas d'utilisation particuliers : résolution de problèmes mathématiques quantitatifs et qualitatifs ; analyse et visualisation de données et conversion rapide de formats de fichiers ; De plus, Greg Brockman a démontré que ChatGPT peut également traiter les fichiers vidéo téléchargés. Et un auteur à succès nommé Andrew Mayne

Quelle est la différence entre les itérateurs et les générateurs en Python ? En programmation Python, les itérateurs et les générateurs sont des outils utilisés pour traiter des objets itérables. Les deux peuvent être utilisés pour parcourir des données, mais il existe quelques différences dans la mise en œuvre. Un itérateur est un objet qui implémente le protocole itérateur. L'objet itérateur doit contenir deux méthodes : __iter__() et __next__(). Que
