田淵棟團隊發表「長故事產生器」第二版DOC:連貫性大幅提升,趣味性提升20.7%!
前段時間田淵棟博士團隊在EMNLP2022上發布了一個基於大規模語言模型的故事生成器Re3(Recursive Reprompting and Revision)框架,透過設計prompt讓模型生成一致性強的故事,完全不需要微調大模型,最長可以產生7500字的故事。
最近Re3的作者團隊又發布了第二版長故事生成框架DOC(Detailed Outline Control),使用層次化的大綱(outline)對故事進行更細節的描繪,並使用微調後的OPT-350m模型對生成的內容進行更連貫的續寫,相較之下,人類評估後認為DOC比上一代Re3的寫作能力更強。
論文連結:https://arxiv.org/abs/2212.10077
論文連結:https://github.com/yangkevin2/doc-story-generation
DOC由兩個互補的組件組成:
1. 詳細大綱產生器(detailed outliner)可以創建一個更詳細的、分層結構的大綱,將創造性的工作從主起草(drafting)過程轉移到規(planning)劃階段;
2. 詳細的控制器(detailed controller)透過控制故事段落與大綱細節保持一致,確保更詳細的大綱在生成過程中仍能發揮作用。
在自動生成故事的人類評估中,DOC 在情節一致性上取得22.5%的絕對增益,大綱相關性提升28.2%,趣味性提升20.7%,大大優於先前的Re3基線模型,人類評估者也認為DOC在互動式生成環境中更容易控制。
文章的第一作者Kevin Yang是加州大學柏克萊分校的四年級博士生,主要研究興趣為結構化設定下的可控自然語言文本生成,如利用可控產生的結構化方法來改善長篇文本的一致性。
第二作者田淵棟博士是Meta人工智慧研究院研究員、高級經理,其研究方向為深度增強學習及其在遊戲中的應用,以及深度學習模型的理論分析。先後於2005年及2008年取得上海交通大學本碩學位,2013年獲得美國卡內基美隆大學機器人研究所博士學位。
DOC框架
隨著自然語言技術的不斷發展,大規模語言模型對於短文本的理解逐漸接近瓶頸,人們對產生更長的文本逐漸產生興趣,例如一次產生數千個單字。
與短文本生成任務相比,長文本包含的內容和限制也更多,模型需要保持總體一致性,長期事實一致性,還要保持與用戶輸出的前提或計劃保持相關性。
與人類相比,像Re3這樣的故事生成系統在許多方面仍然存在不足,例如無法保證長距離下的劇情連貫性,全局不一致,故事內容偏離設定的計劃等。
為了彌補這一差距,詳細大綱控制(DOC)框架在重複使用Re3的高層規劃起草修訂(panning-drafting-revision)結構的同時,透過兩種互補的方法提高了長期一致性。
詳細大綱
#首先,detailed outliner將一個簡短的初始大綱細化為一個更詳細、層次化的大綱,這樣設計的原因是人類作者可能在起草一份長文檔之前迭代地細化和擴展一個簡短的初始大綱。
與即興創作新的情節點相比,作者可能會在高層次大綱階段規劃一個連貫的總體情節,使用擴展的大綱在起草過程中提供更詳細的指導。
在起草階段,研究人員重用了Re3重寫階段的大綱相關性和文字連貫性重新排序,以偵測目前大綱專案何時完成了一段文章,並基於分數閾值實現提前停止。
大綱中有完整的設定和相關的角色,每個大綱項目都經過仔細篩選,以確保上下文中的相關性和連貫性。
在結構化prompt中,模型會反白顯示目前設定、設定中的更改,也會根據大綱中偵測到的角色檢索角色描述。
相比之下,Re3在起草過程中為每一段動態選擇相關角色,並且不追蹤設定訊息,這可能會導致故事設定發生意外變更
詳細控制器
第二個元件詳細控制器(detailed controller)透過基於對應的大綱項目控制段落生成來保持對詳細大綱的忠實性。
因為詳細大綱強加了許多重疊的軟約束,所以詳細控制器必須施加足夠的控制強度,同時詳細控制器還必須適應靈活的自然語言輸入,並在使用最先進的大型語言模型生成時具有計算效率。
所以研究人員將詳細控制器實作為基於OPT350m的控制器,設計了一個對比訓練程序,將摘要與段落前綴對齊。
最關鍵的是,研究者也建構了許多流暢的硬負例(fluent hard negatives),以促進產生的段落不僅在開始時與主題相關,而且貫穿始終。
實驗部分
在實驗中,模型的輸入只是一個簡短的英語前提(premise),通常30-60個單詞,輸出是一個完整的故事。
研究人員沒有施加更多規則上的約束,因為「故事」的定義還不明確,更不用說定義「好故事」了,品質好壞主要依賴人工評估指標。
在評估上主要使用三個指標,更適用於比較段落而非完整的故事:
1. #連貫性,人類標註員判斷情節連貫的段落百分比;
2. 相關性,被判斷為符合對應大綱條目的段落百分比;
3. 趣味性,被認為有趣的段落百分比。
對比的基準模型包括Re3, ROLLING-OPT和ROLLING-GPT。
在實驗結果可以看到,與Re3相比,標註人員認為DOC產生的情節更為連貫,與大綱更相關,相比ROLLING基線提升更高。
並且結果證實了模型設計的正確性,即劇情連貫性和大綱相關性得益於將創意工作從規劃轉向起草,以及改進的控制機制。
而且令人意外的是,標註人員也認為DOC的段落明顯更有趣,研究人員認為這是更詳細(更具事件性)大綱帶來的進步,進一步的消融實驗也支持了這一假設。
不過定性分析也揭示了模型仍有進一步改進的巨大空間。
與RE3不同的是,DOC通常不會嚴重偏離頂層大綱,而RE3有時幾乎完全偏離主題,但DOC通常無法遵循詳細大綱的較低層次部分。
DOC和RE3中的內部一致性仍然存在問題,詳細大綱中偶爾出現的錯誤可能會造成特別大的負面影響,從而在起草過程中導致更大的級聯錯誤。
此外,DOC中的大綱往往在細節層次上不一致,有些過於模糊,而另一些似乎過於展開(over-expanded)。
此外,模型偵測到的設定和角色有時也會不正確或不完整,下面的例子顯示了DOC根據上述大綱所寫的一篇刪節嚴重的故事。
以上是田淵棟團隊發表「長故事產生器」第二版DOC:連貫性大幅提升,趣味性提升20.7%!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

經過實際測試,AI證件照產生器表現出色,其強大的功能令人驚嘆,確實不需要再費心去拍照了!本句話的重寫如下:使用觸站AI軟體(版權和解釋權歸觸站AI所有,僅用於展示生成效果)素描模式:無論是在日常工作還是商務辦公場合,職業形像都至關重要。而一張精美的證件照能夠提升個人的專業形象。透過AI產生的證件照不僅符合傳統照片標準,也能夠還原個人獨特的臉部特徵。 AI技術能夠智慧辨識臉部輪廓、膚色、光線等各種細節,產生最適合的證件照。不論是顏值還是氣質,都能夠完美展現,給人留下深刻的第一印象AI一鍵生成證件照的

如何使用Java來寫一個簡單的學生成績報表產生器?學生成績報表產生器是可以幫助老師或教育者快速產生學生成績報告的工具。本文將介紹如何使用Java來撰寫簡單的學生成績報表產生器。首先,我們要定義學生對象和學生成績對象。學生對象包含學生的姓名、學號等基本訊息,而學生成績對象則包含學生的科目成績和平均成績等資訊。以下是一個簡單的學生物件的定義:public

如果您渴望找到頂尖的免費AI動畫藝術生成器,您可以結束搜尋了。動漫藝術世界幾十年來一直以其獨特的角色設計、迷人的色彩和引人入勝的情節吸引觀眾。不過,創作動漫藝術需要天份、技能和耗費大量時間。然而,隨著人工智慧(AI)的不斷發展,現在你可以藉助最佳的免費AI動畫藝術生成器,無需深入了解複雜技術,就能探索動漫藝術的世界。這將為你釋放創造力提供新的可能性。什麼是人工智慧動漫藝術生成器? AI動畫藝術生成器利用複雜的演算法和機器學習技術,分析廣泛的動畫作品資料庫。透過這些演算法,系統學習並識別不同動漫風格的

如何透過PHP編寫一個簡單的二維碼產生器二維碼在現代社會中已經變得非常常見,它能夠快速傳遞訊息,提升使用者體驗。在本文中,我將向大家介紹如何使用PHP來寫一個簡單的二維碼產生器。一、安裝必要的工具和函式庫在開始之前,我們需要確保已經安裝以下工具和函式庫:PHP:確保已經安裝了PHP的最新版本,可以透過執行php-v指令來查看目前PHP的版本。 Composer:C

PHP7中引入了生成器(Generator)這個概念,它提供了一種有效率地處理大量資料和延遲載入的方法。本文將從概念和原理入手,結合具體程式碼範例,介紹PHP7中生成器的使用方法和優勢。生成器是一種特殊的函數,它不是一次性地將所有資料傳回,而是按需產生資料。當函數執行到yield語句時,會將目前產生的值傳回,並且函數的狀態會被儲存。下次呼叫生成器函數時,函數會

PHP7中的生成器:如何有效率地處理大規模資料和節省記憶體?概述:在大規模資料處理和節省記憶體方面,PHP7引入了生成器(Generators)作為一種強大的工具。生成器是PHP語言中一類特殊的函數,與普通函數不同的是,生成器可以暫停執行並傳回中間結果,而不是將所有結果一次傳回。這使得生成器非常適合處理大批量數據,降低了記憶體的使用和提高了處理效率。本文將介紹生

ChatGPT可以連網後,OpenAI還火速介紹了一款程式碼產生器,在這個插件的加持下,ChatGPT甚至可以自己生成機器學習模型了。上週五,OpenAI剛剛宣布了令人驚爆的消息,ChatGPT可以連網,接入第三方插件了!而除了第三方插件,OpenAI也介紹了一款自家的插件「程式碼解釋器」,並給出了幾個特別的用例:解決定量和定性的數學問題;進行資料分析和視覺化;快速轉換檔案格式。此外,Greg Brockman演示了ChatGPT還可以處理上傳視訊檔案。而一位叫Andrew Mayne的暢銷作

Python中的迭代器和生成器的差別是什麼?在Python程式設計中,迭代器(iterator)和生成器(generator)都是用來處理可迭代物件的工具。它們兩者都可以用於遍歷數據,但是在實現上卻有一些不同之處。迭代器是一個對象,它實作了迭代器協定(iteratorprotocol)。迭代器物件需要包含兩個方法:__iter__()和__next__()。其
