目錄
一個視窗不夠,就多開幾個
作者簡介
首頁 科技週邊 人工智慧 4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

Oct 24, 2023 pm 08:13 PM
ai 訓練

只有4k視窗長度的大模型,也能閱讀大段文字了!

普林斯頓的華人博士生的一項最新成果,成功「突破」了大模型窗口長度的限制。

不僅能回答各種問題,整個實現的過程全靠prompt就能完成,不需要任何的額外訓練

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

研究團隊創建了一種名為MemWalker的樹狀記憶策略,可以突破模型本身的視窗長度限制。

測驗過程中,模型閱讀的最長文字包含了1.2萬 token,成績相比LongChat大幅提升。

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

相比於相似的TreeIndex,MemWalker可以進行推理並回答任何問題,而不是只做概括。

MemWalker的研發利用到了「分而治之」的思想,就此有網友這樣評論:

每次我們讓大模型的思考過程更像人類,它們的表現就會越好

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

那麼,具體什麼是樹狀記憶策略,又是如何用有限的視窗長度閱讀長文本的呢?

一個視窗不夠,就多開幾個

模型上,MemWalker使用Stable Beluga 2作為基本模型,它是Llama 2-70B經過指令調優得到的。

在選擇該模型之前,開發者對比了其與原始Llama 2的表現,並最終確定選用。

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

就像MemWalker這個名字一樣,它的工作過程就像記憶流在行走。

具體來看,大致分為記憶樹建構導航檢索兩個階段。

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

建構記憶樹時,長文本會被分割成多個小段(seg1-6),並由大模型分別針對每一段做出總結,得到「葉子節點(leaf nodes,summ1-6)

分割時,每段的長度越長,層級就會越少​​,有利於後續檢索,但其本身過長又會導致準確度下降,因此需要綜合考慮確定每段長度。

作者認為,每一段合理的長度是500-2000token,而實驗中使用的為1000token。

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

然後,模型遞歸地將這些葉子節點的內容再次進行總結,形成「非葉節點(non-leaf nodes,summ7-8)

二者的另一個差異是,葉子節點包含了原始資訊,非葉節點只有概括得到的二級資訊

作用上,非葉節點用來導覽定位答案所在的葉子節點,而葉子節點則用來推理出答案。

其中的非葉節點可以有多個層級,模型逐步進行總結概括,直到得到“根節點”,形成完整的樹狀結構。

記憶樹建立完畢後,就可以進入導覽檢索階段來產生答案了。

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

這過程中,模型從根節點開始,逐一讀取下級子節點的內容,然後推論出應該進入這個節點還是返回。

決定進入這個節點之後,再次重複這樣的過程,直到讀取到葉節點。如果葉節點的內容適合則產生答案,否則回傳。

為了確保答案的完整性,這個過程的結束條件並非發現了一個合適的葉節點,而是模型認為得到了完整答案,或達到最大步數。

導航過程中,如果模型發現進入了錯誤的路徑,也可以導航回退。

此外,MemWalker中還引入了工作記憶機制來提高準確度。

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

該機制會將已經造訪過的節點內容加入到目前內容的上下文中。

當模型進入一個新節點時,目前節點內容都會被加入記憶中。

這個機制讓模型在每一步都可以利用訪問過的節點內容,避免重要資訊的遺失。

實驗結果顯示,工作記憶機制可以將MemWalker的準確率提升約10%。

而且,上面所說的過程只依靠prompt就能完成,不需要進行額外的訓練。

4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

理論上,只要有足夠的算力,MemWalker可以閱讀無限長的文本。

不過,記憶樹建構時的時間和空間複雜度隨著文字長度的增長是指數型的。

作者簡介

論文第一作者是普林斯頓大學NLP實驗室華人博士生Howard Chen。

清華姚班校友陳丹琦是Howard的導師,她今年在ACL上的學術報告也與搜尋有關。

這項成果是Howard在Meta實習期間完成的,Meta AI實驗室的Ramakanth Pasunuru,Jason Weston和Asli Celikyilmaz三位學者也參與了本計畫。

論文網址:https://arxiv.org/abs/2310.05029

以上是4k視窗長度就能讀長文,陳丹琦高徒聯手Meta推出大模型記憶力增強新方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Debian郵件服務器防火牆配置技巧 Debian郵件服務器防火牆配置技巧 Apr 13, 2025 am 11:42 AM

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法,包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables(如果尚未安裝):sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則:sudoiptables-L配置

debian readdir如何與其他工具集成 debian readdir如何與其他工具集成 Apr 13, 2025 am 09:42 AM

Debian系統中的readdir函數是用於讀取目錄內容的系統調用,常用於C語言編程。本文將介紹如何將readdir與其他工具集成,以增強其功能。方法一:C語言程序與管道結合首先,編寫一個C程序調用readdir函數並輸出結果:#include#include#includeintmain(intargc,char*argv[]){DIR*dir;structdirent*entry;if(argc!=2){

debian readdir如何實現文件排序 debian readdir如何實現文件排序 Apr 13, 2025 am 09:06 AM

在Debian系統中,readdir函數用於讀取目錄內容,但其返回的順序並非預先定義的。要對目錄中的文件進行排序,需要先讀取所有文件,再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序:#include#include#include#include//自定義比較函數,用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

Debian郵件服務器SSL證書安裝方法 Debian郵件服務器SSL證書安裝方法 Apr 13, 2025 am 11:39 AM

在Debian郵件服務器上安裝SSL證書的步驟如下:1.安裝OpenSSL工具包首先,確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝,可以使用以下命令進行安裝:sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來,使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求(CSR):openss

Debian OpenSSL如何進行數字簽名驗證 Debian OpenSSL如何進行數字簽名驗證 Apr 13, 2025 am 11:09 AM

在Debian系統上使用OpenSSL進行數字簽名驗證,可以按照以下步驟操作:準備工作安裝OpenSSL:確保你的Debian系統已經安裝了OpenSSL。如果沒有安裝,可以使用以下命令進行安裝:sudoaptupdatesudoaptinstallopenssl獲取公鑰:數字簽名驗證需要使用簽名者的公鑰。通常,公鑰會以文件的形式提供,例如public_key.pe

Debian OpenSSL如何防止中間人攻擊 Debian OpenSSL如何防止中間人攻擊 Apr 13, 2025 am 10:30 AM

在Debian系統中,OpenSSL是一個重要的庫,用於加密、解密和證書管理。為了防止中間人攻擊(MITM),可以採取以下措施:使用HTTPS:確保所有網絡請求使用HTTPS協議,而不是HTTP。 HTTPS使用TLS(傳輸層安全協議)加密通信數據,確保數據在傳輸過程中不會被竊取或篡改。驗證服務器證書:在客戶端手動驗證服務器證書,確保其可信。可以通過URLSession的委託方法來手動驗證服務器

Debian Hadoop日誌管理怎麼做 Debian Hadoop日誌管理怎麼做 Apr 13, 2025 am 10:45 AM

在Debian上管理Hadoop日誌,可以遵循以下步驟和最佳實踐:日誌聚合啟用日誌聚合:在yarn-site.xml文件中設置yarn.log-aggregation-enable為true,以啟用日誌聚合功能。配置日誌保留策略:設置yarn.log-aggregation.retain-seconds來定義日誌的保留時間,例如保留172800秒(2天)。指定日誌存儲路徑:通過yarn.n

centos關機命令行 centos關機命令行 Apr 14, 2025 pm 09:12 PM

CentOS 關機命令為 shutdown,語法為 shutdown [選項] 時間 [信息]。選項包括:-h 立即停止系統;-P 關機後關電源;-r 重新啟動;-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

See all articles