4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法-人工智慧-PHP中文網

一個視窗不夠，就多開幾個

作者簡介

首頁

科技週邊

人工智慧

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

王林

Oct 24, 2023 pm 08:13 PM

ai 訓練

只有4k視窗長度的大模型，也能閱讀大段文字了！

普林斯頓的華人博士生的一項最新成果，成功「突破」了大模型窗口長度的限制。

不僅能回答各種問題，整個實現的過程全靠prompt就能完成，不需要任何的額外訓練。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

研究團隊創建了一種名為MemWalker的樹狀記憶策略，可以突破模型本身的視窗長度限制。

測驗過程中，模型閱讀的最長文字包含了1.2萬 token，成績相比LongChat大幅提升。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

相比於相似的TreeIndex，MemWalker可以進行推理並回答任何問題，而不是只做概括。

MemWalker的研發利用到了「分而治之」的思想，就此有網友這樣評論：

每次我們讓大模型的思考過程更像人類，它們的表現就會越好

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

那麼，具體什麼是樹狀記憶策略，又是如何用有限的視窗長度閱讀長文本的呢？

一個視窗不夠，就多開幾個

模型上，MemWalker使用Stable Beluga 2作為基本模型，它是Llama 2-70B經過指令調優得到的。

在選擇該模型之前，開發者對比了其與原始Llama 2的表現，並最終確定選用。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

就像MemWalker這個名字一樣，它的工作過程就像記憶流在行走。

具體來看，大致分為記憶樹建構和導航檢索兩個階段。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

建構記憶樹時，長文本會被分割成多個小段（seg1-6），並由大模型分別針對每一段做出總結，得到「葉子節點」（leaf nodes，summ1-6）。

分割時，每段的長度越長，層級就會越少，有利於後續檢索，但其本身過長又會導致準確度下降，因此需要綜合考慮確定每段長度。

作者認為，每一段合理的長度是500-2000token，而實驗中使用的為1000token。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

然後，模型遞歸地將這些葉子節點的內容再次進行總結，形成「非葉節點」(non-leaf nodes，summ7-8）。

二者的另一個差異是，葉子節點包含了原始資訊，非葉節點只有概括得到的二級資訊。

作用上，非葉節點用來導覽定位答案所在的葉子節點，而葉子節點則用來推理出答案。

其中的非葉節點可以有多個層級，模型逐步進行總結概括，直到得到“根節點”，形成完整的樹狀結構。

記憶樹建立完畢後，就可以進入導覽檢索階段來產生答案了。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

這過程中，模型從根節點開始，逐一讀取下一級子節點的內容，然後推論出應該進入這個節點還是返回。

決定進入這個節點之後，再次重複這樣的過程，直到讀取到葉節點。如果葉節點的內容適合則產生答案，否則回傳。

為了確保答案的完整性，這個過程的結束條件並非發現了一個合適的葉節點，而是模型認為得到了完整答案，或達到最大步數。

導航過程中，如果模型發現進入了錯誤的路徑，也可以導航回退。

此外，MemWalker中還引入了工作記憶機制來提高準確度。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

該機制會將已經造訪過的節點內容加入到目前內容的上下文中。

當模型進入一個新節點時，目前節點內容都會被加入記憶中。

這個機制讓模型在每一步都可以利用訪問過的節點內容，避免重要資訊的遺失。

實驗結果顯示，工作記憶機制可以將MemWalker的準確率提升約10%。

而且，上面所說的過程只依靠prompt就能完成，不需要進行額外的訓練。

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

理論上，只要有足夠的算力，MemWalker可以閱讀無限長的文本。

不過，記憶樹建構時的時間和空間複雜度隨著文字長度的增長是指數型的。

作者簡介

論文第一作者是普林斯頓大學NLP實驗室華人博士生Howard Chen。

清華姚班校友陳丹琦是Howard的導師，她今年在ACL上的學術報告也與搜尋有關。

這項成果是Howard在Meta實習期間完成的，Meta AI實驗室的Ramakanth Pasunuru，Jason Weston和Asli Celikyilmaz三位學者也參與了本計畫。

論文網址：https://arxiv.org/abs/2310.05029

以上是4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7538

CakePHP 教程

1380

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

Debian郵件服務器防火牆配置技巧 Apr 13, 2025 am 11:42 AM

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法，包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables（如果尚未安裝）：sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則：sudoiptables-L配置

debian readdir如何與其他工具集成 Apr 13, 2025 am 09:42 AM

Debian系統中的readdir函數是用於讀取目錄內容的系統調用，常用於C語言編程。本文將介紹如何將readdir與其他工具集成，以增強其功能。方法一：C語言程序與管道結合首先，編寫一個C程序調用readdir函數並輸出結果：#include#include#includeintmain(intargc,char*argv[]){DIR*dir;structdirent*entry;if(argc!=2){

debian readdir如何實現文件排序 Apr 13, 2025 am 09:06 AM

在Debian系統中，readdir函數用於讀取目錄內容，但其返回的順序並非預先定義的。要對目錄中的文件進行排序，需要先讀取所有文件，再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序：#include#include#include#include//自定義比較函數，用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

Debian郵件服務器SSL證書安裝方法 Apr 13, 2025 am 11:39 AM

在Debian郵件服務器上安裝SSL證書的步驟如下：1.安裝OpenSSL工具包首先，確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝，可以使用以下命令進行安裝：sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來，使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求（CSR）：openss

Debian OpenSSL如何進行數字簽名驗證 Apr 13, 2025 am 11:09 AM

在Debian系統上使用OpenSSL進行數字簽名驗證，可以按照以下步驟操作：準備工作安裝OpenSSL：確保你的Debian系統已經安裝了OpenSSL。如果沒有安裝，可以使用以下命令進行安裝：sudoaptupdatesudoaptinstallopenssl獲取公鑰：數字簽名驗證需要使用簽名者的公鑰。通常，公鑰會以文件的形式提供，例如public_key.pe

Debian OpenSSL如何防止中間人攻擊 Apr 13, 2025 am 10:30 AM

在Debian系統中，OpenSSL是一個重要的庫，用於加密、解密和證書管理。為了防止中間人攻擊（MITM），可以採取以下措施：使用HTTPS：確保所有網絡請求使用HTTPS協議，而不是HTTP。 HTTPS使用TLS（傳輸層安全協議）加密通信數據，確保數據在傳輸過程中不會被竊取或篡改。驗證服務器證書：在客戶端手動驗證服務器證書，確保其可信。可以通過URLSession的委託方法來手動驗證服務器

Debian Hadoop日誌管理怎麼做 Apr 13, 2025 am 10:45 AM

在Debian上管理Hadoop日誌，可以遵循以下步驟和最佳實踐：日誌聚合啟用日誌聚合：在yarn-site.xml文件中設置yarn.log-aggregation-enable為true，以啟用日誌聚合功能。配置日誌保留策略：設置yarn.log-aggregation.retain-seconds來定義日誌的保留時間，例如保留172800秒（2天）。指定日誌存儲路徑：通過yarn.n

centos關機命令行 Apr 14, 2025 pm 09:12 PM

CentOS 關機命令為 shutdown，語法為 shutdown [選項] 時間 [信息]。選項包括：-h 立即停止系統；-P 關機後關電源；-r 重新啟動；-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

See all articles

4k視窗長度就能讀長文，陳丹琦高徒聯手Meta推出大模型記憶力增強新方法

一個視窗不夠，就多開幾個

作者簡介

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題