首頁 科技週邊 人工智慧 清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

Mar 26, 2024 pm 06:36 PM
微軟 研究

在自然語言處理中,有許多資訊其實是重複的。

如果能將提示詞有效壓縮,某種程度上也相當於擴大了模型支援上下文的長度。

現有的資訊熵方法是透過刪除某些單字或短語來減少這種冗餘。

然而,基於資訊熵的計算僅涵蓋了文本的單向上下文,可能會忽略壓縮所需的關鍵資訊;而且,資訊熵的計算方式並非完全符合壓縮提示詞的實際目的。

為了迎接這些挑戰,清華大學和微軟的研究人員共同提出了一項全新的資料處理流程,名為LLMLingua-2。其旨在從大型語言模型(LLM)中提取知識,透過壓縮提示詞實現資訊的精煉,同時確保關鍵資訊不會遺失。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

專案在GitHub上已經斬獲3.1k星

結果顯示,LLMLingua-2可以將文字長度大幅縮減至最初的20%,有效減少了處理時間和成本。

此外,與先前版本LLMLingua以及其他類似技術相比,LLMLingua 2的處理速度提高了3到6倍。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

論文網址:https://arxiv.org/abs/2403.12968

在這個過程中,原始文字首先被輸入模型。

模型會評估每個字的重要性,決定要保留還是刪除,同時也會考慮到字詞之間的關係。

最終,模型會選擇那些評分最高的詞彙組成一個更簡短的提示詞。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

團隊在包括MeetingBank、LongBench、ZeroScrolls、GSM8K和BBH在內的多個資料集上測試了LLMLingua-2模型。

儘管這個模型體積不大,但它在基準測試中取得了顯著的性能提升,並且證明了其在不同的大語言模型(從GPT-3.5到Mistral- 7B)和語種(從英語到中文)上具有出色的泛化能力。

系統提示:

#身為傑出的語言學家,你擅長將較長的文段壓縮成簡短的表達方式,方法是去除那些不重要的詞彙,同時盡可能保留訊息。

使用者提示:

#請將給定的文字壓縮成簡短的表達形式,使得你(GPT-4)能盡可能準確地還原原文。有別於常規的文本壓縮,我需要你遵循以下五個條件:

1. 只移除那些不重要的詞彙。

2. 保持原始詞彙的順序不變。

3. 保持原始詞彙不變。

4. 不使用任何縮寫或表情符號。

5. 不加入任何新的詞彙或符號。

請盡可能地壓縮原文,同時保留盡可能多的資訊。如果你明白了,請對以下文字進行壓縮:{待壓縮文字}

壓縮後的文字是:[...]

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

結果顯示,在問答、摘要撰寫和邏輯推理等多種語言任務中,LLMLingua-2都顯著優於原有的LLMLingua模型和其他選擇性上下文策略。

值得一提的是,這種壓縮方法對於不同的大語言模型(從GPT-3.5到Mistral-7B)和不同的語言(從英語到中文)同樣有效。

而且,只要兩行程式碼,就可以實現LLMLingua-2的部署。

目前,該模型已經被整合到了廣泛使用的RAG框架LangChain和LlamaIndex當中。

實作方法

為了克服現有基於資訊熵的文字壓縮方法所面臨的問題,LLMLingua-2採取了一種創新的數據提煉策略。

這項策略透過從GPT-4這樣的大語言模型中抽取精華訊息,實現了在不損失關鍵內容和避免添加錯誤訊息的前提下,對文字進行高效壓縮。

提示設計

#要充分利用GPT-4的文字壓縮潛力,關鍵在於如何設定精確的壓縮指令。

也就是在壓縮文本時,指導GPT-4只移除那些在原始文本中不那麼重要的詞彙,同時避免在過程中引入任何新的詞彙。

這樣做的目的是為了確保壓縮後的文字盡可能地保持原文的真實性和完整性。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

標註與篩選

#研究人員利用了從GPT-4等大語言模型中提煉出的知識,發展了一種新穎的資料標註演算法。

這個演算法能夠對原文中的每一個詞彙進行標註,明確指出在壓縮過程中哪些詞彙是必須保留的。

為了保證所建立資料集的高質量,他們也設計了兩種品質監控機制,專門用來識別並排除那些品質不佳的資料樣本。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

#壓縮器

#最後,研究人員將文字壓縮的問題轉換為了一個對每個詞彙(Token)進行分類的任務,並採用了強大的Transformer作為特徵提取器。

這個工具能夠理解文本的前後關係,從而精確地抓取對於文字壓縮至關重要的資訊。

透過在精心建構的資料集上進行訓練,研究人員的模型能夠根據每個詞彙的重要性,計算出一個機率值來決定這個詞彙是應該被保留在在最終的壓縮文本中,還是應該被捨棄。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

性能評估

#研究人員在一系列任務上測試了LLMLingua-2的效能,這些任務包括上下文學習、文字摘要、對話生成、多文件和單文檔問答、代碼生成以及合成任務,既包括了域內的資料集也包括了域外的資料集。

測試結果顯示,研究人員的方法在保持高效能的同時,減少了最小的效能損失,並且在任務不特定的文字壓縮方法中表現突出。

- 域內測試(MeetingBank)

#研究者將LLMLingua-2在MeetingBank測試集上的表現與其他強大的基線方法進行了比較。

儘管他們的模型規模遠小於基線中使用的LLaMa-2-7B,但在問答和文本摘要任務上,研究人員的方法不僅大幅提升了性能,而且與原始文字提示的表現相差無幾。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

- 域外測試(LongBench、GSM8K和BBH)

考慮到研究人員的模型僅在MeetingBank的會議記錄資料上進行了訓練,研究人員進一步探索了其在長文本、邏輯推理和上下文學習等不同場景下的泛化能力。

值得一提的是,儘管LLMLingua-2只在一個資料集上訓練,但在域外的測試中,它的表現不僅與當前最先進的任務不特定壓縮方法相媲美,甚至在某些情況下還有過之而無不及。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

即使是研究人員的較小模型(BERT-base大小),也能達到與原始提示相當的性能,在某些情況下甚至略高於原始提示。

雖然研究人員的方法取得了可喜的成果,但與其他任務感知壓縮方法(如Longbench上的LongLLMlingua)相比,研究人員的方法仍有不足。

研究人員將這種表現差距歸因於它們從問題中獲得的額外資訊。不過,研究人員的模型具有與任務無關的特點,因此在不同場景中部署時,它是一種具有良好通用性的高效選擇。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

上表4列出了使用Mistral-7Bv0.1 4作為目標LLM的不同方法的結果。

與其他基準方法相比,研究人員的方法在表現上有明顯的提升,展示了其在目標LLM上良好的泛化能力。

值得注意的是,LLMLingua-2的效能甚至優於原始提示。

研究者推測,Mistral-7B在管理長上下文的能力可能不如GPT-3.5-Turbo。

研究人員的方法透過提供資訊密度更高的短提示,有效提高了 Mistral7B 的最終推理效能。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

上表5顯示了不同系統在不同壓縮比的V100-32G GPU上的延遲。

結果表明,與其他壓縮方法相比,LLMLingua2的計算開銷要小得多,可以實現1.6倍到2.9倍的端到端速度提升。

此外,研究人員的方法還能將GPU記憶體成本降低8倍,進而降低硬體資源的需求。

上下文意識觀察 研究人員觀察到,隨著壓縮率的增加,LLMLingua-2可以有效地保持與完整上下文相關的資訊量最大的單字。

這要歸功於雙向上下文感知特徵提取器的採用,以及明確朝著及時壓縮目標進行優化的策略。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

研究人員觀察到,隨著壓縮率的增加,LLMLingua-2可以有效地保持與完整上下文相關的資訊量最大的單字。

這要歸功於雙向上下文感知特徵提取器的採用,以及明確朝著及時壓縮目標進行優化的策略。

清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星

最後研究者讓GPT-4 從 LLMLingua-2壓縮提示中重構原始提示音。

結果表明,GPT-4可以有效地重建原始提示,這表明在LLMLingua-2壓縮過程中並沒有遺失基本資訊。

以上是清華微軟開源全新提示字壓縮工具,長度驟降80%! GitHub怒砍3.1K顆星的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1665
14
CakePHP 教程
1424
52
Laravel 教程
1321
25
PHP教程
1269
29
C# 教程
1249
24
微軟bing國際版入口地址(bing搜尋引擎入口) 微軟bing國際版入口地址(bing搜尋引擎入口) Mar 14, 2024 pm 01:37 PM

  必應(Bing)是微軟公司推出的網路搜尋引擎,搜尋功能非常強大,分了國內版和國際版兩個入口。這兩個版本入口在哪呢?怎麼訪問國際版呢?下面就來看看詳細內容。  必應中國版網址入口:https://cn.bing.com/  必應國際版網址入口:https://global.bing.com/  必應國際版怎麼存取?  1、先輸入開啟必應的網址入口:https://www.bing.com/  2、可以看到有國內版跟國際版的選項,我們只需要選擇國際版,輸入關鍵字即可。

微軟發布 Win11 八月累積更新:提高安全性、優化鎖定螢幕等 微軟發布 Win11 八月累積更新:提高安全性、優化鎖定螢幕等 Aug 14, 2024 am 10:39 AM

本站8月14日訊息,在今天的8月補丁星期二活動日中,微軟發布了適用於Windows11系統的累積更新,包括針對22H2和23H2的KB5041585更新,面向21H2的KB5041592更新。上述設備安裝8月累積更新之後,本站附上版本號變更如下:21H2設備安裝後版本號升至Build22000.314722H2設備安裝後版本號升至Build22621.403723H2設備安裝後版本號升至Build22631.4037面向Windows1121H2的KB5041585更新主要內容如下:改進:提高了

Microsoft Edge升級:自動儲存密碼功能遭禁? !用戶驚了! Microsoft Edge升級:自動儲存密碼功能遭禁? !用戶驚了! Apr 19, 2024 am 08:13 AM

4月18日消息,近日,一些使用Canary頻道的MicrosoftEdge瀏覽器的用戶反映,在升級到最新版本後,他們發現自動保存密碼的選項被禁用了。經過調查,這是瀏覽器升級後的微調,而非功能被取消。在使用Edge瀏覽器造訪網站前,使用者回饋說瀏覽器會彈出一個視窗詢問是否希望儲存網站的登入密碼。選擇儲存後,下次登入時,Edge會自動填入已儲存的帳號和密碼,為使用者提供了極大的便利。但最近的更新類似於微調,修改了預設設定。使用者需要在選擇儲存密碼後,再手動在設定中開啟自動填入已儲存的帳號和密碼

微軟 Win11 壓縮為 7z、TAR 檔案的功能已從 24H2 下放到 23H2/22H2 版本 微軟 Win11 壓縮為 7z、TAR 檔案的功能已從 24H2 下放到 23H2/22H2 版本 Apr 28, 2024 am 09:19 AM

本站4月27日消息,微軟本月初向Canary和Dev頻道發布了Windows11Build26100預覽版更新,預估會成為Windows1124H2更新的候選RTM版本。新版本中最主要的變化在於檔案總管、整合Copilot、編輯PNG檔案元資料、建立TAR和7z壓縮檔案等等。 @PhantomOfEarth發現,微軟已經將24H2版本(Germanium)部分功能下放到23H2/22H2(Nickel)版本中,例如創建TAR和7z壓縮檔。如示意圖所示,Windows11將支援原生建立TAR

微軟全螢幕彈窗催促:Windows 10用戶抓緊時間升級到Windows 11 微軟全螢幕彈窗催促:Windows 10用戶抓緊時間升級到Windows 11 Jun 06, 2024 am 11:35 AM

6月3日訊息,微軟正在積極向所有Windows10用戶發送全螢幕通知,鼓勵他們升級到Windows11作業系統。這項舉措涉及了那些硬體配置並不支援新系統的設備。自2015年起,Windows10已經佔了近70%的市場份額,穩坐Windows作業系統的霸主地位。然而,市佔率遠超過82%的市場份額,佔有率遠超過2021年問世的Windows11。儘管Windows11已經推出已近三年,但其市場滲透率仍顯緩慢。微軟已宣布,將於2025年10月14日後終止對Windows10的技術支持,以便更專注於

微軟Edge瀏覽器更新:新增「放大影像」功能,提升使用者體驗 微軟Edge瀏覽器更新:新增「放大影像」功能,提升使用者體驗 Mar 21, 2024 pm 01:40 PM

3月21日消息,微軟近日對其MicrosoftEdge瀏覽器進行了更新,新增了一個實用的「放大影像」功能。現在,用戶在使用Edge瀏覽器時,只需右鍵點擊圖片,便可在彈出的選單中輕鬆找到這項新功能。更方便的是,使用者還可以將遊標停留在圖片上方,然後雙擊Ctrl鍵,即可快速呼出放大影像的功能。根據小編的了解,最新發布的MicrosoftEdge瀏覽器已經在Canary頻道進行了新功能測試。該瀏覽器的穩定版中也已經正式推出了實用的「放大影像」功能,為用戶提供了更便利的圖片瀏覽體驗。外國科技媒體也對此

微軟推出新版Outlook for Windows:行事曆功能全面升級 微軟推出新版Outlook for Windows:行事曆功能全面升級 Apr 27, 2024 pm 03:44 PM

在4月27日的消息中,微軟公司宣布即將發布新版OutlookforWindows客戶端的測試。此次更新主要聚焦於優化行事曆功能,旨在提升使用者的工作效率,進一步簡化日常工作流程。新版OutlookforWindows客戶端的改進點在於其更強大的行事曆管理功能。現在,使用者能夠更方便地分享個人的工作時間與地點訊息,使得會議規劃更有效率。此外,Outlook還新增了人性化設置,讓用戶設定會議自動提前結束或推遲開始,為用戶提供了更多的靈活性,無論是換會議室、稍作休息還是享受一杯咖啡,都能輕鬆安排。根據

微軟計畫2024年下半年在Windows 11中淘汰NTLM,全面轉向Kerberos認證 微軟計畫2024年下半年在Windows 11中淘汰NTLM,全面轉向Kerberos認證 Jun 09, 2024 pm 04:17 PM

2024年下半年,微軟安全官方部落格發布了一則訊息,回應安全社群的呼籲。本公司計畫在2024年下半年發布的Windows11中淘汰NTLANManager(NTLM)認證協議,以提升安全性。根據先前的解釋,微軟先前已經有過類似的動作。去年10月12日,微軟在一份官方新聞稿中就已經提出了一個過渡計劃,旨在逐步淘汰NTLM身份驗證方式,並推動更多企業和用戶轉向使用Kerberos。為了幫助那些可能在關閉NTLM驗證後遇到硬連線(hardwired)應用程式和服務問題的企業,微軟提供了IAKerb和

See all articles