首頁 網路3.0 指令解碼增強了指令調整語言模型,無需更新參數

指令解碼增強了指令調整語言模型,無需更新參數

Oct 02, 2024 pm 06:12 PM
AI Instructive Decoding Attention Enhancement Instruction-Tuned LLMs Generation Phase

KAIST AI 的研究人員推出了指令解碼 (ID),這是一種無需參數更新即可增強指令調整 LM 的方法。

指令解碼增強了指令調整語言模型,無需更新參數

指令調整語言模型 (LM) 可以很好地泛化到零樣本設定中未見過的任務。然而,他們在訓練資料之外的任務上的表現往往受到限制。儘管建立在大型資料集上並擁有數十億個參數,但這些語言模型在上下文學習(ICL)方面表現出色,它們可以產生對幾個範例的回應,而無需重新訓練。然而,訓練資料集的範圍限制了它們在不熟悉的任務上的有效性。快速工程和輸出多樣化等技術有助於提高性能,但需要付出巨大的努力。最近的研究探討了將認知錨定效應應用於 LM,顯示強調初始提示可以增強特定任務的反應並提高對指令的保真度。

在這項工作中,KAIST AI 的研究人員介紹了指令解碼 (ID),這是一種無需任何參數更新即可增強指令調整 LM 的方法。受噪音監督技術的啟發,ID 使用「噪音指令」(原始指令的變更版本)來建立預測下一個標記的比較方法。透過將模型的輸出引導到不同的方向,特別是使用「相反」指令,ID 可以提高跨任務的模型效能。實驗表明,透過 ID 增強的較小模型的準確性明顯優於較大模型。此方法提高了對指令的遵守程度並提高了整體響應質量,證明了其在各種模型和任務中的有效性。

指令調優的目標是微調預先訓練的語言模型,使其更好地遵循自然語言指令,從而提高對未見過的任務的泛化能力,尤其是在零樣本場景中。儘管模型通常嚴重依賴預先訓練的知識,但擴大訓練任務的多樣性和複雜性可以增強這種能力。先前的研究強調,語言模型對熟悉的指令很敏感,甚至處理誤導性的指令,並且可以透過對比技術來利用這種敏感性。文字產生中的對比與對比解碼一樣,會比較不同模型或輸入的輸出以提高效能。這項研究透過使用噪音指令來增強指令調整 LM 的泛化能力,從而擴展了這些想法。

指令解碼透過比較噪音指令產生的輸出來改善指令調整模型中的回應產生。它建立在錨定效應的基礎上,其中初始訊息影響隨後的判斷,並利用原始指令和更改指令產生的反應之間的差異。此方法使用噪音指令變體(例如截斷、打亂或隨機單字)來誤導模型,同時確保任務保真度。透過在解碼過程中比較原始指令和噪音指令的邏輯,指令解碼可以幫助模型糾正偏差並產生與預期指令更加一致的響應,從而改善其在未見過的任務上的性能。

實驗設定使用 SUPNATINST 和 UNNATINST 資料集,跨語法錯誤修正和文字蘊涵等任務評估 Tk-Instruct、Alpaca 和 T0 等模型。 Rouge-L、精確匹配 (EM)、標籤黏附性 (LA) 和標籤一致性 (LC) 指標評估效能。 ID 持續改善結果,特別是對於 Tk-XXL 等較大模型,增強 LA 和 LC。有趣的是,儘管基準效能下降,但嘈雜的指令透過 ID 提高了輸出品質。儘管特定任務的表現各不相同,但「相反」指令變體在不同任務中證明是穩健的。總體而言,ID 在模型大小和任務類型方面顯示出顯著的增益。

研究調查了指令調整語言模型中看不見的任務泛化的挑戰。所提出的 ID 方法利用「噪音」指令的錨定效應來抵消固有的模型偏差。透過將預測與變更後的指令產生的預測進行對比,ID 可以增強模型效能,特別是對於與原始輸入偏差最大的「相反」雜訊變體。實證結果顯示 ID 在多個任務中的有效性,並且預測多樣性顯著提高。該方法不需要額外的參數更新,使其成為改善語言模型指令追蹤的實用工具。

查看論文。這項研究的所有功勞都歸功於該計畫的研究人員。另外,不要忘記在 Twitter 上關注我們並加入我們的 Telegram 頻道和 LinkedIn 群組。如果您喜歡我們的工作,您一定會喜歡我們的時事通訊。

別忘了加入我們的 50k ML SubReddit

以上是指令解碼增強了指令調整語言模型,無需更新參數的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1655
14
CakePHP 教程
1414
52
Laravel 教程
1307
25
PHP教程
1253
29
C# 教程
1227
24
英特爾市場 (INTL) 可能成為年度加密貨幣,卡爾達諾 (ADA) 持有者在硬分叉之前實現多元化 英特爾市場 (INTL) 可能成為年度加密貨幣,卡爾達諾 (ADA) 持有者在硬分叉之前實現多元化 Aug 25, 2024 am 03:49 AM

隨著旁觀資本開始進入,加密貨幣市場正經歷重大的情緒轉變。由於對即將到來的反彈的預期,Near Protocol (NEAR) 和 Cardano (ADA) 等項目正在升溫。

Shytoshi Kusama 暗示即將與 AI 計畫 NFA Labs 合作 Shytoshi Kusama 暗示即將與 AI 計畫 NFA Labs 合作 Aug 09, 2024 am 06:27 AM

草間彌俊 (Shytoshi Kusama) 是領導柴犬生態系統的神秘人物,引發了人們對即將與人工智慧計畫合作的猜測。

Coinbase 和 Tether 推出人工智慧平台,為區塊鏈領域的開發人員提供支持 Coinbase 和 Tether 推出人工智慧平台,為區塊鏈領域的開發人員提供支持 Oct 29, 2024 am 03:24 AM

Coinbase 的「Based Agent」平台和 Tether 的本地 AI SDK 旨在簡化 AI 驅動的加密貨幣代理的開發。

蘋果人工智慧將改變遊戲規則,人工智慧幣下周可能會上漲 蘋果人工智慧將改變遊戲規則,人工智慧幣下周可能會上漲 Sep 09, 2024 am 03:15 AM

蘋果已為週一發布 iPhone 16 做好準備,準備向 iPhone 消費者介紹生成式人工智慧,大力推動生成式人工智慧的發展

Firecoin 籌集 120 萬美元,將人工智慧驅動的代幣洞察引入 TON 生態系統 Firecoin 籌集 120 萬美元,將人工智慧驅動的代幣洞察引入 TON 生態系統 Oct 25, 2024 am 12:12 AM

投資加密貨幣市場可能非常有利可圖,新代幣偶爾可為投資者帶來高達 160,000% 以上的年回報。

Launchpool孵化基於TON區塊鏈的人工智慧生態系統ONAI Launchpool孵化基於TON區塊鏈的人工智慧生態系統ONAI Aug 05, 2024 pm 03:32 PM

這種合作夥伴關係標誌著將商業人工智慧代理和自動化整合到 Web3 領域方面取得了重大進展。

Sui (SUI) 和 GoodEgg (GEGG):九月加密貨幣市場值得關注的兩個有前途的項目 Sui (SUI) 和 GoodEgg (GEGG):九月加密貨幣市場值得關注的兩個有前途的項目 Sep 12, 2024 pm 09:01 PM

隨著加密貨幣市場面臨波動趨勢,精明的投資者開始將注意力轉向具有韌性和成長潛力的新興項目。由於對比特幣(BTC)價格波動軌蹟的擔憂,

儘管有「死幣」的說法,卡爾達諾(ADA)仍保持前十名,探索人工智慧集成 儘管有「死幣」的說法,卡爾達諾(ADA)仍保持前十名,探索人工智慧集成 Aug 17, 2024 am 06:41 AM

近幾個月來,卡爾達諾 [ADA] 面臨批評,有些人因其價格趨勢而將其標記為「死幣」。然而,儘管存在這種負面影響