目錄
程式碼預訓練提升LLM效能
支援功能/函數終端(function ends)
提供自動回饋的可執行環境
當下的挑戰
首頁 科技週邊 人工智慧 揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

Jan 29, 2024 am 09:24 AM
ai 訓練

大模型時代的語言模型(LLM)尺寸和訓練資料都增加了,包括自然語言和程式碼。

程式碼是人類和電腦之間的媒介,將高階目標轉換為可執行的中間步驟。它具有語法標準、邏輯一致、抽象化和模組化的特徵。

伊利諾大學香檳分校的研究團隊最近發布了一篇綜述報告,總結了將程式碼融入LLM訓練資料的多種益處。

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

論文連結:https://arxiv.org/abs/2401.00812v1

#具體來說,除了可以提升LLM在程式碼產生上的能力外,好處還包括以下三點:

1. 有助於解鎖LLM的推理能力,使能夠應用於一系列更複雜的自然語言任務上;

2. 引導LLM產生結構化且精確的中間步驟,之後可以透過函數呼叫的方式連接到外部執行終端(external execution ends) ;

3. 可以利用程式碼編譯和執行環境為模型的進一步改進提供了更多樣化的回饋訊號。

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

此外,研究人員也追蹤了LLM作為智慧智能體(intelligent agents,IA)時,在理解指令、分解目標、規劃和執行行動(execute actions)以及從回饋中提煉的能力如何在下游任務中起到關鍵作用。

最後,文中也提出了「使用程式碼增強LLM」領域中關鍵的挑戰以及未來的研究方向。

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

程式碼預訓練提升LLM效能

以OpenAI的GPT Codex 為例,對LLM 進行程式碼預訓練後,可以擴大LLM的任務範圍,除了自然語言處理外,模型還可以為數學理論產生程式碼、執行通用程式設計任務、資料檢索等。

程式碼產生任務有兩個特性:1)程式碼序列需要有效執行,所以必須具有連貫的邏輯,2)每個中間步驟都可以進行逐步邏輯驗證(step- by-step logic verification)。

在預訓練中利用和嵌入程式碼的這兩種特性,可以提高LLM思維鏈(CoT)技術在傳統自然語言下游任務中的效能,顯示程式碼訓練能夠提高LLM進行複雜推理的能力。

透過從程式碼的結構化形式進行隱式學習,程式碼LLM 在常識結構推理任務中也表現出更優的效能,例如與markup、HTML和圖表理解相關的任務。

支援功能/函數終端(function ends)

#最近的研究結果表明,將LLMs連接到其他功能終端(即,使用外部工具和執行模組增強LLMs)有助於LLMs更準確可靠地執行任務。

這些功能性目的使LLMs能夠獲取外部知識、參與多種模態資料中,並與環境進行有效互動。

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

從相關工作中,研究人員觀察到一個普遍的趨勢,即LLMs產生程式語言或利用預先定義的函數來建立與其他功能終端的連接,即「以代碼為中心」的範式。

與LLM推理機制中嚴格硬編碼工具調用的固定實踐流程相反,以代碼為中心的範式允許LLM動態生成tokens,並使用可適應的參數(adaptable parameters)呼叫執行模組,為LLM與其他功能終端互動提供了一種簡單明了的方法,增強了其應用程式的靈活性和可擴展性。

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

#

重要的是,這種範式可以讓LLM與跨越不同模態和領域的眾多功能終端進行互動;透過擴展可存取的功能終端的數量和種類,LLM可以處理更複雜的任務。

本文中主要研究了與LLM連結的文字和多模態工具,以及物理世界的功能端,包括機器人和自動駕駛,展現了LLM在解決各種模式和領域問題方面的多功能性。

提供自動回饋的可執行環境

LLMs表現出超出其訓練參數的效能,部分原因是模型能夠吸收回饋訊號,特別是在非靜態的現實世界應用中。

不過回饋訊號的選擇必須謹慎,因為吵雜的提示可能會阻礙LLM在下游任務上的表現。

此外,由於人力成本高昂,因此在保持忠誠度(faithful)的同時自動收集回饋至關重要。

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

將LLMs嵌入到程式碼執行環境中可以實現上述條件的自動回饋。

由於程式碼執行在很大程度上是確定性的,LLMs從執行程式碼的結果中獲得的回饋仍然忠實於目標任務;程式碼解釋器也為LLMs查詢內部回饋提供了一個自動路徑,無需人工標註即可對LLMs產生的錯誤程式碼進行偵錯和最佳化。

此外,程式碼環境允許LLMs整合各種各樣的外部回饋形式,包括但不限於二元正確性回饋,對結果的自然語言解釋,以及獎勵值排序,從而實現一個高度可自訂的方法來提高性能。

揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢

當下的挑戰

#程式碼預訓練與LLMs推理增強的因果關係

雖然從直覺來看,程式碼資料的某些屬性可能有助於LLMs的推理能力,但其對增強推理技能影響的確切程度仍然模糊不清。

在下一步的研究工作中,重要的是要研究在訓練資料中加強認識:這些程式碼屬性是否真的可以增強訓練的LLMs的推理能力。

如果確實如此,對程式碼的特定屬性進行預訓練可以直接提高LLMs的推理能力,那麼理解這種現象將是進一步提高當前模型複雜推理能力的關鍵。

不限於程式碼的推理能力

#儘管透過程式碼預訓練實現了對推理能力的增強,但基礎模型仍然缺乏真正通用人工智慧所期望的類似人類的推理能力。

除了程式碼之外,大量其他文字資料來源也有可能增強LLM推理能力,其中程式碼的內在特徵,如缺乏歧義、可執行性和邏輯順序結構,為收集或創建這些資料集提供了指導原則。

但如果繼續堅持在具有語言建模目標的大型語料庫上訓練語言模型的範式,很難有一種順序可讀的語言比形式語言更抽象:高度結構化,與符號語言密切相關,並且在數位網路環境中大量存在。

研究人員設想,探索可替代的資料模式、多樣化的訓練目標和新穎的架構將為進一步增強模型推理能力提供更多的機會。

以程式碼為中心範式在應用上的挑戰

#在LLMs中,使用程式碼連接到不同的功能終端的主要挑戰是學習不同功能的正確呼叫方法,包括選擇正確的功能(函數)終端以及在適當的時候傳遞正確的參數。

比如說一個簡單的任務(網頁導航),給定一組有限的動作原語後,如滑鼠移動、點擊和頁面滾動,再給一些例子(few -shot),一個強大的基礎LLM往往需要LLM精確地掌握這些原語的使用。

對於資料密集型領域中更複雜的任務,如化學、生物學和天文學,這些任務涉及對特定領域python庫的調用,其中包含許多不同功能的複雜函數,增強LLMs正確調用這些功能函數的學習能力是一個前瞻性的方向,可以使LLMs在細粒度領域中執行專家級任務。

從多輪互動和回饋中學習

#LLMs通常需要與使用者和環境進行多次交互,不斷糾正自己以改善複雜任務的完成。

雖然程式碼執行提供了可靠且可自訂的回饋,但尚未建立一種完全利用這種回饋的完美方法。

當下基於選擇的方法雖然有用,但不能保證提高性能,而且效率低下;基於遞歸的方法嚴重依賴LLM的上下文學習能力,這可能會限制其適用性;微調方法雖然做出了持續的改進,但資料收集和微調是資源密集的,實際使用時很困難。

研究人員認為強化學習可能是一種更有效的利用回饋和改進的方法,可以提供一種動態的方式來適應回饋,透過精心設計的獎勵功能,潛在地解決目前技術的限制。

但仍需要大量的研究來了解如何設計獎勵函數,以及如何將強化學習與LLMs最佳地整合以完成複雜的任務。

以上是揭開LLM巫師的魔杖,UIUC華人團隊揭示程式碼資料的三大優勢的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1677
14
CakePHP 教程
1431
52
Laravel 教程
1334
25
PHP教程
1279
29
C# 教程
1257
24
一文搞清楚經濟波動期間穩定幣的作用 一文搞清楚經濟波動期間穩定幣的作用 May 14, 2025 pm 09:15 PM

你不需要是經濟學家也能感受到經濟的動盪。物價下跌,工作穩定性下降,每個人似乎都對自己的財務未來感到焦慮。什麼是穩定幣?穩定幣就像加密世界中的救生衣:一種設計用來保持價值穩定的數字貨幣,通常與美元或黃金等穩定資產掛鉤。與比特幣或以太坊等價格波動劇烈的加密貨幣不同,穩定幣追求穩定性。當經濟風暴來襲時,投資者自然會尋求穩定,而穩定幣恰好提供了這種避險資產——免受波動的影響。為什麼穩定幣在經濟不穩定時蓬勃發展在

值得購買以獲得短期收益的九種加密貨幣盤點 值得購買以獲得短期收益的九種加密貨幣盤點 May 14, 2025 pm 09:54 PM

目錄如何選擇加密貨幣進行短期交易?短期交易最佳加密貨幣列表比特幣雪崩索拉納狗狗幣多邊形世界幣Chainlink新興企業如何選擇加密貨幣進行短期交易?短期交易是指購買加密貨幣並持有一段時間,從幾分鐘到幾天不等。這種方法前景光明,但也存在風險,耗時較長,因為你需要持續關注市場行情。但這還不是全部;在選擇合適的加密貨幣資產時,你還應該注意以下幾點:波動性:短期交易成功的主要指標之一是高揮發性加密貨幣的價值;價值越高,價格波動越大,從而創造更

Solayer(LAYER)是什麼?Solayer代幣經濟學和價格預測 Solayer(LAYER)是什麼?Solayer代幣經濟學和價格預測 May 14, 2025 pm 10:06 PM

介紹去中心化金融(DeFi)正在改變用戶與區塊鏈技術的交互方式,為交易、借貸和收益創造創造無縫靈活的途徑。 Solayer(LAYER)正是這一變革的核心,它構建了一個跨多條區塊鏈連接流動性和實用性的協議。隨著DeFi的普及以及對高效跨鏈基礎設施需求的增長,Solayer正吸引著交易員、開發者和投資者的關注,他們正在尋找下一個重大機遇。本文將解釋Solayer的概念,詳細介紹其創新功能和代幣經濟學,並展望其2030年

VINU幣未來如何? 2025年VINU幣價格分析與投資策略 VINU幣未來如何? 2025年VINU幣價格分析與投資策略 May 14, 2025 pm 09:30 PM

目錄 什麼是VitaInu(VINU)?什麼是VINU代幣? 2025年VINU幣價格預測VitaInu(VINU)價格預測2025-2030至2030年VitaInu(VINU)價格預測2025年VitaInu價格預測2026年VitaInu價格預測2027年VitaInu價格預測2028年VitaInu價格預測2029年VitaInu價格預測2030年VitaInu價格預測解讀VINU的市場表現

Zebec Network(ZBCN)是什麼?ZBCN代幣經濟學和價格預測 Zebec Network(ZBCN)是什麼?ZBCN代幣經濟學和價格預測 May 14, 2025 pm 09:48 PM

在當今的數字經濟中,傳統金融與區塊鏈技術之間的界限開始變得模糊。人們渴望更快的支付、無邊界的交易以及對自身資金的更多掌控——而且他們渴望立即實現。 ZebecNetwork是眾多旨在通過構建可編程資金流基礎設施來滿足這一需求的項目之一。 Zebec專注於實時工資單、加密支付和去中心化系統,將自己定位為連接成熟金融實踐與新興區塊鏈解決方案的橋樑。本文概述了ZebecNetwork——它

什麼是 Sign Protocol (SIGN)?跨鏈驗證網絡入門指南 什麼是 Sign Protocol (SIGN)?跨鏈驗證網絡入門指南 May 14, 2025 pm 10:48 PM

區塊鏈技術持續改變著人們在線上交換價值、驗證信息和建立信任的方式。隨著去中心化應用在各行各業的蓬勃發展,跨多個區塊鏈確認聲明和身份的能力變得越來越重要,也越來越複雜。傳統的、依賴於中心化權威的信任模型往往不足以支撐去中心化的生態系統,因此對區塊鏈原生驗證解決方案的需求也日益增長。 SignProtocol(SIGN)通過提供一個用於跨多個區塊鍊網絡創建、驗證和管理證明的框架來應對這一挑戰。 SignProtocol旨在打造一個全鏈

Solana鏈上Meme幣MOODENG、GOAT登陸幣安Alpha!幣價齊暴漲 Solana鏈上Meme幣MOODENG、GOAT登陸幣安Alpha!幣價齊暴漲 May 14, 2025 pm 10:24 PM

Solana鏈上兩大Meme幣——MooDeng(MOODENG)、GoatseusMaximus(GOAT)昨(11)日登陸幣安「Alpha」平台後迅速翻紅,重燃投資人熱情,其中MOODENG幣價單日狂飆逾123%,一舉刷新今年以來新高。幣安Alpha主要聚焦於早期潛力幣種,通常會上架社群熱度高、有成長潛力的幣種,如今正式上線MOODENG、GOAT,不僅為這兩款Meme幣注入資金活水,更讓Solana生態再

SWCH是什麼幣種?值得投資嗎?SWCH幣詳細購買教程 SWCH是什麼幣種?值得投資嗎?SWCH幣詳細購買教程 May 14, 2025 pm 10:30 PM

加密貨幣市場項目隨著區塊鏈發展而不斷湧現,目的就是改變傳統金融實踐,SwissCheese就是其中一個項目。據了解,SwissCheese是一個讓用戶能夠交易通證化股票的去中心化平台,旨在增強市場的可及性並降低交易成本,為更具包容性的金融環境鋪平道路。平台的原生代幣為SWCH,主要作用就是交易、治理等。該項目上線後立即引起了投資者的關注,但僅僅了解SWCH是什麼幣種?還不能分析出SWCH值得投資嗎?結合當前數據來看,SWCH具有一定的

See all articles