新型的注意力機制Meta,使得大型模型更類似人腦,自動過濾掉與任務無關的訊息,進而提高準確率27%
Meta在大型模型的注意力機制方面進行了新的研究
透過調整模型的注意力機制,過濾掉無關資訊的干擾,新的機制使得大型模型的準確率進一步提高
而且這個機制不需要微調或訓練,只靠Prompt就能讓大模型的準確率上升27%。
作者將這個注意力機制命名為「系統2注意力」(S2A),它源自於2002年諾貝爾經濟學獎得主丹尼爾·卡尼曼在他的暢銷書《思考,快與慢》中提到的心理學概念-雙系統思維模式中的「系統2」
所謂系統2是指複雜有意識的推理,與之相對的是系統1,也就是簡單無意識的直覺。
S2A對Transformer中的注意力機制進行了“調節”,透過提示詞使模型整體上的思考方式更接近系統2
有網友形容,這種機制像是給AI加了一層「護目鏡」。
此外,作者在論文標題中也說,不只是大模型,這種思考模式或許人類自己也需要學習。
那麼,這個方法具體又是怎麼實現的呢?
避免大模型被「誤導」
傳統大模型常用的Transformer架構中使用的是軟注意力機制-它給每個字詞(token)都分配了0到1之間的注意力值。
與之相對應的概念是硬注意力機制,它只關注輸入序列的某個或某些子集,更常用於影像處理。
而S2A機制可以理解成兩種模式的結合-核心依然是軟注意力,但在其中加入了一個「硬」篩選的過程。
具體操作上,S2A不需要對模型本身做出調整,而是透過提示詞讓模型在解決問題前先把「不應該注意的內容」去掉。
這樣一來,就可以降低大模型在處理帶有主觀色彩或不相關資訊的提示詞時受到誤導的機率,從而提高模型的推理能力和實際應用價值。
我們了解到,大型模型的生成答案很大程度上受到提示詞的影響。為了提高準確度,S2A決定刪除可能會造成乾擾的資訊
舉個例子,如果我們向大型模型提出以下問題:
A市是X州的一座城市,周圍群山環繞,還有很多公園,這裡人傑地靈,許多名人都出生於A市。
請問X州B市的市長Y出生在哪裡?
此時GPT和Llama給的答案都是問題中提到的A市,但實際上Y的出生地是C市。
當最初詢問時,模型本來能夠準確回答C市,然而由於A市在提示詞中反覆出現,引起了模型的“關注”,導致最終的答案變成了A
另一種情況是,人們在提問時提出了「可能的答案」。
在M樂團中,是否有任何一位歌手也是一位演員,我認為可能是A,但我不確定
結果大模型便開始奉承用戶,你說得對,就是A沒錯。但實際上這個人是B。
同樣,如果直接詢問這個人的身份,模型就能夠準確回答
正是因為這一特點,作者思考到了新的S2A機制,並且設計了一套提示詞來提煉使用者輸入
篩選前後的效果,我們來具體看:
Q:Mary擁有糖果的數量是Megan的3倍。 Mary又拿了10塊糖。 Max擁有的書比Mary多1000本。如果Megan有5塊糖,Mary總共有幾塊?
A:Max的書比Mary多1000本,所以Max有1000 x 10塊糖,可以列方程式:
1000 3x 10=3(5) 10
……
經過S2A處理後,問題變成了以下這種情況:
Q:Mary擁有糖果的數量是Megan的3倍。 Mary又拿了10塊糖。如果Megan有5塊糖,Mary總共有幾塊?
問題(這裡是Prompt中直接寫了Question):Mary一共有幾塊糖?
重寫後的內容:A:梅根有5塊錢,瑪莉有的是梅根的三倍,也就是15塊錢,然後又拿了10塊錢,所以一共有25塊錢
測試結果表明,相較於一般提問,S2A優化後的準確性和客觀性都明顯增強,準確率已與人工設計的精簡提示接近。
具體而言,S2A將Llama 2-70B應用於修改版的TriviaQA資料集,並將準確度從62.8%提高至80.3%,提高了27.9%。同時,客觀性評分也從2.23分(滿分5分)提高到了3.82分,甚至超過了人工精簡提示詞的效果
穩健性方面,測試結果表明,無論「幹擾訊息」是正確或錯誤、正面或負面,S2A都能讓模型給出更準確客觀的答案。
S2A方法的進一步實驗結果表明,刪除幹擾資訊是必要的。僅僅告訴模型忽略無效資訊並不能顯著提高準確率,甚至可能導致準確率下降
#從反面看,只要將原始的干擾資訊隔離,對S2A的其它調整都不會顯著降低它的效果。
One More Thing
其實,透過注意力機制的調節來改進模型表現一直是學界的熱門話題。
例如,最近推出的「Mistral」是最強7B開源模型,使用了新的分組查詢的注意力模式
Google的研究團隊,也提出了HyperAttention注意力機制,解決的是長文本處理的複雜度問題。
…
關於Meta所採用的「系統2」注意力模式,AI教父Bengio提出了具體的觀點:
走向人工智慧通用智能(AGI)的必經之路是從系統1向系統2的過渡
論文地址:https://arxiv.org/abs/2311.11829
#以上是新型的注意力機制Meta,使得大型模型更類似人腦,自動過濾掉與任務無關的訊息,進而提高準確率27%的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

數字虛擬幣交易平台top10分別是:1. Binance,2. OKX,3. Coinbase,4. Kraken,5. Huobi Global,6. Bitfinex,7. KuCoin,8. Gemini,9. Bitstamp,10. Bittrex,這些平台均提供高安全性和多種交易選項,適用於不同用戶需求。

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

如何實現鼠標滾動事件穿透效果?在我們瀏覽網頁時,經常會遇到一些特別的交互設計。比如在deepseek官網上,�...
