超越因果語言建模
> Neurips 2024聚光燈:使用選擇性語言建模(SLM)
進行優化語言模型>最近,我提出了一份來自2024年Neurips的引人入勝的論文,“並非所有的標記都是您在當地閱讀組中所需的。” 本文解決了一個令人驚訝的簡單但有影響力的問題:在訓練語言模型期間,每個令牌是否需要下一步的預測? >標準方法涉及大量的網絡綁帶數據集和普遍應用因果語言建模(CLM)。 本文提出了假設的挑戰,提出某些令牌阻礙了學習過程而不是幫助。 作者表明,將培訓集中在“有用”代幣上可以顯著提高數據效率和下游任務績效。 這篇文章總結了他們的核心思想和關鍵的實驗發現。
>
問題:噪聲和效率低下的學習> >大型網絡中心不可避免地包含噪音。雖然文檔級過濾有所幫助,但噪聲通常位於各個文檔中。 這些嘈雜的令牌浪費了計算資源,並可能使模型混淆。 作者分析了令牌級學習動力學,基於其跨滲透損失軌跡對令牌進行分類:
l→l(低至低):
迅速學習,提供最小的進一步好處。- h→l(高到低):最初很困難,但最終學會了;代表寶貴的學習機會。
- h→h(高到高):始終困難,通常是由於固有的不可預測性(良好的不確定性)。 >
- l→H(低至高):最初學會,但後來成為問題,可能是由於上下文變化或噪聲。 他們的分析表明,只有一小部分代幣提供有意義的學習信號。 >
- 解決方案:選擇性語言建模(SLM)> 建議的解決方案,選擇性語言建模(SLM),提供了一種更具針對性的方法:
參考模型(RM)訓練:
多餘的損失計算:
-
> 選擇性反向傳播:
進行反向傳播。這動態地將培訓集中在最有價值的代幣上。在所有令牌上都執行完整的正向通行證,但是僅對多餘損失最高的代幣的頂部 k% >
實驗結果:顯著增長
SLM在各種實驗中都具有顯著優勢:
在
自我引用:
即使是來自RAW語料庫的快速訓練的RM也提供了2-3%的準確性提升,而使用的代幣降低了30-40%。>結論和未來工作
>以上是超越因果語言建模的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

介紹 Openai已根據備受期待的“草莓”建築發布了其新模型。這種稱為O1的創新模型增強了推理能力,使其可以通過問題進行思考

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

對於那些可能是我專欄新手的人,我廣泛探討了AI的最新進展,包括體現AI,AI推理,AI中的高科技突破,及時的工程,AI培訓,AI,AI RE RE等主題
