清華最新「持續學習」綜述,32頁詳述持續學習理論、方法與應用綜述
在一般意義上,持續學習明顯受到災難性遺忘的限制,學習新任務通常會導致舊任務的表現急劇下降。
除此之外,近年來出現了越來越多的進展,在很大程度上擴展了持續學習的理解和應用。
人們對這一方向日益增長和廣泛的興趣表明了它的現實意義和複雜性。
#論文網址:#https://www.php.cn/link/82039d16dce0aab3913b6a7ac73deff7
#本文對持續學習進行了全面的研究,試圖在基本設定、理論基礎、代表性方法和實際應用之間建立聯繫。
基於現有的理論和實證結果,將持續學習的一般目標總結為:在資源效率的背景下,確保適當的穩定性-可塑性權衡,以及充分的任務內/任務間泛化能力。
提供了最先進的和詳細的分類法,廣泛分析了有代表性的策略如何解決持續學習,以及它們如何適應各種應用中的特定挑戰。
透過對持續學習當前趨勢、跨方向前景和與神經科學的跨學科聯繫的深入討論,相信這種整體的視角可以極大地促進該領域和其他領域的後續探索。
引言
學習是智慧系統適應環境的基礎。為了因應外在的變化,演化使人類和其他生物具有很強的適應性,能夠不斷地獲取、更新、累積和利用知識[148]、[227]、[322]。自然,我們期望人工智慧(AI)系統以類似的方式適應。這激發了持續學習的研究,其中典型的設定是逐一學習一系列內容,並表現得就像同時觀察到的一樣(圖1,a)。這些內容可以是新技能、舊技能的新範例、不同的環境、不同的背景等,並包含特定的現實挑戰[322],[413]。由於內容是在一生中逐步提供的,因此因此在許多文獻中,持續學習也被稱為增量學習或終身學習,但沒有嚴格的區分[70],[227]。
與傳統的基於靜態資料分佈的機器學習模型不同,持續學習的特徵是從動態資料分佈中學習。 一個主要的挑戰被稱為災難性遺忘[291],[292],對新分佈的適應通常會導致捕獲舊分佈的能力大大降低。 這種困境是學習可塑性和記憶穩定性權衡的一個面向:前者過多會幹擾後者,反之亦然。除了簡單地平衡這兩方面的「比例」外,持續學習的理想解決方案應該獲得強大的泛化能力,以適應任務內部和任務之間的分佈差異(圖1,b)。作為一個樸素的基線,重新訓練所有舊的訓練樣本(如果允許)可以輕鬆解決上述挑戰,但會產生巨大的計算和存儲開銷(以及潛在的隱私問題)。事實上,持續學習的主要目的是確保模型更新的資源效率,最好接近只學習新的訓練樣本。
許多努力致力於解決上述挑戰,可以在概念上分為五組(圖1,c):參考舊模型添加正則化項(基於正則化的方法);逼近和恢復舊資料分佈(基於回放的方法);顯式操作優化程序(基於優化的方法);學習魯棒和良好泛化的表示(基於表示的方法);以及使用正確設計的體系結構構建任務自適應參數(基於體系結構的方法)。此分類法擴展了常用分類法的最新進展,並為每個類別提供了細化的子方向。總結了這些方法是如何實現所提出的一般目標的,並對其理論基礎和典型實現進行了廣泛的分析。特別是,這些方法是緊密聯繫的,例如正則化和重播最終糾正優化中的梯度方向,並且具有高度的協同性,例如,重播的效果可以透過從舊模型中提取知識來提高。
現實應用對持續學習提出了特殊的挑戰,可以分為場景複雜性和任務特異性。對於前者,例如,在訓練和測試中可能缺少任務oracle(即執行哪個任務),訓練樣本可能是小批量甚至一次引入的。由於資料標記的成本和稀缺性,持續學習需要在少樣本、半監督甚至無監督的場景中有效。對於後者,雖然目前的進展主要集中在視覺分類,但其他視覺領域(如目標檢測、語義分割和圖像生成)以及其他相關領域(如強化學習(RL)、自然語言處理(NLP)和倫理考慮)正在受到越來越多的關注,其機會和挑戰。
考慮到持續學習的興趣顯著增長,我們相信這項最新和全面的研究可以為後續的工作提供一個整體的視角。 儘管有一些關於持續學習的早期調查,覆蓋面相對較廣[70],[322],但近年來的重要進展並未被納入其中。相較之下,最新的研究通常只整理持續學習的局部方面,關於其生物學基礎[148],[156],[186],[227],視覺分類的專門設定[85],[283] ,[289],[346],以及NLP[37],[206]或RL[214]中的擴展。據我們所知,這是第一個系統總結持續學習的最新進展的研究。基於這些優勢,我們就當前趨勢、跨方向前景(如擴散模型、大規模預訓練、視覺轉換器、具體AI、神經壓縮等)以及與神經科學的跨學科聯繫,深入討論了持續學習。
主要貢獻包括:
#(1) 對持續學習進行了最新而全面的綜述,以連接理論、方法和應用的進步;
(2) 根據現有的理論和實證結果,總結了持續學習的一般目標,並對具有代表性的策略進行了詳細的分類;
(3) 將現實應用的特殊挑戰分為場景複雜性和任務特殊性,並廣泛分析了持續學習策略如何適應這些挑戰;
#(4)深入探討了當前研究趨勢和發展方向,以期為相關領域後續工作提供參考。
本文的組織如下:在第2節中,我們介紹了持續學習的設置,包括其基本公式,典型場景和評估指標。在第3節中,我們總結了一些針對其一般目標的持續學習的理論努力。在第4節中,我們對代表性的策略進行了最新的和詳細的分類,分析了它們的動機和典型的實現。在第5節和第6節中,我們描述了這些策略如何適應場景複雜性和任務特異性的現實挑戰。在第7節中,我們提供了當前趨勢的討論,交叉方向的前景和神經科學的跨學科連結。
在本節中,我們詳細介紹了代表性持續學習方法的分類(參見圖3和圖1 ,c),並廣泛分析了它們的主要動機、典型實現和經驗屬性。
Regularization-based 方法
#該方向的特徵是添加顯式正則項來平衡新舊任務,這通常需要儲存舊模型的凍結副本以供參考(見圖4)。根據正規化的目標,這類方法可以分為兩類。
Replay-based 方法
##將近似和恢復舊資料分佈的方法分組到這個方向(見圖5)。根據回放的內容,這些方法可以進一步分為三個子方向,每個子方向都有自己的挑戰。
Optimization-based 方法
持續學習不僅可以透過向損失函數添加額外的項(例如正則化和重播)來實現,還可以透過明確地設計和操作最佳化程序來實現。
#Representation-based 方法
將創建和利用持續學習表示優勢的方法歸為這一類。除了早期透過元訓練[185]獲得稀疏表示的工作外,最近的工作試圖結合自監督學習(SSL)[125]、[281]、[335]和大規模預訓練[295]、[380]、 [456]的優勢,以改善初始化和持續學習中的表示。請注意,這兩種策略密切相關,因為預訓練資料通常數量龐大且沒有明確的標籤,而SSL本身的表現主要透過對(一系列)下游任務進行微調來評估。下面,我們將討論具有代表性的子方向。
#Architecture-based 方法
#Architecture-based 方法
上述策略主要集中在學習所有具有共享參數集的增量任務(即單一模型和一個參數空間),這是導致任務間幹擾的主要原因。相反,建構特定於任務的參數可以明確地解決這個問題。過去的工作通常根據網路體系結構是否固定,將此方向分為參數隔離和動態體系結構。本文專注於實現特定任務參數的方式,將上述概念擴展到參數分配、模型分解和模組化網路(圖8)。
以上是清華最新「持續學習」綜述,32頁詳述持續學習理論、方法與應用綜述的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

從主畫面中刪除了重要內容並試圖將其取回?您可以透過多種方式將應用程式圖示放回螢幕。我們已經討論了您可以遵循的所有方法,並將應用程式圖示放回主畫面如何在iPhone中撤消從主畫面中刪除正如我們之前提到的,有幾種方法可以在iPhone上恢復此變更。方法1–替換應用程式庫中的應用程式圖示您可以直接從應用程式庫將應用程式圖示放置在主畫面上。步驟1–橫向滑動以尋找應用程式庫中的所有應用程式。步驟2–找到您先前刪除的應用程式圖示。步驟3–只需將應用程式圖示從主庫拖曳到主畫面上的正確位置即可。這是將應用程式圖

PHP中箭頭符號的作用及實踐應用在PHP中,箭頭符號(->)通常用於存取物件的屬性和方法。物件是PHP中物件導向程式設計(OOP)的基本概念之一,在實際開發中,箭頭符號在操作物件時發揮重要作用。本文將介紹箭頭符號的作用以及實踐應用,並提供具體的程式碼範例來幫助讀者更好地理解。一、箭頭符號的作用存取物件的屬性箭頭符號可以用來存取物件的屬性。當我們實例化一個對

Linuxtee命令是一個非常有用的命令列工具,它可以在不影響已有輸出的情況下,將輸出寫入檔案或將輸出送到另一個命令。在本文中,我們將深入探索Linuxtee命令的各種應用場景,從入門到精通。 1.基本用法首先,我們來看看tee指令的基本用法。 tee指令的語法如下:tee[OPTION]...[FILE]...該指令會從標準輸入讀取數據,並將數據

在word編輯文字內容時,有時會需要輸入公式符號。有的小夥子們不知道在word根號輸入的方法,小面就讓小編跟小夥伴們一起分享下word根號輸入的方法教學。希望對小夥伴們有幫助。首先,開啟電腦上的Word軟體,然後開啟要編輯的文件,並將遊標移到需要插入根號的位置,參考下方的圖片範例。 2.選擇【插入】,再選擇符號裡的【公式】。如下方圖片紅色圈的部分內容所示:3.接著選擇下方的【插入新公式】。如下方圖片紅色圈的部分內容所示:4.選擇【根式】,再選擇適當的根號。如下方圖片紅色圈的部分內容所示:

Go語言是一種由Google開發的開源程式語言,於2007年首次發布。它被設計成一種簡單易學、高效、並發性強的語言,受到越來越多開發者的青睞。本文將探討Go語言的優勢,並介紹一些適合Go語言的應用場景,同時給出具體的程式碼範例。優勢並發性強:Go語言內建支援輕量級執行緒-goroutine,能夠輕鬆實現並發程式設計。透過使用go關鍵字就可以啟動goroutin

MySQL時間戳記是十分重要的資料類型,它可以儲存日期、時間或日期加時間。在實際的開發過程中,合理地使用時間戳記可以提高資料庫操作的效率,並且方便進行時間相關的查詢和計算。本文將從MySQL時間戳記的功能、功能和應用場景等面向展開探討,並結合具體的程式碼範例來講解。一、MySQL時間戳記的功能與特性MySQL中有兩種類型的時間戳,一種是TIMESTAMP

標題:從零開始學習Go語言中的main函數Go語言作為一種簡潔、高效的程式語言,備受開發者青睞。在Go語言中,main函數是一個入口函數,每個Go程式都必須包含main函數作為程式的入口點。本文將從零開始介紹如何學習Go語言中的main函數,並提供具體的程式碼範例。一、首先,我們需要安裝Go語言的開發環境。可前往官方網站(https://golang.org

Linux在雲端運算領域的廣泛應用隨著雲端運算技術的不斷發展和普及,Linux作為一種開源作業系統在雲端運算領域中發揮重要作用。由於其穩定性、安全性和靈活性,Linux系統被廣泛應用於各種雲端運算平台和服務中,為雲端運算技術的發展提供了堅實的基礎。本文將介紹Linux在雲端運算領域的廣泛應用,並給出具體的程式碼範例。一、Linux在雲端運算平台中的應用虛擬化技術虛擬化技術
