具有生物啟發訓練方法的物理深度學習:物理硬體的無梯度方法
對人工智慧不斷增長的需求推動了對基於實體設備的非常規計算的研究。雖然此類計算設備模仿了大腦啟發的模擬資訊處理,但學習過程仍然依賴為數位處理優化的方法,例如反向傳播,這不適合物理實現。
在這裡,來自日本NTT 設備技術實驗室(NTT Device Technology Labs)和東京大學的研究團隊透過擴展一種稱為直接回饋對齊(DFA)的受生物學啟發的訓練演算法來展示物理深度學習。 與原始演算法不同,所提出的方法是基於具有替代非線性活化的隨機投影。因此,可以在不了解物理系統及其梯度的情況下訓練物理神經網路。此外,可以在可擴展的實體硬體上模擬此訓練的計算。
研究人員使用稱為深儲層電腦的光電遞歸神經網路演示了概念驗證。證實了在基準測試中具有競爭性能的加速計算的潛力。研究結果為神經形態計算的訓練和加速提供了實用的解決方案。
研究以「Physical deep learning with biologically inspired training method: gradient-free approach for physical hardware」為題,於2022 年12 月26 日發布在《Nature Communications》上。
物理深度學習
基於人工神經網路(ANN) 的機器學習在影像處理、語音辨識、遊戲等方面的破紀錄表現成功展現了其卓越的能力。儘管這些演算法類似於人腦的工作方式,但它們基本上是使用傳統的馮諾依曼計算硬體在軟體層面上實現的。然而,這種基於數位運算的人工神經網路面臨能耗和處理速度的問題。這些問題促使使用替代物理平台實現人工神經網路。
有趣的是,即使是被動物理動力學也可以用作隨機連接的 ANN 中的計算資源。該框架被稱為實體儲層電腦(RC)或極限學習機(ELM),其易於實現極大地擴展了可實現材料的選擇及其應用範圍。這種物理實現的神經網路 (PNN) 能夠將特定任務的運算負載外包給實體系統。
建立更深層的實體網路是進一步提高效能的一個有前途的方向,因為它們可以以指數方式擴展網路表達能力。這激發了使用各種物理平台的深度 PNN 的提議。他們的訓練基本上依賴一種稱為反向傳播(BP)的方法,該方法在基於軟體的 ANN 中取得了巨大成功。但是,BP 在以下方面不適用於 PNN。首先,BP 操作的實體實作仍然複雜且不可擴展。其次,BP 需要對整個物理系統有精確的了解。此外,當我們將 BP 應用於 RC 時,這些要求破壞了實體 RC 的獨特特性,即我們需要準確地了解和模擬黑盒實體隨機網路。
與 PNN 中的 BP 一樣,BP 在生物神經網路中的操作難度也被腦科學界指出;BP 在大腦中的合理性一直受到質疑。這些考慮促使開發了生物學上合理的訓練演算法。
近期一個有前景的方向是直接回饋對齊 (DFA)。在這個演算法中,採用最終輸出層誤差訊號的固定隨機線性變換來取代反向誤差訊號。因此,這種方法不需要誤差訊號的逐層傳播或權重的知識。此外,據報道,DFA 可擴展到現代大型網路模式。這種以生物學為動機的訓練的成功表明,有一種比 BP 更合適的方法來訓練 PNN。然而,DFA 仍然需要非線性函數 f(x) 的導數 f'(a) 進行訓練,這阻礙了 DFA 方法在物理系統中的應用。因此,DFA 的更大幅度擴展對於 PNN 應用很重要。
DFA 及其對物理深度學習的增強
#在此,研究人員透過增強 DFA 演算法來演示物理深度學習。在增強 DFA 中,以任意非線性 g(a) 取代標準 DFA 中物理非線性激活 f'(a) 的微分,並表明性能對 g(a) 的選擇具有穩健性。由於這種增強,不再需要準確地模擬 f'(a)。由於所提出的方法是基於具有任意非線性活化的平行隨機投影,因此可以按照與物理 ELM 或 RC 概念相同的方式在物理系統上執行訓練計算。這使得推理和訓練的物理加速成為可能。
圖:PNN 的概念及其透過 BP 和增強 DFA 進行的訓練。 (資料來源:論文)
為了示範概念驗證,研究人員建構了一個 FPGA 輔助的光電深度物理 RC 作為工作台。儘管 benchtop 簡單易用,僅需軟體級更新即可應用於各種實體平台,但實現了可與大型複雜的最先進系統相媲美的性能。
圖:具有增強 DFA 訓練的光電深度 RC 系統。 (資料來源:論文)
此外,也比較了整個處理時間,包括數位處理的時間,發現了訓練過程物理加速的可能性。
圖:光電深 RC 系統的效能。 (資料來源:論文)
RC 工作台的處理時間預算細分如下:FPGA 處理(資料傳輸、記憶體分配和DAC/ADC)約為92%;約8% 的數位處理用於預處理/後處理。因此,在目前階段,處理時間主要由 FPGA 和 CPU 上的數字計算決定。這是因為光電工作台僅使用一條非線性延遲線實現了一個儲層;這些限制可以透過在未來使用完全並行和全光計算硬體來放寬。可以看出,CPU 和 GPU 上的計算針對節點數顯示了 O(N^2) 趨勢,而 benchtop 顯示了 O(N),這是由於資料傳輸瓶頸造成的。
對於 BP 和增強 DFA 演算法,CPU 以外的物理加速度分別在 N ~5,000 和 ~12,000 處被觀察到。然而,就計算速度而言,由於 GPU 的記憶體限制,尚未直接觀察到針對 GPU 的有效性。透過推斷 GPU 趨勢,可以在 N ~80,000 時觀察到超過 GPU 的物理加速。據我們所知,這是整個訓練過程的首次比較,也是首次使用 PNN 進行體能訓練加速示範。
為了研究所提方法對其他系統的適用性,使用廣泛研究的光子神經網路進行了數值模擬。此外,實驗證明的基於延遲的 RC 被證明非常適合各種物理系統。關於物理系統的可擴展性,建構深度網路的主要問題是其固有噪音。透過數值模擬研究了噪音的影響。發現該系統對噪音具有穩健性。
所提出方法的可擴展性和局限性
在這裡,考慮了基於 DFA 的方法對更現代模型的可擴展性。實際深度學習最常用的模型之一是深度連結的捲積神經網路 (CNN)。然而,據報道,DFA 演算法很難應用於標準 CNN。因此,所提出的方法可能難以以簡單的方式應用於卷積 PNN。
考慮到模擬硬體實現,對 SNN 的適用性也是一個重要主題。已經報導了基於 DFA 的訓練對 SNN 的適用性,這意味著該研究所提出的增強 DFA 可以使訓練更容易。
雖然基於 DFA 的演算法有可能擴展到比簡單的 MLP 或 RC 更實用的模型,但將基於 DFA 的訓練應用於此類網路的有效性仍然未知。在這裡,作為這項研究的額外工作,研究了基於 DFA 的訓練(DFA 本身和增強的 DFA)對上述模型(MLP-Mixer、Vision transformer (ViT)、ResNet 和 SNN)的可擴展性。研究發現基於 DFA 的訓練即使對於探索的實用模型也是有效的。雖然基於 DFA 的訓練可達到的準確度基本上低於 BP 訓練,但對模型和/或演算法進行一些調整可以提高效能。值得注意的是,對於所有探索的實驗設置,DFA 和增強 DFA 的準確性都具有可比性,這表明 DFA 本身的進一步改進將直接有助於改進增強 DFA。結果表明,該方法可擴展到未來對 PNN 的實用模型的實現,而不僅僅是簡單的 MLP 或 RC 模型。
表 1:增強 DFA 對實際網路模型的適用性。 (來源:論文)
物理硬體中的BP 與DFA
一般來說,BP 在實體硬體上實現起來非常困難,因為它需要計算圖中的所有資訊。因此,物理硬體的訓練一直是透過計算模擬來完成的,這會產生大量的計算成本。此外,模型與實際系統之間的差異導致精度下降。相反,增強的 DFA 不需要關於物理系統的準確先驗知識。因此,在深度 PNN 中,基於 DFA 的方法在準確性方面比基於 BP 的方法更有效。此外,可以使用實體硬體加速運算。
此外,DFA 訓練不需要逐層計算的順序誤差傳播,這意味著每一層的訓練可以並行執行。因此,更優化和並行的 DFA 實作可能會帶來更顯著的加速。這些獨特的特徵表明基於 DFA 的方法的有效性,特別是對於基於物理硬體的神經網路。另一方面,增強 DFA 訓練的模型的準確性仍然不如 BP 訓練的模型。進一步提高基於 DFA 的訓練的準確性仍然是未來的工作。
進一步的物理加速
物理實作證實了具有大節點(large-node)數的 RC 循環處理的加速。但是,它的優勢仍然有限,需要進一步改進。目前原型的處理時間表示為 FPGA 的資料傳輸和記憶體分配。因此,將所有流程整合到 FPGA 中將大大提高效能,但會犧牲實驗靈活性。此外,將來,機載光學方法將大大降低傳輸成本。大規模光整合和片上整合將進一步提升光運算本身的效能。
以上是具有生物啟發訓練方法的物理深度學習:物理硬體的無梯度方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

0.這篇文章乾了啥?提出了DepthFM:一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高,可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

目前的深度邊緣檢測網路通常採用編碼器-解碼器架構,其中包含上下採樣模組,以更好地提取多層次的特性。然而,這種結構限制了網路輸出準確且細緻的邊緣檢測結果。針對這個問題,一篇AAAI2024的論文給了新的解決方案。論文題目:DiffusionEdge:DiffusionProbabilisticModelforCrispEdgeDetection作者:葉雲帆(國防科技大學),徐凱(國防科技大學),黃雨行(國防科技大學),易任嬌(國防科技大學),蔡志平(國防科技大學)論文連結:https ://ar

趕在春節前,通義千問大模型(Qwen)的1.5版上線了。今天上午,新版本的消息引發了AI社群關注。新版大機型包括六個型號尺寸:0.5B、1.8B、4B、7B、14B和72B。其中,最強版本的效能超越了GPT3.5和Mistral-Medium。此版本包含Base模型和Chat模型,並提供多語言支援。阿里通義千問團隊表示,相關技術也已經上線到了通義千問官網和通義千問App。除此之外,今天Qwen1.5的發布還有以下一些重點:支援32K上下文長度;開放了Base+Chat模型的checkpoint;

如今的深度學習方法專注於設計最適合的目標函數,以使模型的預測結果與實際情況最接近。同時,必須設計一個合適的架構,以便為預測取得足夠的資訊。現有方法忽略了一個事實,當輸入資料經過逐層特徵提取和空間變換時,大量資訊將會遺失。本文將深入探討資料透過深度網路傳輸時的重要問題,即資訊瓶頸和可逆函數。基於此提出了可編程梯度資訊(PGI)的概念,以應對深度網路實現多目標所需的各種變化。 PGI可以為目標任務提供完整的輸入訊息,以計算目標函數,從而獲得可靠的梯度資訊以更新網路權重。此外設計了一種新的輕量級網路架

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛「含淚」退出歷史舞台,今天波士頓動力就宣布:電動Atlas上崗。看來,在商用人形機器人領域,波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?影片一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

哭死啊,全球狂煉大模型,一網路的資料不夠用,根本不夠用。訓練模型搞得跟《飢餓遊戲》似的,全球AI研究者,都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中,這問題尤其突出。一籌莫展之際,來自人大系的初創團隊,用自家的新模型,率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下,兩側都能產生高品質、多模態的新數據,對模型本身進行數據反哺。模型是啥?中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰?智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立,高

什麼?瘋狂動物城被國產AI搬進現實了?與影片一同曝光的,是一款名為「可靈」全新國產影片生成大模型。 Sora利用了相似的技術路線,結合多項自研技術創新,生產的影片不僅運動幅度大且合理,還能模擬物理世界特性,具備強大的概念組合能力與想像。數據上看,可靈支持生成長達2分鐘的30fps的超長視頻,分辨率高達1080p,且支援多種寬高比。另外再劃個重點,可靈不是實驗室放出的Demo或影片結果演示,而是短影片領域頭部玩家快手推出的產品級應用。而且主打一個務實,不開空頭支票、發布即上線,可靈大模型已在快影

最近,軍事圈被這個消息刷屏了:美軍的戰鬥機,已經能由AI完成全自動空戰了。是的,就在最近,美軍的AI戰鬥機首次公開,揭開了神秘面紗。這架戰鬥機的全名是可變穩定性飛行模擬器測試飛機(VISTA),由美空軍部長親自搭乘,模擬了一對一的空戰。 5月2日,美國空軍部長FrankKendall在Edwards空軍基地駕駛X-62AVISTA升空注意,在一小時的飛行中,所有飛行動作都由AI自主完成! Kendall表示——在過去的幾十年中,我們一直在思考自主空對空作戰的無限潛力,但它始終顯得遙不可及。然而如今,
