如何提高存储、传输效率?参数集约型掩码网络效果显著
為了處理更複雜的任務,近年來神經網路的規模也在不斷變大,如何高效的儲存和傳輸神經網路變得十分重要。另一方面,隨著彩票假說(Lottery Ticket Hypothesis (LTH))的提出,隨機稀疏神經網路最近展現出強烈的潛力,如何利用這種潛力來提高網路的儲存和傳輸效率也值得探索。
來自美國東北大學和羅徹斯特理工的研究者提出參數集約型遮罩網路(Parameter-Efficient Masking Networks (PEMN))。作者首先探討了有限數量隨機數產生的隨機網路的表徵能力。實驗表明,即使網絡由有限數量的隨機數生成,透過選擇不同的子網絡結構,其仍然具有很好的表徵能力。
透過這個探索性實驗,作者自然地提出使用一組有限數量隨機數作為 prototype,結合一組 mask 來表達一個神經網路。因為有限數量的隨機數和二值的 mask 佔用很少的儲存空間,作者以此來提出一種新的思路來進行網路壓縮。文章已被 NeurIPS 2022 接受。程式碼已開源。
- 論文網址: https://arxiv.org/abs/2210.06699
- #論文程式碼: https://github.com/yueb17/PEMN
1.相關研究
#MIT 研究人員提出彩票假說Lottery Ticket Hypothesis (ICLR'19):在一個隨機初始化網絡中,存在一個彩票子網絡(winning ticket)在被單獨訓練的情況下達到很好的效果。彩票假說探討了隨機稀疏網路的可訓練性。 Uber 研究人員提出 Supermask (NeurIPS’19):在一個隨機初始化網絡中,存在一個子網絡,可以直接用來做推論而不需要訓練。 Supermask 探索了隨機稀疏網路的可用性。華盛頓大學研究人員提出 Edge-Popup (CVPR’20):透過反向傳播學習子網路的 mask,大幅提升了隨機稀疏網路的可用性。
2. 研究動機/ 流程
以上相關研究從不同角度探索了隨機稀疏網路的潛力,如可訓練性和可用性,其中可用性也可以理解為表徵能力。在這份工作中,作者感興趣的是由隨機數產生的神經網路在不訓練權重的情況下有多強的表徵能力。隨著對此問題的探索,作者提出了 Parameter-Efficient Masking Networks (PEMN)。自然地,作者運用 PEMN 為網路壓縮提供了一種新的思路,並作為一個例子對 PEMN 的潛在應用場景進行探索。
3. 探索隨機數構成的神經網絡的表徵能力
給定一個隨機網絡,作者選擇Edge-Popup 演算法在其中選擇子網絡來探索其表徵能力。不同的是,相對於對整個網路進行隨機初始化,作者提出了三種參數集約型的網路生成策略來使用一個 prototype 來建立隨機網路。
- One-layer: 選擇網路中重複結構的權重作為 prototype 來填入其他的與之結構相同的網路層。
- Max-layer padding (MP): 選擇參數量最多的網路層作為 prototype 並且截斷對應的參數量來填入其他網路層。
- Random vector padding (RP): 選擇一定長度的隨機向量作為 prototype 並對其進行複製來填充整個網路。
三種不同的隨機網路產生策略把網路中不重複參數值(unique values)的數量逐步變小,我們基於不同策略得到的隨機網路來選擇子網絡,從而探索了有限數量隨機數產生的隨機網絡的表徵潛力。
上圖展示了使用 ConvMixer 和 ViT 網路 CIFAR10 影像分類的實驗結果。 Y 軸為準確率,X 軸為使用不同策略得到的隨機網路。隨之 X 軸的變大,隨機網路中不重複隨機數數量逐漸變小 (RP 後的數字表示相比較於 MP,RP 中不重複隨機數數量的比例)。
根據實驗結果,我們觀察到即使隨機網路只有非常有限的不重複隨機數(例如PR_1e-3),依然可以很好的維持選擇出來的子網路的表徵能力。至此,作者透過不同的隨機網路產生策略,探索了有限數量隨機數構成的神經網路的表徵能力並觀察到即使不重複隨機數非常有限,其對應的隨機網路依然可以很好地對資料進行表徵。
同時作者基於這些隨機網路生成策略,結合所得到的子網路掩碼,提出了 Parameter-Efficient Masking Networks(PEMN)這種新的神經網路類型。
4. 一種新的網路壓縮想法
本文選擇了神經網路壓力為例來拓展 PEMN 的潛在應用。具體來說,文中所提出的不同隨機網絡生成策略可以高效的使用 prototype 來代表完整的隨機網絡,尤其是最細粒度的 random vector padding (RP)策略。
作者使用 RP 策略中的隨機向量 prototype 和與之對應的一組子網路遮罩來表示一個隨機網路。在其中 prototype 需要保存浮點數格式,而遮罩只需要儲存成二值格式。因為RP 中的prototype 長度可以很短(因為有限數量的不重複隨機數仍有很強的表徵能力),所以表示一個神經網路的開銷會變得很小,即儲存一個長度有限的浮點數格式的隨機向量和一組二值格式的遮罩。相較於傳統的稀疏網路儲存子網路的浮點數值,本文提出了一種新的網路壓縮思路用來高效率的儲存和傳輸神經網路。
在上圖中,作者使用 PEMN 對網路進行壓縮並與傳統的網路剪枝方法進行比較。實驗使用 ResNet 網路在 CIFAR 資料集做影像分類任務。我們觀察到,新的壓縮方案表現普遍優於傳統的網路剪枝,尤其是在很高的壓縮率下,PEMN 仍可維持較好的準確率。
5. 結論
本文受近來隨機網絡展現出來的潛力所啟發,提出不同種參數集約策略來構建隨機神經網絡,進而探索了在只有在有限的不重複隨機數的情況下所產生的隨機神經網路的表徵潛力,並提出參數集約型掩碼網路Parameter-Efficient Masking Networks (PEMN)。作者將 PEMN 應用到網路壓縮的場景中探索了其在實際應用方面的潛力並且為網路壓縮提供了一種新的思路。作者提供了廣泛的實驗,顯示即使隨機網路中只有非常有限的不重複隨機數,透過子網路的選擇,其仍然有較好的表徵能力。此外,相比較於傳統剪枝演算法,實驗顯示新提出的方法可以取得更好的網路壓縮效果,驗證了 PEMN 在該場景下的應用潛力。
以上是如何提高存储、传输效率?参数集约型掩码网络效果显著的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

本站3月7日訊息,華為資料儲存產品線總裁週躍峰博士日前出席MWC2024大會,專門展示了為溫資料(WarmData)和冷資料(ColdData)設計的新一代OceanStorArctic磁電儲存解決方案。華為資料儲存產品線總裁週躍峰發布系列創新解決方案圖來源:華為本站附上華為官方新聞稿內容如下:該方案的成本比磁帶低20%,功耗比硬碟低90%。根據國外科技媒體blocksandfiles報道,華為發言人也透露了關於該磁電儲存解決方案的資訊:華為的磁電磁碟(MED)是對磁性儲存媒體的重大創新。第一代ME

Vue3+TS+Vite開發技巧:如何進行資料加密和儲存隨著網路技術的快速發展,資料的安全性和隱私保護變得越來越重要。在Vue3+TS+Vite開發環境下,如何進行資料加密和存儲,是每個開發人員都需要面對的問題。本文將介紹一些常用的資料加密和儲存的技巧,幫助開發人員提升應用程式的安全性和使用者體驗。一、資料加密前端資料加密前端加密是保護資料安全性的重要一環。常用

什麼是緩存?快取(發音為ka·shay)是一種專門的高速硬體或軟體元件,用於儲存經常要求的資料和指令,這些資料和指令又可用於更快地載入網站、應用程式、服務和系統的其他部分。快取使最常存取的資料隨時可用。快取檔案與快取記憶體不同。快取文件是指經常需要的文件,如PNG、圖標、徽標、著色器等,多個程式可能需要這些文件。這些檔案儲存在您的實體磁碟機空間中,通常是隱藏的。另一方面,高速緩存記憶體是一種比主記憶體和/或RAM更快的記憶體類型。它極大地減少了資料存取時間,因為與RAM相比,它更靠近CPU並且速度

Git是一個快速、可靠、適應性強的分散式版本控制系統。它旨在支援分散式的非線性工作流程,使其成為各種規模的軟體開發團隊的理想選擇。每個Git工作目錄都是一個獨立的儲存庫,具有所有更改的完整歷史記錄,並且能夠追蹤版本,即使沒有網路存取或中央伺服器。 GitHub是託管在雲端的Git儲存庫,它提供了分散式修訂控制的所有功能。 GitHub是Git的儲存庫,託管在雲端。與作為CLI工具的Git不同,GitHub有一個基於Web的圖形使用者介面。它用於版本控制,這涉及與其他開發人員協作,並追蹤隨時間推移對腳本和

如何正確使用sessionStorage儲存敏感訊息,需要具體程式碼範例無論是在Web開發或行動應用程式開發中,我們常常需要儲存和處理敏感訊息,如使用者登入憑證、身分證號碼等。在前端開發中,使用sessionStorage是常見的儲存方案。然而,由於sessionStorage是基於瀏覽器的存儲,需要注意一些安全性的問題,以確保存儲的敏感資訊不會被惡意存取和利用

在日常的生活和工作中,我們經常需要使用電腦設備和手機設備互傳視頻文件,但是接收端的視頻文件卻容易出現模糊不清的情況,這是在傳輸過程中被傳輸軟體壓縮所導致的,該如何避免這種情況呢,如何才能無損傳輸文件到另一個設備上呢,大家可以藉助EV錄屏這款軟體,可以將手機上錄屏的視頻文件通過無損不壓縮的形式傳輸到電腦上播放原視頻,下面就給大家帶來相關教程,希望可以給你帶來幫助。如何無損傳輸錄影檔案到手機上第一步,在手機上下載EV錄影這款軟體,然後在首頁點擊“工具包”,找到“WiFi傳輸”這個功能。 第二步,讓手

PHP和swoole如何實現高效率的資料快取和儲存?概述:在Web應用開發中,資料的快取和儲存是非常重要的一部分。而PHP和swoole提供了一種高效率的方法來實現資料的快取與儲存。本文將介紹如何使用PHP和swoole來實現高效的資料快取和存儲,並給出相應的程式碼範例。一、swoole簡介:swoole是一個針對PHP語言開發的,高效能的非同步網路通訊引擎,它可以

本文轉載自微信公眾號「活在資訊時代」,作者活在資訊時代。轉載本文請聯絡活在資訊時代公眾號。對於熟悉資料庫操作的同學來說,編寫優美的SQL語句,從資料庫中想辦法找出自己需要的數據,是常規操作了。而對於熟悉機器學習的同學來說,獲取數據,對數據進行預處理,建立模型,確定訓練集和測試集,用訓練好的模型對未來進行一系列的預測,也是一種常規操作了。那麼,我們能否將兩種技術結合起來呢?我們看到資料庫裡儲存了數據,而進行預測需要基於以往的數據。如果我們透過資料庫裡現有的數據,對於未來的數據進行查詢的話,那麼是
