輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器
1. 背景
多年來,Transformer、Large-kernel CNN和MLP這三個視覺主幹網路在廣泛的電腦視覺任務中取得了巨大的成功,這主要歸功於它們在全局範圍內高效地融合信息的能力
Transformer、CNN和MLP是當前三種主流的神經網絡,它們分別採用不同的方式來實現全域範圍的Token融合。在Transformer網路中,自註意力機制利用查詢-鍵對的相關性作為Token融合的權重。 CNN透過擴大卷積核的尺寸來實現與Transformer相似的性能。而MLP則透過全連接在所有令牌之間實現另一個強大的範式。儘管這些方法都是有效的,但它們的運算複雜度較高(O(N^2)),難以在儲存和運算能力有限的裝置上部署,從而限制了許多模型的應用範圍
2. AFF Token Mixer: 輕量、全域、自適應
為了解決計算昂貴的問題,研究人員開發了一種名為自適應傅裡葉濾波器(Adaptive Fourier Filter,AFF)的高效全域Token融合演算法。此演算法利用傅立葉變換將Token集合轉換到頻域,並在頻域學習到一個能夠自適應內容的濾波掩膜,以對轉換到頻域空間中的Token集合進行自適應濾波操作
Adaptive Frequency Filters: Efficient Global Token Mixers
#點擊此連結可存取原文:https://arxiv .org/abs/2307.14008
根據頻域卷積定理,AFF Token Mixer 的數學等價操作是在原始域中進行的捲積操作,相當於在傅立葉域中進行的Hadamard乘積操作。這意味著AFF Token Mixer 可以透過在原始域中使用動態卷積核,其空間解析度與Token集合大小相同,來實現內容自適應的全域Token融合(如下圖右子圖所示)
眾所周知,動態卷積的運算成本很高,尤其是在使用大空間解析度的動態卷積核時,對於高效能/ 輕量級網路設計來說,這種成本似乎是難以接受的。然而,本文提出的AFF Token Mixer 卻能夠以低功耗的等效實現方式同時滿足上述要求,將複雜性從O (N^2) 降低到O (N log N),從而顯著提高了計算效率
示意圖1:展示了AFF 模組和AFFNet 網路的結構
##3. AFFNet:輕量級視覺網路新主幹
透過將AFF Token Mixer 作為主要神經網路操作算子,研究人員成功建構了一個稱為AFFNet 的輕量級神經網路。豐富的實驗結果表明,AFF Token Mixer 在廣泛的視覺任務中取得了卓越的準確性和效率平衡,包括視覺語義識別和密集預測任務
4.實驗結果
研究人員評估了AFF Token Mixer和AFFNet在視覺語義識別、分割、檢測等多個任務上的性能,並與目前研究領域中最先進的輕量級視覺主幹網路進行了比較。實驗結果顯示,該模型設計在廣泛的視覺任務中表現出色,證實了AFF Token Mixer作為新一代輕量級高效的Token融合算子的潛力
這項研究證明了隱空間中的頻域變換在全域自適應Token 融合中起到了重要作用,是一種高效且低功耗的等效實現方式。它為神經網路中的Token 融合算子設計提供了新的研究思路,並為在邊緣設備上部署神經網路模型提供了新的發展空間,尤其是在儲存和運算能力有限的情況下5. 結論
以上是輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

通用矩陣乘法(GeneralMatrixMultiplication,GEMM)是許多應用程式和演算法中至關重要的一部分,也是評估電腦硬體效能的重要指標之一。透過深入研究和優化GEMM的實現,可以幫助我們更好地理解高效能運算以及軟硬體系統之間的關係。在電腦科學中,對GEMM進行有效的最佳化可以提高運算速度並節省資源,這對於提高電腦系統的整體效能至關重要。深入了解GEMM的工作原理和最佳化方法,有助於我們更好地利用現代計算硬體的潛力,並為各種複雜計算任務提供更有效率的解決方案。透過對GEMM性能的優

WORD是一個強大的文字處理器,我們可以利用word進行各種文字的編輯,在Excel表格當中,我們已經熟練了加減乘數的運算方法,那麼如果需要在Word表格裡,計算數值的加減乘數,該如何操作呢,難道只能用計算機計算嗎?答案當然是否定的,WORD也同樣可以完成。今天小編就來教大家如何在Word文件的表格當中,運用公式計算加減乘除等基本運算,一起來學習一下吧。那麼,今天就讓小編具體示範一下,WORD文件怎麼計算加減乘除?第一步:開啟一個WORD,點選工具列【插入】下的【表格】,在下拉式選單當中插入一

大規模語言模型(LLMs)在許多重要任務中展現了引人注目的能力,包括自然語言理解、語言生成和複雜推理,並對社會產生了深遠的影響。然而,這些出色的能力卻需要大量的訓練資源(如左圖)和較長的推理時間(如右圖)。因此,研究人員需要開發有效的技術手段來解決它們的效率問題。此外,從圖的右邊還可以看出,一些高效率的LLMs(LanguageModels)如Mistral-7B,已經成功應用於LLMs的設計和部署中。這些高效的LLMs在保持與LLaMA1-33B相近的準確性的同時,能夠大大減少推理內存

如何使用Python的count()函數計算清單中某個元素的數量,需要具體程式碼範例Python作為一種強大且易學的程式語言,提供了許多內建函數來處理不同的資料結構。其中之一就是count()函數,它可以用來計算清單中某個元素的數量。在本文中,我們將詳細介紹如何使用count()函數,並提供具體的程式碼範例。 count()函數是Python的內建函數,用來計算某

給定兩個字串str_1和str_2。目標是使用遞歸過程計算字串str1中子字串str2的出現次數。遞歸函數是在其定義中呼叫自身的函數。如果str1是"Iknowthatyouknowthatiknow",str2是"know"出現次數為-3讓我們透過範例來理解。例如輸入str1="TPisTPareTPamTP",str2="TP";輸出Countofoccurrencesofasubstringrecursi

在C#中,有一個Math類別庫,其中包含許多數學函數。其中包括計算冪次方的函數Math.Pow,它可以幫助我們計算指定數的冪。 Math.Pow函數的用法非常簡單,只需要指定底數和指數就可以了。其語法如下:Math.Pow(base,exponent);其中base表示底數,exponent表示指數。此函數傳回double類型的結果,即冪次方的計算結果。下面讓

3奈米製程,性能超越H100!最近,根據外媒DigiTimes爆料,英偉達正在開發下一代GPU,代號為「Blackwell」的B100據稱,作為面向人工智慧(AI)和高性能計算(HPC)應用的產品,B100將採用台積電的3nm工藝過程,以及更為複雜的多晶片模組(MCM)設計,並將於2024年第四季現身。對於壟斷了人工智慧GPU市場80%以上份額的英偉達來說,則可以藉著B100趁熱打鐵,在這波AI部署的熱潮中進一步狙擊AMD、英特爾等挑戰者。根據英偉達的估計,到2027年,該領域的產值預計將達到約

簡介使用行列式計算三角形面積的Java程序是一個簡潔且有效率的程序,可以根據給定三個頂點的座標來計算三角形的面積。該程式對於學習或使用幾何的任何人都非常有用,因為它演示瞭如何在Java中使用基本算術和代數計算,以及如何使用Scanner類讀取使用者輸入。程式提示使用者輸入三角形三個點的座標,然後將其讀入並用於計算座標矩陣的行列式。使用行列式的絕對值來確保面積始終為正,然後使用公式計算三角形的面積並顯示給使用者。該程式可以輕鬆修改以接受不同格式的輸入或執行附加計算,使其成為幾何計算的多功能工具。決定因素行列
