目錄
1. 背景
2. AFF Token Mixer: 輕量、全域、自適應
5. 結論
首頁 科技週邊 人工智慧 輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器

輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器

Aug 17, 2023 pm 05:57 PM
研究 計算

1. 背景

多年來,Transformer、Large-kernel CNN和MLP這三個視覺主幹網路在廣泛的電腦視覺任務中取得了巨大的成功,這主要歸功於它們在全局範圍內高效地融合信息的能力

Transformer、CNN和MLP是當前三種主流的神經網絡,它們分別採用不同的方式來實現全域範圍的Token融合。在Transformer網路中,自註意力機制利用查詢-鍵對的相關性作為Token融合的權重。 CNN透過擴大卷積核的尺寸來實現與Transformer相似的性能。而MLP則透過全連接在所有令牌之間實現另一個強大的範式。儘管這些方法都是有效的,但它們的運算複雜度較高(O(N^2)),難以在儲存和運算能力有限的裝置上部署,從而限制了許多模型的應用範圍

2. AFF Token Mixer: 輕量、全域、自適應

為了解決計算昂貴的問題,研究人員開發了一種名為自適應傅裡葉濾波器(Adaptive Fourier Filter,AFF)的高效全域Token融合演算法。此演算法利用傅立葉變換將Token集合轉換到頻域,並在頻域學習到一個能夠自適應內容的濾波掩膜,以對轉換到頻域空間中的Token集合進行自適應濾波操作

Adaptive Frequency Filters: Efficient Global Token Mixers

輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器

#點擊此連結可存取原文:https://arxiv .org/abs/2307.14008

根據頻域卷積定理,AFF Token Mixer 的數學等價操作是在原始域中進行的捲積操作,相當於在傅立葉域中進行的Hadamard乘積操作。這意味著AFF Token Mixer 可以透過在原始域中使用動態卷積核,其空間解析度與Token集合大小相同,來實現內容自適應的全域Token融合(如下圖右子圖所示)

眾所周知,動態卷積的運算成本很高,尤其是在使用大空間解析度的動態卷積核時,對於高效能/ 輕量級網路設計來說,這種成本似乎是難以接受的。然而,本文提出的AFF Token Mixer 卻能夠以低功耗的等效實現方式同時滿足上述要求,將複雜性從O (N^2) 降低到O (N log N),從而顯著提高了計算效率

輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器

示意圖1:展示了AFF 模組和AFFNet 網路的結構

##3. AFFNet:輕量級視覺網路新主幹

透過將AFF Token Mixer 作為主要神經網路操作算子,研究人員成功建構了一個稱為AFFNet 的輕量級神經網路。豐富的實驗結果表明,AFF Token Mixer 在廣泛的視覺任務中取得了卓越的準確性和效率平衡,包括視覺語義識別和密集預測任務

4.實驗結果

研究人員評估了AFF Token Mixer和AFFNet在視覺語義識別、分割、檢測等多個任務上的性能,並與目前研究領域中最先進的輕量級視覺主幹網路進行了比較。實驗結果顯示,該模型設計在廣泛的視覺任務中表現出色,證實了AFF Token Mixer作為新一代輕量級高效的Token融合算子的潛力

輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器

##與SOTA相比,圖2展示了在ImageNet-1K資料集上的Acc-Param和Acc-FLOPs曲線

輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器

比較最先進的方法與ImageNet-1K資料集的結果,見表1

輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器

#表2顯示了視覺偵測與分割任務與最先進技術的比較

5. 結論

這項研究證明了隱空間中的頻域變換在全域自適應Token 融合中起到了重要作用,是一種高效且低功耗的等效實現方式。它為神經網路中的Token 融合算子設計提供了新的研究思路,並為在邊緣設備上部署神經網路模型提供了新的發展空間,尤其是在儲存和運算能力有限的情況下

以上是輕量級視覺網路新主幹:高效率的傅立葉算符Token混合器的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

CUDA之通用矩陣乘法:從入門到熟練! CUDA之通用矩陣乘法:從入門到熟練! Mar 25, 2024 pm 12:30 PM

通用矩陣乘法(GeneralMatrixMultiplication,GEMM)是許多應用程式和演算法中至關重要的一部分,也是評估電腦硬體效能的重要指標之一。透過深入研究和優化GEMM的實現,可以幫助我們更好地理解高效能運算以及軟硬體系統之間的關係。在電腦科學中,對GEMM進行有效的最佳化可以提高運算速度並節省資源,這對於提高電腦系統的整體效能至關重要。深入了解GEMM的工作原理和最佳化方法,有助於我們更好地利用現代計算硬體的潛力,並為各種複雜計算任務提供更有效率的解決方案。透過對GEMM性能的優

word文檔怎麼計算加減乘除 word文檔怎麼計算加減乘除 Mar 19, 2024 pm 08:13 PM

WORD是一個強大的文字處理器,我們可以利用word進行各種文字的編輯,在Excel表格當中,我們已經熟練了加減乘數的運算方法,那麼如果需要在Word表格裡,計算數值的加減乘數,該如何操作呢,難道只能用計算機計算嗎?答案當然是否定的,WORD也同樣可以完成。今天小編就來教大家如何在Word文件的表格當中,運用公式計算加減乘除等基本運算,一起來學習一下吧。那麼,今天就讓小編具體示範一下,WORD文件怎麼計算加減乘除?第一步:開啟一個WORD,點選工具列【插入】下的【表格】,在下拉式選單當中插入一

深入探討模型、資料與架構:一份詳盡的54頁高效能大語言模型綜述 深入探討模型、資料與架構:一份詳盡的54頁高效能大語言模型綜述 Jan 14, 2024 pm 07:48 PM

大規模語言模型(LLMs)在許多重要任務中展現了引人注目的能力,包括自然語言理解、語言生成和複雜推理,並對社會產生了深遠的影響。然而,這些出色的能力卻需要大量的訓練資源(如左圖)和較長的推理時間(如右圖)。因此,研究人員需要開發有效的技術手段來解決它們的效率問題。此外,從圖的右邊還可以看出,一些高效率的LLMs(LanguageModels)如Mistral-7B,已經成功應用於LLMs的設計和部署中。這些高效的LLMs在保持與LLaMA1-33B相近的準確性的同時,能夠大大減少推理內存

如何使用Python的count()函數計算清單中某個元素的數量 如何使用Python的count()函數計算清單中某個元素的數量 Nov 18, 2023 pm 02:53 PM

如何使用Python的count()函數計算清單中某個元素的數量,需要具體程式碼範例Python作為一種強大且易學的程式語言,提供了許多內建函數來處理不同的資料結構。其中之一就是count()函數,它可以用來計算清單中某個元素的數量。在本文中,我們將詳細介紹如何使用count()函數,並提供具體的程式碼範例。 count()函數是Python的內建函數,用來計算某

在Java中遞歸地計算子字串出現的次數 在Java中遞歸地計算子字串出現的次數 Sep 17, 2023 pm 07:49 PM

給定兩個字串str_1和str_2。目標是使用遞歸過程計算字串str1中子字串str2的出現次數。遞歸函數是在其定義中呼叫自身的函數。如果str1是"Iknowthatyouknowthatiknow",str2是"know"出現次數為-3讓我們透過範例來理解。例如輸入str1="TPisTPareTPamTP",str2="TP";輸出Countofoccurrencesofasubstringrecursi

如何使用C#中的Math.Pow函數計算指定數的冪次方 如何使用C#中的Math.Pow函數計算指定數的冪次方 Nov 18, 2023 am 11:32 AM

在C#中,有一個Math類別庫,其中包含許多數學函數。其中包括計算冪次方的函數Math.Pow,它可以幫助我們計算指定數的冪。 Math.Pow函數的用法非常簡單,只需要指定底數和指數就可以了。其語法如下:Math.Pow(base,exponent);其中base表示底數,exponent表示指數。此函數傳回double類型的結果,即冪次方的計算結果。下面讓

碾壓H100,英偉達下一代GPU曝光!首個3nm多晶片模組設計,2024年亮相 碾壓H100,英偉達下一代GPU曝光!首個3nm多晶片模組設計,2024年亮相 Sep 30, 2023 pm 12:49 PM

3奈米製程,性能超越H100!最近,根據外媒DigiTimes爆料,英偉達正在開發下一代GPU,代號為「Blackwell」的B100據稱,作為面向人工智慧(AI)和高性能計算(HPC)應用的產品,B100將採用台積電的3nm工藝過程,以及更為複雜的多晶片模組(MCM)設計,並將於2024年第四季現身。對於壟斷了人工智慧GPU市場80%以上份額的英偉達來說,則可以藉著B100趁熱打鐵,在這波AI部署的熱潮中進一步狙擊AMD、英特爾等挑戰者。根據英偉達的估計,到2027年,該領域的產值預計將達到約

使用行列式計算三角形面積的Java程序 使用行列式計算三角形面積的Java程序 Aug 31, 2023 am 10:17 AM

簡介使用行列式計算三角形面積的Java程序是一個簡潔且有效率的程序,可以根據給定三個頂點的座標來計算三角形的面積。該程式對於學習或使用幾何的任何人都非常有用,因為它演示瞭如何在Java中使用基本算術和代數計算,以及如何使用Scanner類讀取使用者輸入。程式提示使用者輸入三角形三個點的座標,然後將其讀入並用於計算座標矩陣的行列式。使用行列式的絕對值來確保面積始終為正,然後使用公式計算三角形的面積並顯示給使用者。該程式可以輕鬆修改以接受不同格式的輸入或執行附加計算,使其成為幾何計算的多功能工具。決定因素行列

See all articles