輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器-人工智慧-PHP中文網

1. 背景

2. AFF Token Mixer: 輕量、全域、自適應

5. 結論

首頁

科技週邊

人工智慧

輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 17, 2023 pm 05:57 PM

研究計算

1. 背景

多年來，Transformer、Large-kernel CNN和MLP這三個視覺主幹網路在廣泛的電腦視覺任務中取得了巨大的成功，這主要歸功於它們在全局範圍內高效地融合信息的能力

Transformer、CNN和MLP是當前三種主流的神經網絡，它們分別採用不同的方式來實現全域範圍的Token融合。在Transformer網路中，自註意力機制利用查詢-鍵對的相關性作為Token融合的權重。 CNN透過擴大卷積核的尺寸來實現與Transformer相似的性能。而MLP則透過全連接在所有令牌之間實現另一個強大的範式。儘管這些方法都是有效的，但它們的運算複雜度較高（O(N^2)），難以在儲存和運算能力有限的裝置上部署，從而限制了許多模型的應用範圍

2. AFF Token Mixer: 輕量、全域、自適應

為了解決計算昂貴的問題，研究人員開發了一種名為自適應傅裡葉濾波器（Adaptive Fourier Filter，AFF）的高效全域Token融合演算法。此演算法利用傅立葉變換將Token集合轉換到頻域，並在頻域學習到一個能夠自適應內容的濾波掩膜，以對轉換到頻域空間中的Token集合進行自適應濾波操作

Adaptive Frequency Filters: Efficient Global Token Mixers

輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器

#點擊此連結可存取原文：https://arxiv .org/abs/2307.14008

根據頻域卷積定理，AFF Token Mixer 的數學等價操作是在原始域中進行的捲積操作，相當於在傅立葉域中進行的Hadamard乘積操作。這意味著AFF Token Mixer 可以透過在原始域中使用動態卷積核，其空間解析度與Token集合大小相同，來實現內容自適應的全域Token融合（如下圖右子圖所示）

眾所周知，動態卷積的運算成本很高，尤其是在使用大空間解析度的動態卷積核時，對於高效能/ 輕量級網路設計來說，這種成本似乎是難以接受的。然而，本文提出的AFF Token Mixer 卻能夠以低功耗的等效實現方式同時滿足上述要求，將複雜性從O (N^2) 降低到O (N log N)，從而顯著提高了計算效率

輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器

示意圖1：展示了AFF 模組和AFFNet 網路的結構

##3. AFFNet：輕量級視覺網路新主幹

透過將AFF Token Mixer 作為主要神經網路操作算子，研究人員成功建構了一個稱為AFFNet 的輕量級神經網路。豐富的實驗結果表明，AFF Token Mixer 在廣泛的視覺任務中取得了卓越的準確性和效率平衡，包括視覺語義識別和密集預測任務

4.實驗結果

研究人員評估了AFF Token Mixer和AFFNet在視覺語義識別、分割、檢測等多個任務上的性能，並與目前研究領域中最先進的輕量級視覺主幹網路進行了比較。實驗結果顯示，該模型設計在廣泛的視覺任務中表現出色，證實了AFF Token Mixer作為新一代輕量級高效的Token融合算子的潛力

輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器

##與SOTA相比，圖2展示了在ImageNet-1K資料集上的Acc-Param和Acc-FLOPs曲線

輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器

比較最先進的方法與ImageNet-1K資料集的結果，見表1

輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器

#表2顯示了視覺偵測與分割任務與最先進技術的比較

5. 結論

這項研究證明了隱空間中的頻域變換在全域自適應Token 融合中起到了重要作用，是一種高效且低功耗的等效實現方式。它為神經網路中的Token 融合算子設計提供了新的研究思路，並為在邊緣設備上部署神經網路模型提供了新的發展空間，尤其是在儲存和運算能力有限的情況下

以上是輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7493

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

CUDA之通用矩陣乘法：從入門到熟練！ Mar 25, 2024 pm 12:30 PM

通用矩陣乘法（GeneralMatrixMultiplication，GEMM）是許多應用程式和演算法中至關重要的一部分，也是評估電腦硬體效能的重要指標之一。透過深入研究和優化GEMM的實現，可以幫助我們更好地理解高效能運算以及軟硬體系統之間的關係。在電腦科學中，對GEMM進行有效的最佳化可以提高運算速度並節省資源，這對於提高電腦系統的整體效能至關重要。深入了解GEMM的工作原理和最佳化方法，有助於我們更好地利用現代計算硬體的潛力，並為各種複雜計算任務提供更有效率的解決方案。透過對GEMM性能的優

word文檔怎麼計算加減乘除 Mar 19, 2024 pm 08:13 PM

WORD是一個強大的文字處理器，我們可以利用word進行各種文字的編輯，在Excel表格當中，我們已經熟練了加減乘數的運算方法，那麼如果需要在Word表格裡，計算數值的加減乘數，該如何操作呢，難道只能用計算機計算嗎？答案當然是否定的，WORD也同樣可以完成。今天小編就來教大家如何在Word文件的表格當中，運用公式計算加減乘除等基本運算，一起來學習一下吧。那麼，今天就讓小編具體示範一下，WORD文件怎麼計算加減乘除？第一步：開啟一個WORD,點選工具列【插入】下的【表格】，在下拉式選單當中插入一

深入探討模型、資料與架構：一份詳盡的54頁高效能大語言模型綜述 Jan 14, 2024 pm 07:48 PM

大規模語言模型（LLMs）在許多重要任務中展現了引人注目的能力，包括自然語言理解、語言生成和複雜推理，並對社會產生了深遠的影響。然而，這些出色的能力卻需要大量的訓練資源（如左圖）和較長的推理時間（如右圖）。因此，研究人員需要開發有效的技術手段來解決它們的效率問題。此外，從圖的右邊還可以看出，一些高效率的LLMs（LanguageModels）如Mistral-7B，已經成功應用於LLMs的設計和部署中。這些高效的LLMs在保持與LLaMA1-33B相近的準確性的同時，能夠大大減少推理內存

如何使用Python的count()函數計算清單中某個元素的數量 Nov 18, 2023 pm 02:53 PM

如何使用Python的count()函數計算清單中某個元素的數量，需要具體程式碼範例Python作為一種強大且易學的程式語言，提供了許多內建函數來處理不同的資料結構。其中之一就是count()函數，它可以用來計算清單中某個元素的數量。在本文中，我們將詳細介紹如何使用count()函數，並提供具體的程式碼範例。 count()函數是Python的內建函數，用來計算某

在Java中遞歸地計算子字串出現的次數 Sep 17, 2023 pm 07:49 PM

給定兩個字串str_1和str_2。目標是使用遞歸過程計算字串str1中子字串str2的出現次數。遞歸函數是在其定義中呼叫自身的函數。如果str1是"Iknowthatyouknowthatiknow"，str2是"know"出現次數為-3讓我們透過範例來理解。例如輸入str1="TPisTPareTPamTP",str2="TP";輸出Countofoccurrencesofasubstringrecursi

如何使用C#中的Math.Pow函數計算指定數的冪次方 Nov 18, 2023 am 11:32 AM

在C#中，有一個Math類別庫，其中包含許多數學函數。其中包括計算冪次方的函數Math.Pow，它可以幫助我們計算指定數的冪。 Math.Pow函數的用法非常簡單，只需要指定底數和指數就可以了。其語法如下：Math.Pow(base,exponent);其中base表示底數，exponent表示指數。此函數傳回double類型的結果，即冪次方的計算結果。下面讓

碾壓H100，英偉達下一代GPU曝光！首個3nm多晶片模組設計，2024年亮相 Sep 30, 2023 pm 12:49 PM

3奈米製程，性能超越H100！最近，根據外媒DigiTimes爆料，英偉達正在開發下一代GPU，代號為「Blackwell」的B100據稱，作為面向人工智慧（AI）和高性能計算（HPC）應用的產品，B100將採用台積電的3nm工藝過程，以及更為複雜的多晶片模組（MCM）設計，並將於2024年第四季現身。對於壟斷了人工智慧GPU市場80%以上份額的英偉達來說，則可以藉著B100趁熱打鐵，在這波AI部署的熱潮中進一步狙擊AMD、英特爾等挑戰者。根據英偉達的估計，到2027年，該領域的產值預計將達到約

使用行列式計算三角形面積的Java程序 Aug 31, 2023 am 10:17 AM

簡介使用行列式計算三角形面積的Java程序是一個簡潔且有效率的程序，可以根據給定三個頂點的座標來計算三角形的面積。該程式對於學習或使用幾何的任何人都非常有用，因為它演示瞭如何在Java中使用基本算術和代數計算，以及如何使用Scanner類讀取使用者輸入。程式提示使用者輸入三角形三個點的座標，然後將其讀入並用於計算座標矩陣的行列式。使用行列式的絕對值來確保面積始終為正，然後使用公式計算三角形的面積並顯示給使用者。該程式可以輕鬆修改以接受不同格式的輸入或執行附加計算，使其成為幾何計算的多功能工具。決定因素行列

See all articles

輕量級視覺網路新主幹：高效率的傅立葉算符Token混合器

1. 背景

2. AFF Token Mixer: 輕量、全域、自適應

##3. AFFNet：輕量級視覺網路新主幹

4.實驗結果

5. 結論

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題