目录
1. 背景
2. AFF Token Mixer: 轻量、全局、自适应
3. AFFNet:轻量级视觉网络新主干
4. 实验结果
5. 结论
首页 科技周边 人工智能 轻量级视觉网络新主干:高效的傅里叶算子Token混合器

轻量级视觉网络新主干:高效的傅里叶算子Token混合器

Aug 17, 2023 pm 05:57 PM
研究 计算

1. 背景

这些年来,Transformer、Large-kernel CNN和MLP这三种视觉主干网络在广泛的计算机视觉任务中取得了巨大的成功,这主要归功于它们在全局范围内高效地融合信息的能力

Transformer、CNN和MLP是当前三种主流的神经网络,它们分别采用不同的方式来实现全局范围的Token融合。在Transformer网络中,自注意力机制利用查询-键对的相关性作为Token融合的权重。CNN通过扩大卷积核的尺寸来实现与Transformer相似的性能。而MLP则通过全连接在所有令牌之间实现另一种强大的范式。尽管这些方法都是有效的,但它们的计算复杂度较高(O(N^2)),难以在存储和计算能力有限的设备上部署,从而限制了很多模型的应用范围

2. AFF Token Mixer: 轻量、全局、自适应

为了解决计算昂贵的问题,研究人员开发了一种名为自适应傅里叶滤波器(Adaptive Fourier Filter,AFF)的高效全局Token融合算法。该算法利用傅里叶变换将Token集合转换到频域,并在频域学习到一个能够自适应内容的滤波掩膜,以对转换到频域空间中的Token集合进行自适应滤波操作

Adaptive Frequency Filters: Efficient Global Token Mixers

轻量级视觉网络新主干:高效的傅里叶算子Token混合器

点击此链接可访问原文:https://arxiv.org/abs/2307.14008

根据频域卷积定理,AFF Token Mixer 的数学等价操作是在原始域中进行的卷积操作,相当于在傅里叶域中进行的Hadamard乘积操作。这意味着AFF Token Mixer 可以通过在原始域中使用一个动态卷积核,其空间分辨率与Token集合大小相同,来实现内容自适应的全局Token融合(如下图右子图所示)

众所周知,动态卷积的计算成本很高,尤其是在使用大空间分辨率的动态卷积核时,对于高效 / 轻量级网络设计来说,这种成本似乎是难以接受的。然而,本文提出的 AFF Token Mixer 却能够以低功耗的等效实现方式同时满足上述要求,将复杂性从 O (N^2) 降低到 O (N log N),从而显著提高了计算效率

轻量级视觉网络新主干:高效的傅里叶算子Token混合器

示意图 1:展示了 AFF 模块和 AFFNet 网络的结构

3. AFFNet:轻量级视觉网络新主干

通过将 AFF Token Mixer 作为主要神经网络操作算子,研究人员成功构建了一个称为 AFFNet 的轻量级神经网络。丰富的实验结果表明,AFF Token Mixer 在广泛的视觉任务中取得了卓越的准确性和效率平衡,包括视觉语义识别和密集预测任务

4. 实验结果

研究人员评估了AFF Token Mixer和AFFNet在视觉语义识别、分割、检测等多个任务上的性能,并与目前研究领域中最先进的轻量级视觉主干网络进行了比较。实验结果显示,该模型设计在广泛的视觉任务中表现出色,证实了AFF Token Mixer作为新一代轻量高效的Token融合算子的潜力

轻量级视觉网络新主干:高效的傅里叶算子Token混合器

与SOTA相比,图2展示了在ImageNet-1K数据集上的Acc-Param和Acc-FLOPs曲线

轻量级视觉网络新主干:高效的傅里叶算子Token混合器

对比最先进的方法与ImageNet-1K数据集的结果,见表1

轻量级视觉网络新主干:高效的傅里叶算子Token混合器

表2显示了视觉检测和分割任务与最先进技术的比较

5. 结论

这项研究证明了隐空间中的频域变换在全局自适应 Token 融合中起到了重要作用,是一种高效且低功耗的等效实现方式。它为神经网络中的 Token 融合算子设计提供了新的研究思路,并为在边缘设备上部署神经网络模型提供了新的发展空间,尤其是在存储和计算能力有限的情况下

以上是轻量级视觉网络新主干:高效的傅里叶算子Token混合器的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

CUDA之通用矩阵乘法:从入门到熟练! CUDA之通用矩阵乘法:从入门到熟练! Mar 25, 2024 pm 12:30 PM

通用矩阵乘法(GeneralMatrixMultiplication,GEMM)是许多应用程序和算法中至关重要的一部分,也是评估计算机硬件性能的重要指标之一。通过深入研究和优化GEMM的实现,可以帮助我们更好地理解高性能计算以及软硬件系统之间的关系。在计算机科学中,对GEMM进行有效的优化可以提高计算速度并节省资源,这对于提高计算机系统的整体性能至关重要。深入了解GEMM的工作原理和优化方法,有助于我们更好地利用现代计算硬件的潜力,并为各种复杂计算任务提供更高效的解决方案。通过对GEMM性能的优

word文档怎么计算加减乘除 word文档怎么计算加减乘除 Mar 19, 2024 pm 08:13 PM

WORD是一个强大的文字处理器,我们可以利用word进行各种文字的编辑,在Excel表格当中,我们已经熟练掌握了加减乘数的运算方法,那么如果需要在Word表格里,计算数值的加减乘数,该如何操作呢,难道只能用计算器计算吗?答案当然是否定的,WORD也同样可以完成。今天小编就来教大家如何在Word文档的表格当中,运用公式计算加减乘除等基本运算,一起来学习一下吧。那么,今天就让小编具体演示一下,WORD文档怎么计算加减乘除?第一步:打开一个WORD,单击工具栏【插入】下的【表格】,在下拉菜单当中插入一

深入探讨模型、数据和框架:一份详尽的54页高效大语言模型综述 深入探讨模型、数据和框架:一份详尽的54页高效大语言模型综述 Jan 14, 2024 pm 07:48 PM

大规模语言模型(LLMs)在许多重要任务中展现出了引人注目的能力,包括自然语言理解、语言生成和复杂推理,并对社会产生了深远的影响。然而,这些出色的能力却需要大量的训练资源(如左图所示)和较长的推理时间(如右图所示)。因此,研究人员需要开发有效的技术手段来解决它们的效率问题。此外,从图的右侧还可以看出,一些高效的LLMs(LanguageModels)如Mistral-7B,已经成功应用于LLMs的设计和部署中。这些高效的LLMs在保持与LLaMA1-33B相近的准确性的同时,能够大大减少推理内存

如何使用Python的count()函数计算列表中某个元素的数量 如何使用Python的count()函数计算列表中某个元素的数量 Nov 18, 2023 pm 02:53 PM

如何使用Python的count()函数计算列表中某个元素的数量,需要具体代码示例Python作为一种强大且易学的编程语言,提供了许多内置函数来处理不同的数据结构。其中之一就是count()函数,它可以用来计算列表中某个元素的数量。在本文中,我们将详细介绍如何使用count()函数,并提供具体的代码示例。count()函数是Python的内置函数,用于计算某

在Java中递归地计算子字符串出现的次数 在Java中递归地计算子字符串出现的次数 Sep 17, 2023 pm 07:49 PM

给定两个字符串str_1和str_2。目标是使用递归过程计算字符串str1中子字符串str2的出现次数。递归函数是在其定义中调用自身的函数。如果str1是"Iknowthatyouknowthatiknow",str2是"know"出现次数为-3让我们通过示例来理解。例如输入str1="TPisTPareTPamTP",str2="TP";输出Countofoccurrencesofasubstringrecursi

如何使用C#中的Math.Pow函数计算指定数的幂次方 如何使用C#中的Math.Pow函数计算指定数的幂次方 Nov 18, 2023 am 11:32 AM

在C#中,有一个Math类库,其中包含许多数学函数。其中包括计算幂次方的函数Math.Pow,它可以帮助我们计算指定数的幂。Math.Pow函数的用法非常简单,只需要指定底数和指数就可以了。其语法如下:Math.Pow(base,exponent);其中base表示底数,exponent表示指数。该函数返回double类型的结果,即幂次方的计算结果。下面让

碾压H100,英伟达下一代GPU曝光!首个3nm多芯片模块设计,2024年亮相 碾压H100,英伟达下一代GPU曝光!首个3nm多芯片模块设计,2024年亮相 Sep 30, 2023 pm 12:49 PM

3纳米制程,性能超越H100!最近,据外媒DigiTimes爆料,英伟达正在开发下一代GPU,代号为「Blackwell」的B100据称,作为面向人工智能(AI)和高性能计算(HPC)应用的产品,B100将采用台积电的3nm工艺制程,以及更为复杂的多芯片模块(MCM)设计,并将于2024年第四季度现身。对于垄断了人工智能GPU市场80%以上份额的英伟达来说,则可以借着B100趁热打铁,在这波AI部署的热潮中进一步狙击AMD、英特尔等挑战者。根据英伟达的估计,到2027年,该领域的产值预计将达到约

使用行列式计算三角形面积的Java程序 使用行列式计算三角形面积的Java程序 Aug 31, 2023 am 10:17 AM

简介使用行列式计算三角形面积的Java程序是一个简洁高效的程序,可以根据给定三个顶点的坐标来计算三角形的面积。该程序对于学习或使用几何的任何人都非常有用,因为它演示了如何在Java中使用基本算术和代数计算,以及如何使用Scanner类读取用户输入。程序提示用户输入三角形三个点的坐标,然后将其读入并用于计算坐标矩阵的行列式。使用行列式的绝对值来确保面积始终为正,然后使用公式计算三角形的面积并显示给用户。该程序可以轻松修改以接受不同格式的输入或执行附加计算,使其成为几何计算的多功能工具。决定因素行列

See all articles