北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了
近年来,对视觉感知系统安全性评估的研究已经逐渐深入,已经有研究人员成功地开发了基于眼镜、贴纸、衣物等不同载体的可见光模态安全评估技术,并且还有一些对红外模态的新尝试。然而,这些技术都只能应用于单一的模态
随着人工智能技术的发展,可见光-热红外成像技术已广泛应用于治安监控、自动驾驶等安全关键任务中。可见光成像在白天能提供丰富的纹理信息,而红外成像则能在夜间清晰显示目标的热辐射分布。二者结合使用,视觉感知系统可以实现24小时全覆盖,并且不受环境限制,具备许多优势。因此,需要研究针对多模态视觉感知系统的统一安全评估方法
然而,实现多模态评估极具挑战性。首先,在不同成像机制下打击方法通用难。以前的方法都分别基于特定目标模态成像特点提出,在其他模态下很难起到作用。再者,平衡隐身性能、制作成本和灵活应用难。对于可见光和更难的红外模态双重有效已是不易,实现低成本便捷制作与使用更是难上加难。
面对诸多挑战,来自北航人工智能研究院的研究者挖掘可见光 - 红外模态间通用的形状属性,创新性地提出 「跨模态通用对抗补丁」,实现可见光 - 红外同步隐身。其遴选易获取、成本低、隔热性能优异的材料制作便捷贴片,即拆即用,在填补当前物理世界可见光 - 红外多模态检测系统鲁棒性评估技术缺失的同时,兼顾物理实现的简易性与即时性。实验证明了该方法在不同检测模型与模态下的有效性,以及多场景下的泛化性。目前,该论文已被 ICCV 2023 接收。
请点击以下链接查看论文:https://arxiv.org/abs/2307.07859
代码链接:https://github.com/Aries-iai/Cross-modal_Patch_Attack
技术要点
该研究以进化算法为基础框架,从形状建模、形状优化和模态平衡三个角度进行方案设计和效果改进。具体流程如下图所示:
1. 基于样条插值的多锚点形状建模
对于基础形状建模部分,研究人员设计了一种点优化建模新范式。通过改变点的坐标,可以直接调整补丁的形状,而不受方向、距离等限制的影响。这样有效地增大了补丁形状的搜索空间。为了确保形状的自然性,研究人员还利用了样条插值方法来实现平滑连接,使得样条更紧密地跟随控制点
2. 边界限定形状优化算法基于差分进化的原理
实现打击需要有效的优化手段,为此研究人员从时间成本、实际效果等角度考量,以进化算法作为基本框架,并从边界设定、适应度函数两个角度改进:
需要进行改写的内容是:(1)边界设定:通过对锚点进行边界设定,可以提高形变的有效性,降低时间成本。其具体设定如下:不会在曲线段内形成循环或自交;在曲线段内不容易出现尖点;不会出现在无效区域
以锚点为例,下图蓝色部分为边界设定图例,橙色部分为错误实例:
关于锚点的边界判定
数学表达如下所示:
(2)适应度函数:本研究不同于以往仅针对单一模态进行打击评估的工作,而是聚焦于可见光-红外两个模态,并且意识到两个模态之间存在天然的平衡效果差异问题。为了避免过度优化单一模态而忽视另一模态,研究人员提出了一种创新的跨模态适应度函数,该函数基于检测器的置信度得分感知,旨在鼓励探索成功的方向并平衡两个模态之间的效果差异。最终,根据评分进行优胜劣汰。为了考虑到初始阶段和后期阶段的打击难度差异,该函数使用指数函数代替线性函数,以更加凸显不同阶段的打击进度差异性
算法迭代该探索过程直至两模态都打击成功,输出最优形状策略。完整优化流程如下所示:
实验结果
实验一:针对不同系列检测器的跨模态打击性能验证
实验二:针对形状的消融实验
实验三:对于跨模态适应度函数的消融实验
实验四:物理实施偏差下的方法鲁棒性验证
实验五:不同物理条件下的方法有效性验证
在不同的角度、距离、姿势和场景下进行性能验证,并将结果可视化呈现
总结
本研究的核心是自然形状优化,并结合形变补丁和跨模态打击,设计了一种物理环境下可见光 - 红外多模态鲁棒性评估方法。该方法可以评估多模态(可见光 - 红外)目标检测系统的鲁棒性,并根据评估结果有效地修正检测器模型,同时提高可见光和红外两种模态下目标图像检测的准确性。该方法在物理环境中实施和应用,为多模态检测系统的鲁棒性评估和改进做出了贡献
以上是北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

0.这篇文章干了啥?提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高,可以在少数推理步骤内合成深度图。下面一起来阅读一下这项工作~1.论文信息标题:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效的特点。它由236B个参数组成,其中21B个参数用于激活每个标记。与DeepSeek67B相比,DeepSeek-V2性能更强,同时节省了42.5%的训练成本,减少了93.3%的KV缓存,最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

AI,的确正在改变数学。最近,一直十分关注这个议题的陶哲轩,转发了最近一期的《美国数学学会通报》(BulletinoftheAmericanMathematicalSociety)。围绕「机器会改变数学吗?」这个话题,众多数学家发表了自己的观点,全程火花四射,内容硬核,精彩纷呈。作者阵容强大,包括菲尔兹奖得主AkshayVenkatesh、华裔数学家郑乐隽、纽大计算机科学家ErnestDavis等多位业界知名学者。AI的世界已经发生了天翻地覆的变化,要知道,其中很多文章是在一年前提交的,而在这一

本月初,来自MIT等机构的研究者提出了一种非常有潜力的MLP替代方法——KAN。KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参数量运行的MLP。比如,作者表示,他们用KAN以更小的网络和更高的自动化程度重现了DeepMind的结果。具体来说,DeepMind的MLP有大约300,000个参数,而KAN只有约200个参数。KAN与MLP一样具有强大的数学基础,MLP基于通用逼近定理,而KAN基于Kolmogorov-Arnold表示定理。如下图所示,KAN在边上具

波士顿动力Atlas,正式进入电动机器人时代!昨天,液压Atlas刚刚「含泪」退出历史舞台,今天波士顿动力就宣布:电动Atlas上岗。看来,在商用人形机器人领域,波士顿动力是下定决心要和特斯拉硬刚一把了。新视频放出后,短短十几小时内,就已经有一百多万观看。旧人离去,新角色登场,这是历史的必然。毫无疑问,今年是人形机器人的爆发年。网友锐评:机器人的进步,让今年看起来像人类的开幕式动作、自由度远超人类,但这真不是恐怖片?视频一开始,Atlas平静地躺在地上,看起来应该是仰面朝天。接下来,让人惊掉下巴

在iPhone上面临滞后,缓慢的移动数据连接?通常,手机上蜂窝互联网的强度取决于几个因素,例如区域、蜂窝网络类型、漫游类型等。您可以采取一些措施来获得更快、更可靠的蜂窝互联网连接。修复1–强制重启iPhone有时,强制重启设备只会重置许多内容,包括蜂窝网络连接。步骤1–只需按一次音量调高键并松开即可。接下来,按降低音量键并再次释放它。步骤2–该过程的下一部分是按住右侧的按钮。让iPhone完成重启。启用蜂窝数据并检查网络速度。再次检查修复2–更改数据模式虽然5G提供了更好的网络速度,但在信号较弱

哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。尤其在多模态任务中,这一问题尤为突出。一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模型生成数据自己喂自己”变成了现实。而且还是理解侧和生成侧双管齐下,两侧都能生成高质量、多模态的新数据,对模型本身进行数据反哺。模型是啥?中关村论坛上刚刚露面的多模态大模型Awaker1.0。团队是谁?智子引擎。由人大高瓴人工智能学院博士生高一钊创立,高

目标检测在自动驾驶系统当中是一个比较成熟的问题,其中行人检测是最早得以部署算法之一。在多数论文当中已经进行了非常全面的研究。然而,利用鱼眼相机进行环视的距离感知相对来说研究较少。由于径向畸变大,标准的边界框表示在鱼眼相机当中很难实施。为了缓解上述描述,我们探索了扩展边界框、椭圆、通用多边形设计为极坐标/角度表示,并定义一个实例分割mIOU度量来分析这些表示。所提出的具有多边形形状的模型fisheyeDetNet优于其他模型,并同时在用于自动驾驶的Valeo鱼眼相机数据集上实现了49.5%的mAP
