目录
优秀的性能
本文贡献
方法
PGI及相关的网络架构和方法
GELAN的架构
结果对比
与现有技术的比较
与最先进的实时目标检测器进行比较
可视化结果
结论
首页 科技周边 人工智能 YOLO不死!YOLOv9出炉:性能速度SOTA~

YOLO不死!YOLOv9出炉:性能速度SOTA~

Feb 26, 2024 am 11:31 AM
神经网络 yolo

如今的深度学习方法专注于设计最适合的目标函数,以使模型的预测结果与实际情况最接近。同时,必须设计一个合适的架构,以便为预测获取足够的信息。现有方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换时,大量信息将会丢失。本文将深入探讨数据通过深度网络传输时的重要问题,即信息瓶颈和可逆函数。基于此提出了可编程梯度信息(PGI)的概念,以应对深度网络实现多目标所需的各种变化。 PGI可以为目标任务提供完整的输入信息,以计算目标函数,从而获得可靠的梯度信息以更新网络权重。此外设计了一种新的轻量级网络架构——基于梯度路径规划的广义高效层聚合网络(GELAN)。

验证结果表明,GELAN架构在轻量级模型上通过PGI获得了显着优势。在MS COCO数据集上的实验显示,GELAN结合PGI仅利用传统卷积算子就能实现比基于深度卷积的最先进方法更出色的参数利用率。 PGI的通用性使其适用于各种模型,从轻量级到大型模型都适用。通过PGI,模型能够充分获取信息,因此使用从头开始训练的模型可能比基于大型数据集预训练的最先进模型获得更好的结果。

文章地址:https://arxiv.org/pdf/2402.13616

代码链接:https://github.com/WongKinYiu/yolov9

优秀的性能

根据MS COCO数据集上的实时目标检测器比较结果显示,基于GELAN和PGI的目标检测方法在目标检测性能方面明显领先于以往的从头开始训练的方法。新方法在准确性方面表现优于依赖大型数据集预训练的RT DETR,并且在参数利用方面也优于基于深度卷积设计的YOLO MS。这些结果表明,GELAN和PGI方法在目标检测领域具有潜在的优势,并且可能成为未来研究和应用中的重要技术选择。

YOLO不死!YOLOv9出炉:性能速度SOTA~

本文贡献

  1. 从可逆函数的角度理论分析了现有的深度神经网络架构,通过这一过程,成功解释了过去难以解释的许多现象。还基于这一分析设计了PGI和辅助可逆分支,并取得了优秀的结果。
  2. 设计的PGI解决了深度监督只能用于极深的神经网络架构的问题,从而使得新的轻量级架构真正能够应用于日常工作。
  3. 设计的GELAN仅使用传统卷积就能实现比基于最先进技术的深度卷积设计更高的参数使用率,同时表现出轻巧、快速和准确的巨大优势。
  4. 将所提出的PGI和GELAN结合起来,YOLOv9在MS COCO数据集上的目标检测性能在各个方面都大大超过了现有的实时目标检测器。

方法

PGI及相关的网络架构和方法

如下图所示,(a) 路径聚合网络(PAN),(b) 可逆列(RevCol),(c) 传统的深度监督,以及(d) YOLOv9提出的可编程梯度信息(PGI)。

YOLO不死!YOLOv9出炉:性能速度SOTA~

PGI主要由三个组成部分组成:

  1. 主分支:用于推理的架构;
  2. 辅助可逆分支:生成可靠的梯度以供主分支向后传输;
  3. 多级辅助信息:控制主分支学习可规划的多级语义信息。

GELAN的架构

如下图所示,(a) CSPNet ,(b) ELAN,以及 (c) YOLOv9提出的GELAN。模仿了CSPNet,并将ELAN扩展为GELAN,可以支持任何计算块。

YOLO不死!YOLOv9出炉:性能速度SOTA~

结果对比

与现有技术的比较

下表列出了YOLOv9与其他从头开始训练的实时目标检测器的比较。总体而言,在现有方法中表现最佳的方法是轻量级模型的YOLO MS-S,中等模型的YOLO MS ,通用模型的YOLOv7 AF,以及大型模型的YOLOv8-X。与轻量级和中等模型的YOLO MS相比,YOLOv9的参数减少约10%,计算减少5∼15%,但在AP方面仍有0.4∼0.6%的改善。与YOLOv7 AF相比,YOLOv9-C的参数减少了42%,计算减少了21%,但达到了相同的AP(53%)。与YOLOv8-X相比,YOLOv9-X的参数减少了15%,计算减少了25%,并且AP有显着提高,提高了1.7%。上述比较结果表明,YOLOv9在各个方面都比现有方法有了显着改进。

YOLO不死!YOLOv9出炉:性能速度SOTA~

与最先进的实时目标检测器进行比较

参与比较的方法都使用ImageNet作为预训练权重,包括RT DETR 、RTMDet 和PP-YOLOE等。使用从头开始训练方法的YOLOv9显然超过了其他方法的性能。

YOLO不死!YOLOv9出炉:性能速度SOTA~

可视化结果

特征图(可视化结果): 由PlainNet、ResNet、CSPNet和GELAN在不同深度上的随机初始权重输出。在100层后,ResNet开始产生足够混淆目标信息的前馈输出。这里提出的GELAN在第150层仍然可以保留相当完整的信息,并且在第200层仍然具有足够的区分能力。

YOLO不死!YOLOv9出炉:性能速度SOTA~

GELAN和YOLOv9(GELAN + PGI)的PAN特征图(可视化结果):在进行一轮偏置预热后。GELAN最初存在一些分歧,但在添加了PGI的可逆分支后,它更能够集中注意力于目标对象。

YOLO不死!YOLOv9出炉:性能速度SOTA~

不同网络架构的随机初始权重输出特征图的可视化结果: (a)输入图像,(b)PlainNet,(c)ResNet,(d)CSPNet 和(e)提出的 GELAN。从图中可以看出,在不同的架构中,提供给目标函数计算损失的信息程度不同,而我们的架构可以保留最完整的信息,并为计算目标函数提供最可靠的梯度信息。

YOLO不死!YOLOv9出炉:性能速度SOTA~

结论

本文提出使用PGI来解决信息瓶颈问题以及深度监督机制不适用于轻量级神经网络的问题。设计了GELAN,这是一个高效且轻量级的神经网络。在目标检测方面,GELAN在不同的计算模块和深度设置下表现出强大而稳定的性能。它确实可以广泛扩展为适用于各种推断设备的模型。针对上述两个问题,引入PGI使得轻量级模型和深度模型都能在准确性方面取得显著改善。通过结合PGI和GELAN设计的YOLOv9表现出了强大的竞争力。其优秀的设计使得深度模型在与YOLOv8相比,参数数量减少了49%,计算量减少了43%,但在MS COCO数据集上仍然实现了0.6%的AP改善。

原文链接:https://mp.weixin.qq.com/s/nP4JzVwn1S-MeKAzbf97uw

以上是YOLO不死!YOLOv9出炉:性能速度SOTA~的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

YOLO不死!YOLOv9出炉:性能速度SOTA~ YOLO不死!YOLOv9出炉:性能速度SOTA~ Feb 26, 2024 am 11:31 AM

YOLO不死!YOLOv9出炉:性能速度SOTA~

GNN的基础、前沿和应用 GNN的基础、前沿和应用 Apr 11, 2023 pm 11:40 PM

GNN的基础、前沿和应用

一文通览自动驾驶三大主流芯片架构 一文通览自动驾驶三大主流芯片架构 Apr 12, 2023 pm 12:07 PM

一文通览自动驾驶三大主流芯片架构

"B站UP主成功打造全球首个基于红石的神经网络在社交媒体引起轰动,得到Yann LeCun的点赞赞赏" "B站UP主成功打造全球首个基于红石的神经网络在社交媒体引起轰动,得到Yann LeCun的点赞赞赏" May 07, 2023 pm 10:58 PM

"B站UP主成功打造全球首个基于红石的神经网络在社交媒体引起轰动,得到Yann LeCun的点赞赞赏"

多路径多领域通吃!谷歌AI发布多领域学习通用模型MDL 多路径多领域通吃!谷歌AI发布多领域学习通用模型MDL May 28, 2023 pm 02:12 PM

多路径多领域通吃!谷歌AI发布多领域学习通用模型MDL

扛住强风的无人机?加州理工用12分钟飞行数据教会无人机御风飞行 扛住强风的无人机?加州理工用12分钟飞行数据教会无人机御风飞行 Apr 09, 2023 pm 11:51 PM

扛住强风的无人机?加州理工用12分钟飞行数据教会无人机御风飞行

AI已经把你看得明明白白,YOLO ByteTrack 多标签分类网络 AI已经把你看得明明白白,YOLO ByteTrack 多标签分类网络 Apr 14, 2023 pm 06:25 PM

AI已经把你看得明明白白,YOLO ByteTrack 多标签分类网络

1.3ms耗时!清华最新开源移动端神经网络架构 RepViT 1.3ms耗时!清华最新开源移动端神经网络架构 RepViT Mar 11, 2024 pm 12:07 PM

1.3ms耗时!清华最新开源移动端神经网络架构 RepViT

See all articles