目录
写在前面&笔者的个人理解
向量化高精地图的几何性质
提出针对高精地图的几何表示的重要性
GeMap的设计
实验结果
总结
首页 科技周边 人工智能 首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

Dec 15, 2023 am 10:46 AM
自动驾驶 地图

写在前面&笔者的个人理解

实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性的工作如HDMapNet,MapTR等相继涌现。然而,现有的在线向量化高精地图构建方法缺乏对地图元素几何性质(包括元素的形状,垂直、平行等几何关系)的探索。

向量化高精地图的几何性质

向量化高精地图对道路上的元素进行了高度抽象,将每一个地图元素表示为二维点序列。而城市道路的设计具有特定的规范,例如,人行横道在多数情况下表现为方正的矩形平行四边形;在不涉及分流合流的路段,相邻的两条车道互相平行。高精地图中不同元素还具有许多类似的特点,这些常识性的规律,抽象为高精地图的几何性质,包括地图元素的形状(矩形、平行四边形、直线等),或者不同地图元素之间的关联(平行、垂直等)。几何性质强有力地约束着地图元素的表现形式,在线构建模型如果充分理解了几何性质,就能得到更精确的结果。

提出针对高精地图的几何表示的重要性

尽管理论上现有模型仍可能学到地图元素的几何性质,然而,几何性质的特点决定了至少在传统的设计下,模型并不容易学到。

  • 几何性质的不变性

中心车辆在道路上直线行驶,变道,或者转弯时,(在车辆坐标系下)地图元素的绝对坐标不断发生变化。而人行横道、车道、道路边界等的形状并不会随之改变;类似的,车道之间平行关系也不会改变。地图元素的几何性质是客观的,它的一个重要特点就是不变性。更具体的,是刚性不变性(对旋转、平移变换保持不变)。以往的工作,不论是使用朴素的折线表示,还是使用带控制点的多项式曲线(比如贝塞尔曲线、分段贝塞尔曲线),都基于绝对坐标,并在绝对坐标基础上端到端优化。基于绝对坐标的优化目标本身不具备刚性不变性,因此很难期待模型陷入的局部最优解包含对几何性质的理解。因此,一种能充分刻画几何性质且具有一定不变性的表示是必要的。

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新图1. 几何不变性的示例。

车辆右转时,绝对坐标会发生明显的变化。右图展示了一个对应的真实场景。

  • 几何性质的多样性

此外,尽管具有强烈的先验知识,道路的几何性质仍然是多样的。这些多样的几何性质总体上可以分为两大类,一类是关于单个地图元素的几何形状,一类是关于不同地图元素的几何关联。由于几何性质的多样性,穷举并人工地将几何性质转变为约束是不可能的,因此我们更希望模型能够端到端地自主学习多样的几何性质。

GeMap的设计

几何表示

针对上述两个问题,我们首先改进表示方法。我们希望在传统的基于绝对坐标的表示之外,引入一种良好的几何表示,它需要满足:

  • 能刻画地图元素的形状
  • 能刻画地图元素之间的关联
  • 刚性不变性

为保证平移不变性,我们使用了相对量,即点之间的偏移向量;为进一步保证旋转不变性,我们选择了偏移向量的长度,以及不同偏移向量之间的夹角。这二者——长度和夹角——构成了我们提出的几何表示的基础。此外,为了更好地区分并刻画形状、关联两类不同的几何性质,我们还按照从简的原则进一步细化了设计:

为刻画形状,我们计算单个地图元素中相邻点之间的偏移向量,并计算偏移向量长度、相邻偏移向量之间的夹角。这一表示能够唯一确定任意的折线/多边形。两个形象的例子如下图所示:

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

请看图2,它展示了几何形状的表示方式

对于一个矩形,使用一个直角和两对相等的边就可以描述;对于一条直线,所有的夹角均为0度或者180。

为刻画关联,类似地,我们首先考虑了任意两点之间的距离。然而,如果对所有点对点的偏移向量两两计算夹角,表示的复杂度过高,且计算代价不可承受。具体地,假设一共有个地图元素,每个元素使用个个点来表示,那么所有夹角的数据量将达到(取1000时,假设每一个角度数据都是32位浮点数,这样的表示仅占据的空间将达到TB级别)。事实上,对于一般的垂直、平行等关系来说这不是必要的。因此,我们先计算元素内部的偏移,然后仅对这些偏移计算两两之间的夹角作为几何表示的一部分。这种简化的关联表示保留了对平行、垂直等关系的描述能力,同时所对应的数据量仅为(前述条件下,大致4MB)。为了便于理解,我们同样提供了一些例子:

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

图3. 几何关联表示。

平行关系和垂直关系的表示方式是偏移向量的夹角为0度或90度;从两点之间的距离可以一定程度上反映车道的宽度信息

为优化几何形状和关联的表示,我们采用最朴素的做法,直接计算预测和标签的几何表示,然后用范数作为优化目标

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

这里和分别表示根据标签计算得到的长度和夹角,和则表示根据预测计算得到的长度和夹角。在处理夹角时使用了一个技巧:直接计算角度涉及到不连续的arctan函数,在优化时会遇到困难(在±90度附近存在梯度消失的问题),因此我们实际上比较的是夹角的余弦和正弦值:

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

几何学的基础是角度和距离,因此我们常用“欧几里得损失”来形象地表示对应的几何损失,这也代表了该损失对旋转和平移变换的鲁棒性

几何解耦注意力

一种被MapTR,PivotNet等采用的架构将地图元素上的每一个点对应到Transformer的一个查询。这一架构的问题在于:对两大类的几何性质不加区分。

在自注意力中,所有查询(也就是“点”)之间都平等地相互作用。然而,地图元素的形状对应着一组一组的查询。这些组之间的交互,在感知元素形状时就成为了累赘。反之在感知元素之间关联的时候,形状亦成为了冗余因素。这意味着将形状、关联的感知解耦,可能带来更好的结果

为了将几何形状和关联处理解耦,我们采用了自注意力的两个步骤:

  • 每个地图元素包括个查询,在这个查询内部进行注意力,用以处理几何形状
  • 补充跨元素的注意力关系,用以处理几何关联

几何解耦的注意力可以通过下图更形象地表示。我们的实现方法相对简单,直接使用掩码来控制注意力的范围。由于这两种类型的注意力是互补的,因此通过合理的实现,时间复杂度有可能等同于进行单次自注意力

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

图4. 几何解耦注意力。

左侧为单个元素内部进行的形状注意力,右侧为元素之间进行的关联注意力。

实验结果

我们在nuScenes和Argoverse 2两个数据集上进行了大量实验。二者都是常用的大规模自动驾驶数据集,且都提供了地图标注。

主要结果

我们在nuScenes上进行了三组实验。首先,我们使用了一种较为纯粹的目标函数组合,仅包括几何损失和其他必要的损失(如点到点距离、边的方向、分类),这种组合旨在突显我们提出的几何性质的重要价值,而不过分追求SOTA的结果。结果显示,在这种情况下,与MapTR相比,我们的方法在mAP上有所提升。为了探索GeMap的极限,我们还添加了一些辅助目标,包括分割和深度估计。在这种情况下,我们也取得了SOTA的结果(mAP提升)。值得注意的是,实现这样的提升并不需要牺牲太多的推理速度。最后,我们还尝试了引入额外的LiDAR模态输入,在额外模态输入的帮助下,GeMap的性能进一步提升

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

同样,在Argoverse 2数据集上,我们的方法也取得了非常突出的效果。

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

重写的内容是:消融实验

在nuScenes上进一步进行的重写的内容是:消融实验证明了几何损失和几何解耦注意力的价值。有趣的是,正如我们所预料的,直接使用几何损失反而会带来模型表现的下降。我们认为这是因为结构上的对形状和关联处理的耦合,导致模型很难优化几何表示;而在与几何解耦注意力结合之后,几何损失就发挥了应有的作用(从”+Euclidean Loss“到”Full“)。

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

更多结果

除此之外,我们还对nuScenes进行了可视化分析。通过可视化结果可以看出,GeMap不仅在处理旋转和平移方面具有鲁棒性,还在解决遮挡问题方面表现出了一定的优势,如下图所示。挑战性的地图元素在图中用橘色方框标出

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

图5. 可视化对比结果。

在下雨天的实验结果中,我们也对遮挡的鲁棒性进行了定量验证(见下表)。这是因为雨水会天然地对相机造成遮挡

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

这可以解释为模型学习到了几何性质,因此即使有遮挡,也能更好地猜测地图元素。例如,模型理解了车道线的形状,那么只需要"看到"一部分,就能够估计剩下的部分;模型理解了车道线之间的平行关系,或者车道的宽度特点,因此即使其中一条被遮挡,也能根据平行关系和宽度因素猜测被遮挡的部分

总结

我们指出了地图元素所具有的几何性质,以及其对于在线向量化高精地图构建的价值。基于此,我们提出了一种强有力的方法,初步对这一价值进行了验证。此外,GeMap表现出的对遮挡的鲁棒性,或许预示着在其它自动驾驶任务(例如检测、占有预测等)中利用几何性质处理遮挡的思路——因为车辆和道路都具有相对规范的几何性质。当然,我们的方法本身也有很多可以进一步探索的地方。比如不同复杂度的几何元素是否可以适应性地使用不同的点来描述?是否能从概率的角度出发理解几何表示,让其对噪音更具鲁棒性?因为我们对于元素关联进行了简化,那么是否存在更好的几何关联的表示方法?这些都是进一步优化的方向。

首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新

需要重写的内容是:https://mp.weixin.qq.com/s/BoxlskT68Kjb07mfwQ7Swg 的链接

以上是首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它们
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

如何在iPhone中使Google地图成为默认地图 如何在iPhone中使Google地图成为默认地图 Apr 17, 2024 pm 07:34 PM

iPhone上的默认地图是Apple专有的地理位置提供商“地图”。尽管地图越来越好,但它在美国以外的地区运行不佳。与谷歌地图相比,它没有什么可提供的。在本文中,我们讨论了使用Google地图成为iPhone上的默认地图的可行性步骤。如何在iPhone中使Google地图成为默认地图将Google地图设置为手机上的默认地图应用程序比您想象的要容易。请按照以下步骤操作–先决条件步骤–您必须在手机上安装Gmail。步骤1–打开AppStore。步骤2–搜索“Gmail”。步骤3–点击Gmail应用旁

为何在自动驾驶方面Gaussian Splatting如此受欢迎,开始放弃NeRF? 为何在自动驾驶方面Gaussian Splatting如此受欢迎,开始放弃NeRF? Jan 17, 2024 pm 02:57 PM

写在前面&笔者的个人理解三维Gaussiansplatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经辐射场(NeRF)方法有很大的不同,后者主要使用隐式的基于坐标的模型将空间坐标映射到像素值。3DGS凭借其明确的场景表示和可微分的渲染算法,不仅保证了实时渲染能力,而且引入了前所未有的控制和场景编辑水平。这将3DGS定位为下一代3D重建和表示的潜在游戏规则改变者。为此我们首次系统地概述了3DGS领域的最新发展和关

自动驾驶场景中的长尾问题怎么解决? 自动驾驶场景中的长尾问题怎么解决? Jun 02, 2024 pm 02:44 PM

昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原因之一。自动驾驶的底层架构和大部分技术问题已经被解决,剩下的5%的长尾问题,逐渐成了制约自动驾驶发展的关键。这些问题包括各种零碎的场景、极端的情况和无法预测的人类行为。自动驾驶中的边缘场景"长尾"是指自动驾驶汽车(AV)中的边缘情况,边缘情况是发生概率较低的可能场景。这些罕见的事件

选择相机还是激光雷达?实现鲁棒的三维目标检测的最新综述 选择相机还是激光雷达?实现鲁棒的三维目标检测的最新综述 Jan 26, 2024 am 11:18 AM

0.写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆能够识别道路标志、检测和跟踪其他车辆、预测行人行为等,从而安全地操作和适应复杂的交通环境.这项技术目前引起了广泛的关注,并认为是未来交通领域的重要发展领域之一。但是,让自动驾驶变得困难的是弄清楚如何让汽车了解周围发生的事情。这需要自动驾驶系统中的三维物体检测算法可以准确地感知和描述周围环境中的物体,包括它们的位置、

自动驾驶与轨迹预测看这一篇就够了! 自动驾驶与轨迹预测看这一篇就够了! Feb 28, 2024 pm 07:20 PM

轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(CNN&GNN&Transformer)技能等,入门难度很大!很多粉丝期望能够尽快上手轨迹预测,少踩坑,今天就为大家盘点下轨迹预测常见的一些问题和入门学习方法!入门相关知识1.预习的论文有没有切入顺序?A:先看survey,p

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准 SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准 Feb 20, 2024 am 11:48 AM

原标题:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving论文链接:https://arxiv.org/pdf/2402.02519.pdf代码链接:https://github.com/HKUST-Aerial-Robotics/SIMPL作者单位:香港科技大学大疆论文思路:本文提出了一种用于自动驾驶车辆的简单高效的运动预测基线(SIMPL)。与传统的以代理为中心(agent-cent

nuScenes最新SOTA | SparseAD:稀疏查询助力高效端到端自动驾驶! nuScenes最新SOTA | SparseAD:稀疏查询助力高效端到端自动驾驶! Apr 17, 2024 pm 06:22 PM

写在前面&出发点端到端的范式使用统一的框架在自动驾驶系统中实现多任务。尽管这种范式具有简单性和清晰性,但端到端的自动驾驶方法在子任务上的性能仍然远远落后于单任务方法。同时,先前端到端方法中广泛使用的密集鸟瞰图(BEV)特征使得扩展到更多模态或任务变得困难。这里提出了一种稀疏查找为中心的端到端自动驾驶范式(SparseAD),其中稀疏查找完全代表整个驾驶场景,包括空间、时间和任务,无需任何密集的BEV表示。具体来说,设计了一个统一的稀疏架构,用于包括检测、跟踪和在线地图绘制在内的任务感知。此外,重

FisheyeDetNet:首个基于鱼眼相机的目标检测算法 FisheyeDetNet:首个基于鱼眼相机的目标检测算法 Apr 26, 2024 am 11:37 AM

目标检测在自动驾驶系统当中是一个比较成熟的问题,其中行人检测是最早得以部署算法之一。在多数论文当中已经进行了非常全面的研究。然而,利用鱼眼相机进行环视的距离感知相对来说研究较少。由于径向畸变大,标准的边界框表示在鱼眼相机当中很难实施。为了缓解上述描述,我们探索了扩展边界框、椭圆、通用多边形设计为极坐标/角度表示,并定义一个实例分割mIOU度量来分析这些表示。所提出的具有多边形形状的模型fisheyeDetNet优于其他模型,并同时在用于自动驾驶的Valeo鱼眼相机数据集上实现了49.5%的mAP

See all articles