ScalableMap:用于在线远距离矢量化高精地图构建的可扩展地图学习
可扩展地图:用于在线长距离向量化高清地图构建的可扩展地图学习
请点击以下链接阅读论文:https://arxiv.org/pdf/2310.13378.pdf
代码链接:https://github.com/jingy1yu/ScalableMap
作者单位为武汉大学
论文思路:
本文提出了一种新颖的端到端流程,用于使用车载摄像头传感器构建在线远距离矢量化高精度(HD)地图。高精度地图的矢量化表示使用折线和多边形来表示地图要素,这些要素被下游任务广泛使用。然而,之前参考动态目标检测设计的方案忽略了线性地图要素内部的结构约束,导致远距离场景中的性能下降。本文利用地图要素的属性来提高地图构建的性能。本文在线性结构的指导下提取更准确的鸟瞰图(BEV)特征,然后提出一种分层稀疏图表示,以进一步利用矢量化图要素的可扩展性,并基于该表示设计渐进式解码机制和监督策略。本文的方法ScalableMap在nuScenes数据集上展示了卓越的性能,尤其是在远距离场景中,相比之前最先进的模型提高了6.5的mAP,同时实现了18.3的FPS
主要贡献:
(i) 本文提出了 ScalableMap,第一个端到端远距离矢量化地图构建 pipeline 。本文利用映射元素的结构特性来提取更准确的 BEV 特征,提出基于可扩展矢量化元素的 HSMR,并相应地设计渐进式解码器和监督策略。所有这些都带来了卓越的远距离地图感知。
通过大量实验评估,本研究在 nuScenes 数据集 [17] 上测试了 ScalableMap 的性能。研究方法取得了远距离高精地图学习方面的最先进结果,比现有的多模态方法提高了6.5个mAP,同时达到了18.3帧每秒的速度
网络设计:
本文的目标是利用矢量化地图元素的结构特性来解决在较长距离内准确检测地图元素的挑战。首先,本文分别通过两个分支提取位置感知的 BEV 特征和实例感知的 BEV 特征,并在线性结构的指导下融合它们,得到混合 BEV 特征。接下来,本文提出了一种分层稀疏地图表示(HSMR),以稀疏但准确的方式抽象地图元素。将此表示与 DETR [16] 提出的级联解码层集成,本文设计了一种渐进解码器,通过利用矢量化映射元素的可扩展性和渐进监督策略来增强结构化信息的约束,以提高推理的准确性。本文的方案 ScalableMap 动态增加地图的采样密度以获得各种比例的推理结果,使本文能够更快地获得更准确的地图信息。
请参考下述重写的内容: 图 1:ScalableMap 概述。 (a) 结构引导的混合 BEV 特征提取器。 (b) 分层稀疏地图表示和渐进解码器。 (c) 渐进式监督
图 2:渐进折线损失的可视化。
实验结果:
为了在不改变原意的情况下重写内容,需要将原文重写成中文
于,J.,张,Z.,夏,S. 和桑,J.(2023年)。ScalableMap:用于在线长程矢量化高清地图构建的可扩展地图学习。ArXiv。/abs/2310.13378
需要重写的内容是:Rewrite the content without changing the original meaning. The language to rewrite into is Chinese. 不需要出现原句
以上是ScalableMap:用于在线远距离矢量化高精地图构建的可扩展地图学习的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

iPhone上的默认地图是Apple专有的地理位置提供商“地图”。尽管地图越来越好,但它在美国以外的地区运行不佳。与谷歌地图相比,它没有什么可提供的。在本文中,我们讨论了使用Google地图成为iPhone上的默认地图的可行性步骤。如何在iPhone中使Google地图成为默认地图将Google地图设置为手机上的默认地图应用程序比您想象的要容易。请按照以下步骤操作–先决条件步骤–您必须在手机上安装Gmail。步骤1–打开AppStore。步骤2–搜索“Gmail”。步骤3–点击Gmail应用旁

写在前面&笔者的个人理解三维Gaussiansplatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经辐射场(NeRF)方法有很大的不同,后者主要使用隐式的基于坐标的模型将空间坐标映射到像素值。3DGS凭借其明确的场景表示和可微分的渲染算法,不仅保证了实时渲染能力,而且引入了前所未有的控制和场景编辑水平。这将3DGS定位为下一代3D重建和表示的潜在游戏规则改变者。为此我们首次系统地概述了3DGS领域的最新发展和关

昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原因之一。自动驾驶的底层架构和大部分技术问题已经被解决,剩下的5%的长尾问题,逐渐成了制约自动驾驶发展的关键。这些问题包括各种零碎的场景、极端的情况和无法预测的人类行为。自动驾驶中的边缘场景"长尾"是指自动驾驶汽车(AV)中的边缘情况,边缘情况是发生概率较低的可能场景。这些罕见的事件

0.写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆能够识别道路标志、检测和跟踪其他车辆、预测行人行为等,从而安全地操作和适应复杂的交通环境.这项技术目前引起了广泛的关注,并认为是未来交通领域的重要发展领域之一。但是,让自动驾驶变得困难的是弄清楚如何让汽车了解周围发生的事情。这需要自动驾驶系统中的三维物体检测算法可以准确地感知和描述周围环境中的物体,包括它们的位置、

轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(CNN&GNN&Transformer)技能等,入门难度很大!很多粉丝期望能够尽快上手轨迹预测,少踩坑,今天就为大家盘点下轨迹预测常见的一些问题和入门学习方法!入门相关知识1.预习的论文有没有切入顺序?A:先看survey,p

原标题:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving论文链接:https://arxiv.org/pdf/2402.02519.pdf代码链接:https://github.com/HKUST-Aerial-Robotics/SIMPL作者单位:香港科技大学大疆论文思路:本文提出了一种用于自动驾驶车辆的简单高效的运动预测基线(SIMPL)。与传统的以代理为中心(agent-cent

写在前面&出发点端到端的范式使用统一的框架在自动驾驶系统中实现多任务。尽管这种范式具有简单性和清晰性,但端到端的自动驾驶方法在子任务上的性能仍然远远落后于单任务方法。同时,先前端到端方法中广泛使用的密集鸟瞰图(BEV)特征使得扩展到更多模态或任务变得困难。这里提出了一种稀疏查找为中心的端到端自动驾驶范式(SparseAD),其中稀疏查找完全代表整个驾驶场景,包括空间、时间和任务,无需任何密集的BEV表示。具体来说,设计了一个统一的稀疏架构,用于包括检测、跟踪和在线地图绘制在内的任务感知。此外,重

最近一个月由于众所周知的一些原因,非常密集地和行业内的各种老师同学进行了交流。交流中必不可免的一个话题自然是端到端与火爆的特斯拉FSDV12。想借此机会,整理一下在当下这个时刻的一些想法和观点,供大家参考和讨论。如何定义端到端的自动驾驶系统,应该期望端到端解决什么问题?按照最传统的定义,端到端的系统指的是一套系统,输入传感器的原始信息,直接输出任务关心的变量。例如,在图像识别中,CNN相对于传统的特征提取器+分类器的方法就可以称之为端到端。在自动驾驶任务中,输入各种传感器的数据(相机/LiDAR
