综述:自动驾驶的协同感知技术
arXiv综述论文“Collaborative Perception for Autonomous Driving: Current Status and Future Trend“,2022年8月23日,上海交大。
感知是自主驾驶系统的关键模块之一,然而单车的有限能力造成感知性能提高的瓶颈。为了突破单个感知的限制,提出协同感知,使车辆能够共享信息,感知视线之外和视野以外的环境。本文回顾了很有前途的协同感知技术相关工作,包括基本概念、协同模式以及关键要素和应用。最后,讨论该研究领域的开放挑战和问题,并给出进一步方向。
如图所示,单个感知的两个重要问题是,远距离遮挡和稀疏数据。这些问题的解决方案是,同一区域内的车辆彼此共享共同感知信息(CPM,collective perception message),协同感知环境,称为协同感知或协作感知。
得益于通信基础设施的建设和V2X等通信技术的发展,车辆可以以可靠的方式交换信息,从而实现协作。最近的工作表明,车辆之间的协同感知可以提高环境感知的准确性以及交通系统的鲁棒性和安全性。
此外,自动驾驶车辆通常配备高保真传感器以实现可靠的感知,造成昂贵的成本。协同感知可以缓解单个车辆对感知设备的苛刻要求。
协同感知与附近的车辆和基础设施共享信息,使自主车辆能够克服某些感知限制,如遮挡和短视野。然而,实现实时和鲁棒的协同感知需要解决通信容量和噪声带来的一些挑战。最近,有一些工作研究了协同感知的策略,包括什么是协同、何时协同、如何协同、共享信息的对齐等。
类似于融合,协同的分类也有4类:
1 早期协同
早期协同在输入空间中进行协同,在车辆和基础设施之间共享原始感官数据。它汇总了所有车辆和基础设施的原始测量值,得到一个整体观点。因此,每个车辆都可以进行以下处理,并基于整体视角完成感知,这可以从根本上解决单体感知中出现的遮挡和远距离问题。
然而,共享原始感官数据需要大量通信,并且容易使通信网络因数据负载过大而拥塞,这在大多数情况下阻碍了其实际应用。
2. 后期协同
后期协同在输出空间中进行协同,这促进了每个智体输出的感知结果融合,实现细化。
虽然后期协同具有带宽经济性,但它对智体的定位误差非常敏感,并且由于不完全的局部观测而遭受高估计误差和噪声。
3 中间协同
中间协同在中间特征空间中进行协同。它能够传输单独智体预测模型生成的中间特征。融合这些特征后,每个智体对融合的特征进行解码并产生感知结果。从概念上讲,可以将代表性信息压缩到这些特征中,与早期协同相比,可以节省通信带宽,与后期协同相比,还可以提高感知能力。
在实践中,这种协同策略的设计在算法上具有两个方面的挑战性:i)如何从原始测量中选择最有效和紧凑的特征进行传输;以及ii)如何最大限度地融合其他智体的特征以增强每个智体的感知能力。
4 混合协同
如上所述,每种协同模式都有其优缺点。因此,一些工作采用了混合协同,将两种或多种协同模式结合起来,以优化协同策略。
协同感知的主要因素包括:
1 协同图
图是协同感知建模的有力工具,因为它建模非欧数据结构有良好的可解释性。在一些工作中,参与协同感知的车辆组成一个完整的协同图,其中每个车辆是一个节点,两个车辆之间的协同关系是这两个节点之间的边。
2 姿态对齐
由于协同感知需要在不同位置和不同时间融合来自车辆和基础设施的数据,因此实现精确的数据对齐对于成功协同至关重要。
3 信息融合
信息融合是多智体系统的核心组成部分,其目标是以有效的方式融合来自其他智体的信息量最大的部分。
4 基于强化学习的资源分配
现实环境中有限的通信带宽要求充分利用可用的通信资源,这使得资源分配和频谱共享非常重要。在车辆通信环境中,快速变化的信道条件和日益增长的服务需求使得分配问题的优化非常复杂,难以使用传统的优化方法来解决。一些工作利用多智体强化学习(MARL)来解决优化问题。
协同感知的应用:
1 3D 目标检测
基于激光雷达点云的3D目标检测是协同感知研究中最受关注的问题。原因如下:i)激光雷达点云比图像和视频具有更多的空间维度。ii)激光雷达点云可以在一定程度上保留个人信息,如人脸和车牌号。iii)点云数据是用于融合的适当数据类型,因为当点云数据从不同的姿态对齐时,其损失比像素少。iv)3D目标检测是自主驾驶感知的一项基本任务,跟踪和运动预测等许多任务都基于此。
2 语义分割
3D场景的语义分割也是自动驾驶所需的关键任务。3D场景目标的协同语义分割,给定来自多个智体的3D场景观察(图像、激光雷达点云等),为每个智体生成语义分割掩码。
挑战性问题:
1 通信鲁棒性
有效的协统依赖于智体之间的可靠通信。然而,通信在实践中并不完美:i)随着网络中车辆数量的增加,每辆车的可用通信带宽有限;ii)由于不可避免的通信延迟,车辆难以从其他车辆接收实时信息;iii)通信有时可能中断,导致通信中断;iv)V2X通信遭受破坏,无法始终提供可靠服务。尽管通信技术不断发展,通信服务质量不断提高,但上述问题仍将长期存在。然而,大多数现有的工作都假设信息可以以实时和无损的方式共享,因此考虑这些通信约束并设计鲁棒的协同感知系统对于进一步的工作具有重要意义。
2 异质性和跨模态
大多数协统感知工作关注基于激光雷达点云的感知。然而,有更多类型的数据可用于感知,如图像和毫米波雷达点云。这是一种利用多模态传感器数据进行更有效协作的潜在方法。此外,在某些场景中,有不同级别的自动车辆提供不同质量的信息。因此,如何在异构车辆网络中进行协同是协同感知进一步实际应用的问题。不幸的是,很少有工作关注异构和跨模态的协作感知,这个也成为一个开放的挑战。
3 大规模数据集
大规模数据集和深度学习方法的发展提高了感知性能。然而,协同感知研究领域的现有数据集要么规模小,要么不公开。
缺乏公共大规模数据集阻碍了协同感知的进一步发展。此外,大多数数据集基于模拟。虽然仿真是验证算法的经济和安全的方法,但真实的数据集也是需要的,可将协同感知应用于实践。
以上是综述:自动驾驶的协同感知技术的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

写在前面&笔者的个人理解三维Gaussiansplatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经辐射场(NeRF)方法有很大的不同,后者主要使用隐式的基于坐标的模型将空间坐标映射到像素值。3DGS凭借其明确的场景表示和可微分的渲染算法,不仅保证了实时渲染能力,而且引入了前所未有的控制和场景编辑水平。这将3DGS定位为下一代3D重建和表示的潜在游戏规则改变者。为此我们首次系统地概述了3DGS领域的最新发展和关

昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原因之一。自动驾驶的底层架构和大部分技术问题已经被解决,剩下的5%的长尾问题,逐渐成了制约自动驾驶发展的关键。这些问题包括各种零碎的场景、极端的情况和无法预测的人类行为。自动驾驶中的边缘场景"长尾"是指自动驾驶汽车(AV)中的边缘情况,边缘情况是发生概率较低的可能场景。这些罕见的事件

0.写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆能够识别道路标志、检测和跟踪其他车辆、预测行人行为等,从而安全地操作和适应复杂的交通环境.这项技术目前引起了广泛的关注,并认为是未来交通领域的重要发展领域之一。但是,让自动驾驶变得困难的是弄清楚如何让汽车了解周围发生的事情。这需要自动驾驶系统中的三维物体检测算法可以准确地感知和描述周围环境中的物体,包括它们的位置、

StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引起了不小的轰动。与之前版本相比,StableDiffusion3生成的图质量有了显着提升,现在支持多主题提示,并且文字书写效果也得到了改善,不再出现乱码情况。 StabilityAI指出,StableDiffusion3是一个系列模型,其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行,从而显着降低了使用AI

轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(CNN&GNN&Transformer)技能等,入门难度很大!很多粉丝期望能够尽快上手轨迹预测,少踩坑,今天就为大家盘点下轨迹预测常见的一些问题和入门学习方法!入门相关知识1.预习的论文有没有切入顺序?A:先看survey,p

最近一个月由于众所周知的一些原因,非常密集地和行业内的各种老师同学进行了交流。交流中必不可免的一个话题自然是端到端与火爆的特斯拉FSDV12。想借此机会,整理一下在当下这个时刻的一些想法和观点,供大家参考和讨论。如何定义端到端的自动驾驶系统,应该期望端到端解决什么问题?按照最传统的定义,端到端的系统指的是一套系统,输入传感器的原始信息,直接输出任务关心的变量。例如,在图像识别中,CNN相对于传统的特征提取器+分类器的方法就可以称之为端到端。在自动驾驶任务中,输入各种传感器的数据(相机/LiDAR

原标题:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving论文链接:https://arxiv.org/pdf/2402.02519.pdf代码链接:https://github.com/HKUST-Aerial-Robotics/SIMPL作者单位:香港科技大学大疆论文思路:本文提出了一种用于自动驾驶车辆的简单高效的运动预测基线(SIMPL)。与传统的以代理为中心(agent-cent

目标检测在自动驾驶系统当中是一个比较成熟的问题,其中行人检测是最早得以部署算法之一。在多数论文当中已经进行了非常全面的研究。然而,利用鱼眼相机进行环视的距离感知相对来说研究较少。由于径向畸变大,标准的边界框表示在鱼眼相机当中很难实施。为了缓解上述描述,我们探索了扩展边界框、椭圆、通用多边形设计为极坐标/角度表示,并定义一个实例分割mIOU度量来分析这些表示。所提出的具有多边形形状的模型fisheyeDetNet优于其他模型,并同时在用于自动驾驶的Valeo鱼眼相机数据集上实现了49.5%的mAP
