


Comment intégrer étroitement la cartographie en ligne et la prédiction de trajectoire ?
Titre original : Produire et exploiter l'incertitude cartographique en ligne dans la prévision de trajectoire
Lien papier : https://arxiv.org/pdf/2403.16439.pdf
Lien code : https://github.com/alfredgu001324/MapUncertaintyPrediction
Affiliation de l'auteur : Vector Institute NVIDIA Research, Université de Toronto
Idée de thèse :
Les cartes de haute précision (HD) jouent un rôle indispensable dans le développement de piles technologiques de véhicules autonomes (AV) modernes, bien que l'étiquetage. et les coûts de maintenance associés à cela sont élevés. Par conséquent, de nombreux travaux récents proposent des méthodes d’estimation en ligne de cartes HD à partir de données de capteurs, compliquant ainsi l’intégration dans les piles technologiques de conduite autonome. En particulier, ils ne génèrent pas d’estimations d’incertitude ou de confiance. Cet article étend plusieurs méthodes d'estimation de cartes en ligne de pointe pour permettre des estimations supplémentaires de l'incertitude et améliorer la puissance prédictive jusqu'à 15 % sur l'ensemble de données de conduite nuScenes du monde réel. Ce faisant, nous constatons que l'intégration de l'incertitude améliore la convergence de la formation jusqu'à 50 % et améliore la puissance prédictive jusqu'à 15 % sur l'ensemble de données de conduite nuScenes du monde réel.
Principales contributions :
Cet article présente une description générale de l'incertitude des cartes vectorisées et étend de nombreuses méthodes d'estimation de cartes en ligne de pointe pour produire en plus des estimations d'incertitude sans dégrader les performances du graphique de construction pure.
Cet article analyse empiriquement les sources potentielles d'incertitude cartographique, confirme le manque de confiance dans les méthodes actuelles d'estimation cartographique et fournit des informations pour les orientations de recherche futures.
Cet article discutera des récents modèles d'estimation de carte en ligne combinés à plusieurs méthodes de prédiction de trajectoire de pointe, et montrera comment améliorer considérablement les performances et les caractéristiques de formation des modèles de prédiction en aval et accélérer la convergence de la formation en intégrant l'incertitude de cartographie en ligne. à 50 % et améliore la précision des prédictions en ligne de 15 %.
Conception de réseau :
Un élément clé de la conduite autonome est la compréhension de l'environnement statique, par exemple le tracé des routes et la circulation autour des véhicules autonomes (VA). Par conséquent, des cartes de haute précision (HD) ont été développées pour capturer et fournir de telles informations, contenant des informations sémantiques telles que les limites des routes, les séparateurs de voies et les marquages routiers au niveau centimétrique. Ces dernières années, les cartes HD se sont révélées indispensables au développement et au déploiement de véhicules autonomes et sont aujourd’hui largement utilisées [35]. Cependant, les cartes HD sont coûteuses à annoter et à maintenir dans le temps, et elles ne peuvent être utilisées que dans des zones géo-clôturées, ce qui limite l’évolutivité des véhicules autonomes. ”.
Pour résoudre ces problèmes, de nombreuses études récentes se tournent vers l'estimation en ligne de cartes de haute précision (HD) à partir de données de capteurs. D'une manière générale, elles visent à prédire les emplacements et les catégories d'éléments cartographiques, généralement sous la forme de polygones ou de polygones. polylignes, toutes Cependant, les méthodes actuelles d'estimation de cartes en ligne ne produisent aucune information pertinente sur l'incertitude ou la confiance à partir des images de caméra et des analyses LiDAR, ce qui est problématique car cela conduit à des informations cachées pour les consommateurs en aval. Les composants cartographiques déduits sont implicitement supposés être déterministes. et toute erreur de cartographie (par exemple, un mouvement ou un placement incorrect des éléments de la carte) peut conduire à un comportement erroné en aval, cet article propose de révéler l'incertitude de la carte dans les méthodes d'estimation de la carte en ligne et de les intégrer dans les modules en aval. L'article intègre l'incertitude cartographique dans la prédiction de trajectoire et constate que les systèmes de cartographie et de prédiction qui intègrent l'incertitude cartographique (Figure 1) sont nettement meilleurs que ceux qui n'en intègrent pas. Les performances sont considérablement améliorées par rapport au système. l'incertitude de la méthode d'estimation de carte de haute précision (HD) en ligne et son intégration dans les modules en aval apportent de multiples avantages. Figure de gauche : Carte HD réelle et emplacements des agents. Milieu : prédiction HiVT [41] à l'aide de la carte de sortie MapTR [22]. À droite : Carte utilisant la sortie MapTR [22] avec une incertitude de point ajoutée (en raison de la route de gauche). Prédiction HiVT [41] où la limite est obstruée par des véhicules stationnés et l'incertitude est grande)
Figure 2. De nombreux sommets en ligne. -Les méthodes d'estimation de carte vectorielle de précision codent des images multi-caméras et les transforment en un espace de caractéristiques de graphique à vol d'oiseau (BEV) commun et fonctionnent en régressant les sommets des éléments de la carte. Ce travail améliore cette structure de sortie commune en ajoutant une méthode probabiliste. tête de régression, modélisant chaque sommet de la carte comme une distribution laplacienne pour l'évaluation. Les effets en aval qui en résultent, cet article étend davantage le modèle de prédiction en aval pour coder l'incertitude de la carte, en améliorant l'encodeur de carte basé sur le réseau neuronal graphique (GNN) et basé sur le transformateur
.Résultats expérimentaux :
Figure 3. La représentation de l'incertitude proposée dans cet article est capable de capturer l'incertitude causée par les occlusions entre la caméra d'un véhicule autonome (AV) et les éléments cartographiques environnants. Gauche : Images des caméras avant et avant droite. À droite : carte HD générée par le modèle de carte en ligne de haute précision amélioré dans cet article. L'ellipse représente l'écart type de la distribution. Les couleurs représentent les limites des routes, les séparateurs de voies, les passages pour piétons et les lignes médianes des voies.
Figure 4. Dans un parking dense, de nombreux modèles ne parviennent pas à produire des cartes précises. Gauche : images des caméras arrière et arrière gauche. À droite : carte HD générée par le modèle de carte en ligne de haute précision amélioré dans cet article. L'ellipse montre l'écart type de la distribution. Les couleurs représentent les limites des routes, les séparateurs de voies, les passages pour piétons et les lignes médianes des voies.
Résumé: Ce document propose une formule généralisée d'incertitude de carte vectorisée et étend une variété de méthodes d'estimation de carte en ligne récentes, y compris MAPTR [22], MAPTRV2 [23] et StreamMapNet [38], leur permettant de générer en plus de l'incertitude. Nous analysons systématiquement l'incertitude qui en résulte et constatons que notre approche capture de nombreuses sources d'incertitude (occlusions, distance de la caméra, heure de la journée et météo). Enfin, cet article combine ces modèles d'estimation de carte en ligne avec des méthodes de prédiction de trajectoire de pointe (DenseTNT [13] et HiVT [41]) et montre que l'intégration de l'incertitude cartographique en ligne améliore considérablement les performances et les caractéristiques d'entraînement des modèles de prédiction. , respectivement jusqu'à 15 % et 50 %. Une direction de recherche future passionnante consiste à utiliser ces résultats d’incertitude pour mesurer l’étalonnage des modèles cartographiques (similaire à [16]). Cependant, cette tâche est compliquée par la nécessité de faire correspondre des ensembles de points flous, ce qui constitue un problème difficile en soi.
Citation :
Gu X, Song G, Gilitschenski I, et al. Produire et exploiter l'incertitude des cartes en ligne dans la prévision de trajectoire[J].
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Écrit ci-dessus et compréhension personnelle de l'auteur Le Gaussiansplatting tridimensionnel (3DGS) est une technologie transformatrice qui a émergé dans les domaines des champs de rayonnement explicites et de l'infographie ces dernières années. Cette méthode innovante se caractérise par l’utilisation de millions de gaussiennes 3D, ce qui est très différent de la méthode du champ de rayonnement neuronal (NeRF), qui utilise principalement un modèle implicite basé sur les coordonnées pour mapper les coordonnées spatiales aux valeurs des pixels. Avec sa représentation explicite de scènes et ses algorithmes de rendu différenciables, 3DGS garantit non seulement des capacités de rendu en temps réel, mais introduit également un niveau de contrôle et d'édition de scène sans précédent. Cela positionne 3DGS comme un révolutionnaire potentiel pour la reconstruction et la représentation 3D de nouvelle génération. À cette fin, nous fournissons pour la première fois un aperçu systématique des derniers développements et préoccupations dans le domaine du 3DGS.

Hier, lors de l'entretien, on m'a demandé si j'avais posé des questions à longue traîne, j'ai donc pensé faire un bref résumé. Le problème à longue traîne de la conduite autonome fait référence aux cas extrêmes dans les véhicules autonomes, c'est-à-dire à des scénarios possibles avec une faible probabilité d'occurrence. Le problème perçu de la longue traîne est l’une des principales raisons limitant actuellement le domaine de conception opérationnelle des véhicules autonomes intelligents à véhicule unique. L'architecture sous-jacente et la plupart des problèmes techniques de la conduite autonome ont été résolus, et les 5 % restants des problèmes à longue traîne sont progressivement devenus la clé pour restreindre le développement de la conduite autonome. Ces problèmes incluent une variété de scénarios fragmentés, de situations extrêmes et de comportements humains imprévisibles. La « longue traîne » des scénarios limites dans la conduite autonome fait référence aux cas limites dans les véhicules autonomes (VA). Les cas limites sont des scénarios possibles avec une faible probabilité d'occurrence. ces événements rares

0. Écrit à l'avant&& Compréhension personnelle que les systèmes de conduite autonome s'appuient sur des technologies avancées de perception, de prise de décision et de contrôle, en utilisant divers capteurs (tels que caméras, lidar, radar, etc.) pour percevoir l'environnement et en utilisant des algorithmes et des modèles pour une analyse et une prise de décision en temps réel. Cela permet aux véhicules de reconnaître les panneaux de signalisation, de détecter et de suivre d'autres véhicules, de prédire le comportement des piétons, etc., permettant ainsi de fonctionner en toute sécurité et de s'adapter à des environnements de circulation complexes. Cette technologie attire actuellement une grande attention et est considérée comme un domaine de développement important pour l'avenir des transports. . un. Mais ce qui rend la conduite autonome difficile, c'est de trouver comment faire comprendre à la voiture ce qui se passe autour d'elle. Cela nécessite que l'algorithme de détection d'objets tridimensionnels du système de conduite autonome puisse percevoir et décrire avec précision les objets dans l'environnement, y compris leur emplacement,

Le premier article pilote et clé présente principalement plusieurs systèmes de coordonnées couramment utilisés dans la technologie de conduite autonome, et comment compléter la corrélation et la conversion entre eux, et enfin construire un modèle d'environnement unifié. L'objectif ici est de comprendre la conversion du véhicule en corps rigide de caméra (paramètres externes), la conversion de caméra en image (paramètres internes) et la conversion d'image en unité de pixel. La conversion de 3D en 2D aura une distorsion, une traduction, etc. Points clés : Le système de coordonnées du véhicule et le système de coordonnées du corps de la caméra doivent être réécrits : le système de coordonnées planes et le système de coordonnées des pixels Difficulté : la distorsion de l'image doit être prise en compte. La dé-distorsion et l'ajout de distorsion sont compensés sur le plan de l'image. 2. Introduction Il existe quatre systèmes de vision au total : système de coordonnées du plan de pixels (u, v), système de coordonnées d'image (x, y), système de coordonnées de caméra () et système de coordonnées mondiales (). Il existe une relation entre chaque système de coordonnées,

La prédiction de trajectoire joue un rôle important dans la conduite autonome. La prédiction de trajectoire de conduite autonome fait référence à la prédiction de la trajectoire de conduite future du véhicule en analysant diverses données pendant le processus de conduite du véhicule. En tant que module central de la conduite autonome, la qualité de la prédiction de trajectoire est cruciale pour le contrôle de la planification en aval. La tâche de prédiction de trajectoire dispose d'une riche pile technologique et nécessite une connaissance de la perception dynamique/statique de la conduite autonome, des cartes de haute précision, des lignes de voie, des compétences en architecture de réseau neuronal (CNN&GNN&Transformer), etc. Il est très difficile de démarrer ! De nombreux fans espèrent se lancer dans la prédiction de trajectoire le plus tôt possible et éviter les pièges. Aujourd'hui, je vais faire le point sur quelques problèmes courants et des méthodes d'apprentissage introductives pour la prédiction de trajectoire ! Connaissances introductives 1. Existe-t-il un ordre d'entrée pour les épreuves de prévisualisation ? R : Regardez d’abord l’enquête, p

Titre original : SIMPL : ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving Lien article : https://arxiv.org/pdf/2402.02519.pdf Lien code : https://github.com/HKUST-Aerial-Robotics/SIMPL Affiliation de l'auteur : Université des sciences de Hong Kong et technologie Idée DJI Paper : cet article propose une base de référence de prédiction de mouvement (SIMPL) simple et efficace pour les véhicules autonomes. Par rapport au cent agent traditionnel

Écrit à l'avant et point de départ Le paradigme de bout en bout utilise un cadre unifié pour réaliser plusieurs tâches dans les systèmes de conduite autonome. Malgré la simplicité et la clarté de ce paradigme, les performances des méthodes de conduite autonome de bout en bout sur les sous-tâches sont encore loin derrière les méthodes à tâche unique. Dans le même temps, les fonctionnalités de vue à vol d'oiseau (BEV) denses, largement utilisées dans les méthodes de bout en bout précédentes, rendent difficile l'adaptation à davantage de modalités ou de tâches. Un paradigme de conduite autonome de bout en bout (SparseAD) centré sur la recherche clairsemée est proposé ici, dans lequel la recherche clairsemée représente entièrement l'ensemble du scénario de conduite, y compris l'espace, le temps et les tâches, sans aucune représentation BEV dense. Plus précisément, une architecture clairsemée unifiée est conçue pour la connaissance des tâches, notamment la détection, le suivi et la cartographie en ligne. De plus, lourd

Au cours du mois dernier, pour des raisons bien connues, j'ai eu des échanges très intensifs avec divers professeurs et camarades de classe du secteur. Un sujet inévitable dans l'échange est naturellement le populaire Tesla FSDV12 de bout en bout. Je voudrais profiter de cette occasion pour trier certaines de mes pensées et opinions en ce moment pour votre référence et votre discussion. Comment définir un système de conduite autonome de bout en bout et quels problèmes devraient être résolus de bout en bout ? Selon la définition la plus traditionnelle, un système de bout en bout fait référence à un système qui saisit les informations brutes des capteurs et génère directement les variables pertinentes pour la tâche. Par exemple, en reconnaissance d'images, CNN peut être appelé de bout en bout par rapport à la méthode traditionnelle d'extraction de caractéristiques + classificateur. Dans les tâches de conduite autonome, saisir les données de divers capteurs (caméra/LiDAR
