


ScalableMap : apprentissage cartographique évolutif pour la construction de cartes vectorielles de haute précision à longue portée en ligne
Cartes évolutives : apprentissage de cartes évolutives pour la construction de cartes HD vectorisées longue distance en ligne
Veuillez cliquer sur le lien suivant pour lire l'article : https://arxiv.org/pdf/2310.13378.pdf
Lien de code : https://arxiv.org/pdf/2310.13378.pdf
Lien de code : https:// github.com/jingy1yu/ScalableMap
L'auteur est de l'Université de Wuhan
Idée de thèse :
Cet article propose un nouveau processus de bout en bout pour construire des vecteurs longue distance en ligne à l'aide de capteurs de caméras de véhicules. Élevé -cartes de définition (HD). Les représentations vectorielles de cartes de haute précision utilisent des polylignes et des polygones pour représenter les entités cartographiques, largement utilisées par les tâches en aval. Cependant, les solutions précédentes conçues en référence à la détection dynamique de cibles ignoraient les contraintes structurelles au sein des éléments de carte linéaire, ce qui entraînait une dégradation des performances dans les scènes longue distance. Cet article utilise les attributs des entités cartographiques pour améliorer les performances de construction de cartes. Cet article extrait des caractéristiques de vue à vol d'oiseau (BEV) plus précises sous la direction de structures linéaires, puis propose une représentation graphique clairsemée hiérarchique pour exploiter davantage l'évolutivité des éléments graphiques vectorisés, et conçoit un mécanisme de décodage progressif basé sur cette stratégie de supervision. . La méthode ScalableMap de cet article a démontré d'excellentes performances sur l'ensemble de données nuScenes, en particulier dans les scènes longue distance. Par rapport au modèle de pointe précédent, elle a amélioré 6,5 mAP et atteint un FPS de 18,3
Principales contributions :(i) Cet article propose ScalableMap, le premier pipeline de construction de cartes vectorielles longue distance de bout en bout. Cet article utilise les caractéristiques structurelles des éléments cartographiques pour extraire des caractéristiques BEV plus précises, propose un HSMR basé sur des éléments vectorisés évolutifs et conçoit des décodeurs progressifs et des stratégies de supervision en conséquence. Tout cela se traduit par une perception supérieure des cartes à longue distance.
Grâce à une évaluation expérimentale approfondie, cette étude a testé les performances de ScalableMap sur l'ensemble de données nuScenes [17]. La méthode de recherche a obtenu des résultats de pointe en matière d'apprentissage cartographique longue distance de haute précision, améliorant 6,5 mAP par rapport aux méthodes multimodales existantes tout en atteignant une vitesse de 18,3 images par seconde
Conception du réseau :Cette article L'objectif est d'exploiter les propriétés structurelles des éléments cartographiques vectorisés pour résoudre le défi de la détection précise des éléments cartographiques sur de plus longues distances. Premièrement, cet article extrait les fonctionnalités BEV sensibles à la position et les fonctionnalités BEV sensibles aux instances à travers deux branches respectivement, et les fusionne sous la direction d'une structure linéaire pour obtenir des fonctionnalités BEV hybrides. Ensuite, cet article propose une représentation cartographique clairsemée hiérarchique (HSMR) pour abstraire les éléments cartographiques de manière clairsemée mais précise. En intégrant cette représentation à la couche de décodage en cascade proposée par DETR [16], cet article conçoit un décodeur progressif qui améliore les contraintes des informations structurées en tirant parti de l'évolutivité des éléments de cartographie vectorisés et d'une stratégie de supervision progressive pour améliorer la précision de l'inférence. La solution de cet article, ScalableMap, augmente dynamiquement la densité d'échantillonnage de la carte pour obtenir des résultats d'inférence à différentes échelles, permettant à cet article d'obtenir plus rapidement des informations cartographiques plus précises.
Veuillez vous référer au contenu réécrit ci-dessous :
Figure 1 : Présentation de ScalableMap.
(a) Extracteur de fonctionnalités BEV hybride guidé par la structure.
(b) Représentation cartographique clairsemée hiérarchique et décodeur progressif.
(c) Supervision progressive
Figure 2 : Visualisation de la perte progressive de la polyligne.
Résultats expérimentaux :Afin de réécrire le contenu sans changer le sens original, le texte original doit être réécrit en chinois
Yu, J., Zhang , Z., Xia, S. et Sang, J. (2023). ScalableMap : apprentissage de cartes évolutif pour la construction de cartes HD vectorisées à longue portée en ligne. ArXiv. /abs/2310.13378
Le contenu qui doit être réécrit est le suivant : réécrivez le contenu sans changer le sens original. La langue dans laquelle réécrire est le chinois. La phrase originale n'a pas besoin d'apparaître
.Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds



La carte par défaut sur l'iPhone est Maps, le fournisseur de géolocalisation propriétaire d'Apple. Même si la carte s’améliore, elle ne fonctionne pas bien en dehors des États-Unis. Il n'a rien à offrir par rapport à Google Maps. Dans cet article, nous discutons des étapes réalisables pour utiliser Google Maps afin de devenir la carte par défaut sur votre iPhone. Comment faire de Google Maps la carte par défaut sur iPhone Définir Google Maps comme application cartographique par défaut sur votre téléphone est plus facile que vous ne le pensez. Suivez les étapes ci-dessous – Étapes préalables – Vous devez avoir Gmail installé sur votre téléphone. Étape 1 – Ouvrez l'AppStore. Étape 2 – Recherchez « Gmail ». Étape 3 – Cliquez à côté de l'application Gmail

Écrit ci-dessus et compréhension personnelle de l'auteur Le Gaussiansplatting tridimensionnel (3DGS) est une technologie transformatrice qui a émergé dans les domaines des champs de rayonnement explicites et de l'infographie ces dernières années. Cette méthode innovante se caractérise par l’utilisation de millions de gaussiennes 3D, ce qui est très différent de la méthode du champ de rayonnement neuronal (NeRF), qui utilise principalement un modèle implicite basé sur les coordonnées pour mapper les coordonnées spatiales aux valeurs des pixels. Avec sa représentation explicite de scènes et ses algorithmes de rendu différenciables, 3DGS garantit non seulement des capacités de rendu en temps réel, mais introduit également un niveau de contrôle et d'édition de scène sans précédent. Cela positionne 3DGS comme un révolutionnaire potentiel pour la reconstruction et la représentation 3D de nouvelle génération. À cette fin, nous fournissons pour la première fois un aperçu systématique des derniers développements et préoccupations dans le domaine du 3DGS.

Hier, lors de l'entretien, on m'a demandé si j'avais posé des questions à longue traîne, j'ai donc pensé faire un bref résumé. Le problème à longue traîne de la conduite autonome fait référence aux cas extrêmes dans les véhicules autonomes, c'est-à-dire à des scénarios possibles avec une faible probabilité d'occurrence. Le problème perçu de la longue traîne est l’une des principales raisons limitant actuellement le domaine de conception opérationnelle des véhicules autonomes intelligents à véhicule unique. L'architecture sous-jacente et la plupart des problèmes techniques de la conduite autonome ont été résolus, et les 5 % restants des problèmes à longue traîne sont progressivement devenus la clé pour restreindre le développement de la conduite autonome. Ces problèmes incluent une variété de scénarios fragmentés, de situations extrêmes et de comportements humains imprévisibles. La « longue traîne » des scénarios limites dans la conduite autonome fait référence aux cas limites dans les véhicules autonomes (VA). Les cas limites sont des scénarios possibles avec une faible probabilité d'occurrence. ces événements rares

0. Écrit à l'avant&& Compréhension personnelle que les systèmes de conduite autonome s'appuient sur des technologies avancées de perception, de prise de décision et de contrôle, en utilisant divers capteurs (tels que caméras, lidar, radar, etc.) pour percevoir l'environnement et en utilisant des algorithmes et des modèles pour une analyse et une prise de décision en temps réel. Cela permet aux véhicules de reconnaître les panneaux de signalisation, de détecter et de suivre d'autres véhicules, de prédire le comportement des piétons, etc., permettant ainsi de fonctionner en toute sécurité et de s'adapter à des environnements de circulation complexes. Cette technologie attire actuellement une grande attention et est considérée comme un domaine de développement important pour l'avenir des transports. . un. Mais ce qui rend la conduite autonome difficile, c'est de trouver comment faire comprendre à la voiture ce qui se passe autour d'elle. Cela nécessite que l'algorithme de détection d'objets tridimensionnels du système de conduite autonome puisse percevoir et décrire avec précision les objets dans l'environnement, y compris leur emplacement,

La prédiction de trajectoire joue un rôle important dans la conduite autonome. La prédiction de trajectoire de conduite autonome fait référence à la prédiction de la trajectoire de conduite future du véhicule en analysant diverses données pendant le processus de conduite du véhicule. En tant que module central de la conduite autonome, la qualité de la prédiction de trajectoire est cruciale pour le contrôle de la planification en aval. La tâche de prédiction de trajectoire dispose d'une riche pile technologique et nécessite une connaissance de la perception dynamique/statique de la conduite autonome, des cartes de haute précision, des lignes de voie, des compétences en architecture de réseau neuronal (CNN&GNN&Transformer), etc. Il est très difficile de démarrer ! De nombreux fans espèrent se lancer dans la prédiction de trajectoire le plus tôt possible et éviter les pièges. Aujourd'hui, je vais faire le point sur quelques problèmes courants et des méthodes d'apprentissage introductives pour la prédiction de trajectoire ! Connaissances introductives 1. Existe-t-il un ordre d'entrée pour les épreuves de prévisualisation ? R : Regardez d’abord l’enquête, p

Titre original : SIMPL : ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving Lien article : https://arxiv.org/pdf/2402.02519.pdf Lien code : https://github.com/HKUST-Aerial-Robotics/SIMPL Affiliation de l'auteur : Université des sciences de Hong Kong et technologie Idée DJI Paper : cet article propose une base de référence de prédiction de mouvement (SIMPL) simple et efficace pour les véhicules autonomes. Par rapport au cent agent traditionnel

Écrit à l'avant et point de départ Le paradigme de bout en bout utilise un cadre unifié pour réaliser plusieurs tâches dans les systèmes de conduite autonome. Malgré la simplicité et la clarté de ce paradigme, les performances des méthodes de conduite autonome de bout en bout sur les sous-tâches sont encore loin derrière les méthodes à tâche unique. Dans le même temps, les fonctionnalités de vue à vol d'oiseau (BEV) denses, largement utilisées dans les méthodes de bout en bout précédentes, rendent difficile l'adaptation à davantage de modalités ou de tâches. Un paradigme de conduite autonome de bout en bout (SparseAD) centré sur la recherche clairsemée est proposé ici, dans lequel la recherche clairsemée représente entièrement l'ensemble du scénario de conduite, y compris l'espace, le temps et les tâches, sans aucune représentation BEV dense. Plus précisément, une architecture clairsemée unifiée est conçue pour la connaissance des tâches, notamment la détection, le suivi et la cartographie en ligne. De plus, lourd

Au cours du mois dernier, pour des raisons bien connues, j'ai eu des échanges très intensifs avec divers professeurs et camarades de classe du secteur. Un sujet inévitable dans l'échange est naturellement le populaire Tesla FSDV12 de bout en bout. Je voudrais profiter de cette occasion pour trier certaines de mes pensées et opinions en ce moment pour votre référence et votre discussion. Comment définir un système de conduite autonome de bout en bout et quels problèmes devraient être résolus de bout en bout ? Selon la définition la plus traditionnelle, un système de bout en bout fait référence à un système qui saisit les informations brutes des capteurs et génère directement les variables pertinentes pour la tâche. Par exemple, en reconnaissance d'images, CNN peut être appelé de bout en bout par rapport à la méthode traditionnelle d'extraction de caractéristiques + classificateur. Dans les tâches de conduite autonome, saisir les données de divers capteurs (caméra/LiDAR
