Nouvelles idées pour la simulation LiDAR | LidarDM : aide à générer un monde 4D, un tueur de simulation ~-IA-php.cn

Table des matières

Idée de thèse :

Conception de réseau :

Résultats expérimentaux :

Résumé :

Maison

Périphériques technologiques

Nouvelles idées pour la simulation LiDAR | LidarDM : aide à générer un monde 4D, un tueur de simulation ~

PHPz

Apr 12, 2024 am 11:46 AM

git 雷达模拟器 modèle de diffusion

Titre original : LidarDM : Generative LiDAR Simulation in a Generated World

Lien papier : https://arxiv.org/pdf/2404.02903.pdf

Lien code : https://github.com/vzyrianov/lidardm

Affiliation de l'auteur : Université de l'Illinois, Massachusetts Institute of Technology

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Idée de thèse :

Cet article présente LidarDM, un nouveau modèle de génération lidar capable de produire une vidéo lidar réaliste, sensible à la mise en page, physiquement crédible et temporellement cohérente. LidarDM dispose de deux capacités sans précédent dans la modélisation de la génération lidar : (1) la génération lidar guidée par des scénarios de conduite, offrant des incitations significatives pour les simulations de conduite autonome ; (2) la génération de nuages de points lidar 4D, permettant la création de séquences lidar réalistes et temporellement cohérentes. Le cœur de notre modèle est un nouveau cadre complet de génération mondiale 4D. Plus précisément, cet article utilise des modèles de diffusion latente pour générer des scènes 3D, les combine avec des acteurs dynamiques pour former le monde 4D sous-jacent, puis génère des données de perception laser réalistes dans cet environnement virtuel. Nos expériences montrent que notre méthode surpasse les algorithmes concurrents en termes de fidélité, de cohérence temporelle et de cohérence de mise en page. Cet article démontre également que LidarDM peut être utilisé comme simulateur de monde génératif pour former et tester des modèles de perception.

Conception de réseau :

Les modèles génératifs développés ont attiré de plus en plus d'attention dans le traitement de la distribution de données et la création de contenu, comme la génération d'images et de vidéos [10, 33, 52-55], la génération d'objets 3D [10,19 ,38,52], compression [5,29,68] et édition [37,47] et autres champs. Les modèles génératifs présentent également un excellent potentiel de simulation [6, 11, 18, 34, 46, 60, 64, 66, 76, 82], permettant la création de scénarios réalistes et de leurs données sensorielles associées pour la formation et l'évaluation des capacités de renseignement critiques en matière de sécurité. , comme les robots et les véhicules autonomes, éliminent le besoin d’une modélisation manuelle coûteuse du monde réel. Ces fonctionnalités sont essentielles pour les applications qui reposent sur une formation environnementale approfondie ou des tests de scénarios.

Les progrès dans la génération conditionnelle d'images et de vidéos ont été remarquables, mais la tâche spécifique consistant à générer des séquences réalistes de nuages de points lidar pour des scénarios fonctionnellement spécifiques pour les applications de conduite autonome reste sous-explorée. Les méthodes actuelles de génération lidar se répartissent en deux catégories principales, chacune étant confrontée à des défis spécifiques.

Les méthodes actuelles de modélisation de génération lidar [8, 72, 79, 83] sont limitées à la génération d'une seule image et ne fournissent pas de moyens de contrôlabilité sémantique et de cohérence temporelle.
La resimulation Lidar [14, 17, 46, 65, 67, 74] s'appuie fortement sur des actifs créés par l'utilisateur ou collectés dans le monde réel. Cela ajoute des coûts d’exploitation élevés, limite la diversité et limite une applicabilité plus large.

Pour relever ces défis, cet article propose LidarDM (Lidar Diffusion Model), qui peut créer des vidéos lidar réalistes, sensibles à la mise en page, physiquement crédibles et temporellement cohérentes. Cet article explore deux nouvelles capacités qui n'ont pas été abordées auparavant : (i) la synthèse lidar guidée par des scénarios de conduite, qui présente un grand potentiel pour la simulation de conduite autonome, et (ii) visant à produire des nuages de points lidar réalistes et annotés. Nuage de points lidar 4D séquentiel la synthèse. L’idée clé pour atteindre ces objectifs dans cet article réside dans la première génération et la combinaison du monde 4D sous-jacent, puis dans la création d’observations perceptuelles réalistes au sein de cet environnement virtuel. Pour y parvenir, cet article intègre les méthodes existantes de génération d'objets 3D pour créer des acteurs dynamiques et développe une nouvelle méthode de génération de scènes 3D à grande échelle basée sur des modèles de diffusion latente. Cette approche est capable de produire des scènes de conduite 3D réalistes et diversifiées à partir de la disposition sémantique des particules et, à la connaissance de cet article, il s'agit de la première tentative. Cet article applique des trajectoires pour générer un monde 3D et effectue une simulation de raycasting stochastique pour générer la séquence lidar 4D finale. Comme le montre la figure 1, les résultats générés dans cet article sont divers, alignés sur les conditions de mise en page et sont à la fois réalistes et cohérents dans le temps.

Les résultats expérimentaux de cet article montrent que les images à image unique générées par LidarDM présentent un réalisme et une diversité, et que leurs performances sont comparables à la technologie de pointe de génération de nuages de points laser à image unique sans rayures. De plus, cet article démontre que LidarDM est capable de produire des vidéos de nuages de points laser temporellement cohérentes, au-delà de la base de référence robuste de génération de capteurs de diffusion. À notre connaissance, il s’agit de la première méthode de génération de nuages de points laser dotée de cette capacité. Cet article démontre en outre les capacités de génération d'éléments du LidarDM en démontrant un bon accord entre le nuage de points laser généré et le nuage de points laser réel sous les éléments cartographiques correspondants. Enfin, cet article démontre que les données générées à l'aide de LidarDM présentent des écarts de domaine minimes lorsqu'elles sont testées avec des modules de perception formés sur des données réelles, et peuvent également être utilisées pour étendre les données de formation, améliorant ainsi considérablement les performances des détecteurs 3D. Cela constitue une condition préalable à l'utilisation du modèle de nuage de points laser généré pour créer un environnement de simulation réaliste et contrôlable pour la formation et le test des modèles de conduite.

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Figure 1 : Cet article présente LidarDM, un nouveau modèle génératif lidar 4D. La vidéo lidar générée dans cet article présente à la fois les avantages du réalisme, de la conditionnalité de la mise en page, de la crédibilité physique, de la diversité et de la cohérence temporelle.

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Figure 2 : Application de LidarDM : (a) Générer un lidar étroitement aligné avec la carte sans capture ni modélisation 3D (les cases colorées mettent en évidence la cohérence entre le lidar et la carte b) fournir des données de capteur à un simulateur de trafic existant (); Waymax [20]), lui permettant d'évaluer des scénarios critiques pour la sécurité à partir de données de capteurs pures uniquement ; (c) générer de grandes quantités de données lidar avec des emplacements d'obstacles contrôlables (considérés comme des étiquettes réelles disponibles gratuitement) pour améliorer les modèles de perception grâce à une pré-formation. sans capture et annotation de données coûteuses.

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Figure 3 : Présentation de LidarDM : Étant donné l'entrée de disposition du trafic à l'instant t = 0, LidarDM génère d'abord des acteurs de trafic et des scènes statiques. Ensuite, cet article génère les mouvements des participants à la circulation (acteurs) et des véhicules autonomes, et construit le monde 4D sous-jacent. Enfin, utilisez la simulation générative et basée sur la physique pour créer des données de capteurs 4D réalistes.

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Figure 4 : Le processus de génération de scène 3D de cet article. Tout d’abord, le nuage de points accumulé est utilisé pour reconstruire chaque échantillon de maillage réel. Ensuite, un auto-encodeur variationnel (VAE) est entraîné pour compresser la grille en un codage implicite. Enfin, un modèle de diffusion conditionné sur la carte est entraîné pour échantillonner dans l'espace latent du VAE afin de générer de nouveaux échantillons.

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Figure 5 : Réseau de gouttes de rayons aléatoires pour la simulation du bruit perceptuel, améliorant encore le réalisme. Cet article met en évidence les points rayonnés en rouge sur la carte de distance masquée et l'image lidar masquée ci-dessus.

Résultats expérimentaux :

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Figure 6 : De vrais échantillons KITTI-360 comparés à des échantillons non conditionnés provenant de méthodes concurrentes. Les visualisations d'échantillons UltraLiDAR sont tirées directement de leur article. Par rapport aux méthodes précédentes, LidarDM génère des échantillons avec un plus grand nombre d'objets saillants plus détaillés (par exemple des voitures, des piétons), des structures 3D plus claires (par exemple des murs droits) et un tracé routier plus réaliste.

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Figure 7 : Résultats qualitatifs de la génération de séquences conditionnées par carte sur 2 séquences cartographiques Waymax [20]. Cet article montre également le nuage de points cumulatif correspondant pour mettre en évidence la cohérence temporelle du LidarDM.

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

Résumé :

Cet article propose LidarDM, un nouveau modèle de diffusion latente basé sur des conditions de mise en page pour générer des nuages de points lidar réalistes. Notre approche définit le problème comme une tâche conjointe de création de monde 4D et de génération de données de perception, et développe un nouveau modèle de diffusion latente pour créer des scènes 3D. La vidéo de nuage de points qui en résulte est réaliste, cohérente et adaptée à la mise en page.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7505

Tutoriel CakePHP

1378

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Comment exécuter le projet H5 Apr 06, 2025 pm 12:21 PM

L'exécution du projet H5 nécessite les étapes suivantes: Installation des outils nécessaires tels que le serveur Web, Node.js, les outils de développement, etc. Créez un environnement de développement, créez des dossiers de projet, initialisez les projets et écrivez du code. Démarrez le serveur de développement et exécutez la commande à l'aide de la ligne de commande. Aperçu du projet dans votre navigateur et entrez l'URL du serveur de développement. Publier des projets, optimiser le code, déployer des projets et configurer la configuration du serveur Web.

Comment spécifier la base de données associée au modèle de Beego ORM? Apr 02, 2025 pm 03:54 PM

Dans le cadre du cadre de beegoorm, comment spécifier la base de données associée au modèle? De nombreux projets Beego nécessitent que plusieurs bases de données soient opérées simultanément. Lorsque vous utilisez Beego ...

Gitee Pages STATIQUE Le déploiement du site Web a échoué: comment dépanner et résoudre les erreurs de fichier unique 404? Apr 04, 2025 pm 11:54 PM

GiteEpages STATIQUE Le déploiement du site Web a échoué: 404 Dépannage des erreurs et résolution lors de l'utilisation de Gitee ...

Quelles bibliothèques de GO sont développées par de grandes entreprises ou fournies par des projets open source bien connus? Apr 02, 2025 pm 04:12 PM

Quelles bibliothèques de GO sont développées par de grandes entreprises ou des projets open source bien connus? Lors de la programmation en Go, les développeurs rencontrent souvent des besoins communs, ...

Comment résoudre le problème de conversion de type user_id lors de l'utilisation du flux redis pour implémenter les files d'attente de messages dans le langage Go? Apr 02, 2025 pm 04:54 PM

Le problème de l'utilisation de Redessstream pour implémenter les files d'attente de messages dans le langage GO consiste à utiliser le langage GO et redis ...

La production de pages H5 nécessite-t-elle une maintenance continue? Apr 05, 2025 pm 11:27 PM

La page H5 doit être maintenue en continu, en raison de facteurs tels que les vulnérabilités du code, la compatibilité des navigateurs, l'optimisation des performances, les mises à jour de sécurité et les améliorations de l'expérience utilisateur. Des méthodes de maintenance efficaces comprennent l'établissement d'un système de test complet, à l'aide d'outils de contrôle de version, de surveiller régulièrement les performances de la page, de collecter les commentaires des utilisateurs et de formuler des plans de maintenance.

Comment convertir XML en Excel Apr 03, 2025 am 08:54 AM

Il existe deux façons de convertir XML en Excel: utilisez des fonctionnalités Excel intégrées ou des outils tiers. Les outils tiers incluent XML pour Excel Converter, XML2Excel et XML Candy.

Dans la programmation GO, comment gérer correctement les ressources de connexion et de libération entre MySQL et Redis? Apr 02, 2025 pm 05:03 PM

Gestion des ressources dans la programmation Go: MySQL et Redis se connectent et publient pour apprendre à gérer correctement les ressources, en particulier avec les bases de données et les caches ...

See all articles