Le positionnement occupe une place irremplaçable dans la conduite autonome et les développements sont prometteurs pour l'avenir. Actuellement, le positionnement en conduite autonome repose sur RTK et des cartes de haute précision, ce qui ajoute beaucoup de coûts et de difficultés à la mise en œuvre de la conduite autonome. Imaginez simplement que lorsque les humains conduisent, ils n'ont pas besoin de connaître leur propre positionnement global de haute précision et l'environnement détaillé. Il suffit d'avoir un chemin de navigation global et de faire correspondre la position du véhicule sur le chemin. Domaine SLAM.
SLAM (Simultaneous Localization and Mapping), également connu sous le nom de CML (Concurrent Mapping and Localization), positionnement et construction de cartes en temps réel, ou cartographie et positionnement simultanés. Le problème peut être décrit comme suit : placer un robot dans un emplacement inconnu dans un environnement inconnu. Existe-t-il un moyen pour le robot de dessiner progressivement une carte complète de l'environnement tout en décidant dans quelle direction il doit se déplacer ? Par exemple, un robot de balayage est un problème SLAM très typique. La carte dite complète (une carte cohérente) signifie qu'il peut se déplacer sans obstacles dans tous les coins accessibles de la pièce.
SLAM a été proposé pour la première fois par Smith, Self et Cheeseman en 1988. En raison de son importante valeur théorique et applicative, de nombreux chercheurs le considèrent comme la clé de la réalisation d’un robot mobile véritablement entièrement autonome.
Simule que lorsque les humains arrivent dans un environnement inconnu, afin de se familiariser rapidement avec l'environnement et d'accomplir leurs tâches (comme trouver un restaurant, trouver un hôtel), ils doivent procéder dans l'ordre suivant :
a. Observez les environs avec vos yeux, les monuments tels que les bâtiments, les grands arbres, les parterres de fleurs, etc., et mémorisez leurs caractéristiques (extraction de caractéristiques)
b. , reconstruisez les repères caractéristiques dans la carte tridimensionnelle (reconstruction tridimensionnelle)
c Lorsque vous marchez, acquérez constamment de nouveaux repères caractéristiques et corrigez le modèle de carte dans votre esprit (ajustement du faisceau ou EKF)
.d. Sur la base des caractéristiques que vous avez obtenues en marchant il y a quelque temps Landmark, déterminez votre position (trajectoire)
e Lorsque vous marchez un long chemin involontairement, faites-la correspondre aux points de repère précédents dans votre esprit pour voir si vous marchez longtemps. sont revenus au chemin d'origine (détection de fermeture de boucle). En réalité, cette étape est facultative. Les cinq étapes ci-dessus sont effectuées simultanément, il s'agit donc de localisation et de cartographie simultanées.
Les capteurs actuellement utilisés en SLAM sont principalement divisés en deux catégories, le lidar et les caméras. Le LiDAR peut être divisé en types monolignes et multilignes, avec différentes résolutions angulaires et précisions.
VSLAM est principalement mis en œuvre avec des caméras. Il existe de nombreux types de caméras, qui sont principalement divisées en monoculaires, binoculaires, à lumière structurée monoculaire, à lumière structurée binoculaire et ToF. Leur cœur est d’obtenir RVB et une carte de profondeur (informations sur la profondeur). En raison de l'impact des coûts de fabrication, le SLAM visuel est devenu de plus en plus populaire ces dernières années. La cartographie et le positionnement en temps réel via des caméras à faible coût sont également très difficiles sur le plan technique. Prenons comme exemple ToF (Time of Flight), une méthode d’acquisition de profondeur prometteuse.
Le capteur émet une lumière proche infrarouge modulée, qui se reflète lorsqu'il rencontre un objet. Le capteur calcule la différence de temps ou la différence de phase entre l'émission de lumière et la réflexion pour convertir la distance de la scène photographiée afin de générer des informations de profondeur. Semblable au radar, ou imaginez une chauve-souris, le DS325 de softkinetic utilise une solution ToF (conçue par TI). Cependant, la microstructure de son récepteur est relativement spéciale, avec deux obturateurs ou plus, et peut mesurer les différences de temps au niveau p. Cependant, sa taille de pixel unitaire est généralement de 100 um, la résolution actuelle n'est donc pas élevée.
Une fois la carte de profondeur obtenue, l'algorithme SLAM commence à fonctionner. En raison des différents capteurs et exigences, la forme de présentation du SLAM est légèrement différente. Il peut être grossièrement divisé en SLAM laser (également divisé en 2D et 3D) et SLAM visuel (également divisé en Sparse, semiDense, Dense), mais les idées principales sont similaires.
La technologie SLAM est très pratique, mais elle est également assez difficile dans le domaine de la conduite autonome qui nécessite un positionnement précis à tout moment, il est également difficile de mettre en œuvre le SLAM. De manière générale, l'algorithme SLAM prend principalement en compte les quatre aspects suivants lors de sa mise en œuvre :
1. Les problèmes de représentation de la carte, tels que dense et clairsemé, en sont des expressions différentes.
2. Problème de perception des informations, vous devez réfléchir à la façon de percevoir l'environnement de manière globale. Le champ de vision de la caméra RGBD est généralement plus petit, mais le lidar est plus grand
3. les systèmes ont des expressions différentes et doivent être traités uniformément ;
4. Les problèmes de positionnement et de composition font référence à la manière de réaliser l'estimation et la modélisation de la pose, ce qui implique de nombreux problèmes mathématiques, l'établissement de modèles physiques, l'estimation et l'optimisation de l'état ; d'autres incluent la détection de boucles. problèmes, problèmes d'exploration (exploration) et problèmes d'enlèvement (kidnapping).
Le framework SLAM visuel actuellement populaire comprend principalement le front-end et le back-end :
front-end
Le front-end est équivalent à VO (odométrie visuelle), qui étudie la relation de transformation entre les trames.
Extrayez d'abord les points caractéristiques de chaque image, utilisez les images des images adjacentes pour faire correspondre les points caractéristiques, puis utilisez RANSAC pour supprimer le bruit important, puis effectuez une correspondance pour obtenir des informations de pose (position et attitude). en même temps, vous pouvez utiliser IMU (Inertial). Le filtrage back-end et la fusion des informations d'attitude fournies par l'unité de mesure (unité de mesure inertielle) optimisent principalement les résultats front-end, en utilisant la théorie du filtrage (EKF, UKF, PF) ou la théorie de l'optimisation. TORO et G2O pour optimiser des arbres ou des graphiques. Enfin, l'estimation de la pose optimale est obtenue.
Backend
Le backend a plus de difficultés et implique plus de connaissances mathématiques De manière générale, tout le monde a lentement abandonné la théorie du filtrage traditionnel et s'est orienté vers l'optimisation des graphes.
Parce que d'après la théorie du filtrage, la stabilité du filtre augmente trop rapidement, ce qui exerce beaucoup de pression sur le PF pour l'EKF (Extended Kalman Filter) qui nécessite une inversion fréquente.
Le SLAM basé sur des graphiques est généralement basé sur des images clés pour établir plusieurs nœuds et des relations de transformation relatives entre les nœuds, telles que des matrices de transformation affine, et maintenir en permanence les nœuds clés pour garantir que le graphique La capacité réduit la quantité de calcul tout en garantissant la précision .
La technologie Slam a obtenu de bons résultats dans de nombreux domaines, notamment les robots mobiles d'intérieur, les scènes AR, les drones, etc. Dans le domaine de la conduite autonome, la technologie SLAM n'a pas reçu beaucoup d'attention, d'une part, elle est principalement résolue par RTK dans l'industrie actuelle de la conduite autonome, et d'autre part, trop de ressources ne seront pas investies dans des recherches approfondies. D'une part, la technologie SLAM n'a pas reçu beaucoup d'attention. D'une part, c'est aussi parce que la technologie actuelle n'est pas encore mature. Dans un domaine lié à la vie comme la conduite autonome, toute nouvelle technologie doit passer l'épreuve du temps avant de pouvoir le faire. être accepté.
À l'avenir, avec l'amélioration progressive de la précision des capteurs, SLAM montrera également ses talents dans le domaine de la conduite autonome. Son faible coût et ses performances robustes apporteront des avantages révolutionnaires au changement de conduite autonome. À mesure que la technologie SLAM devient de plus en plus populaire, de plus en plus de talents en positionnement afflueront dans le domaine de la conduite autonome, injectant du sang frais dans la conduite autonome et ouvrant de nouvelles orientations techniques et domaines de recherche.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!