


Gaussian-LIC : Le premier système de fusion multi-capteurs 3DGS-SLAM (Zhejiang University & TUM)
La combinaison de multi-capteurs et de 3DGS
L'expression implicite des « capacités en temps réel requises pour les tâches SLAM intensives en calcul basées sur l'échantillonnage dans l'espace 3D » nécessite des méthodes SLAM basées sur NeRF. 3DGS se distingue par sa vitesse de rendu rapide et sa qualité visuelle supérieure. En tant que représentation claire et interprétable, 3DGS simplifie l'édition de scène et facilite l'exécution de nombreuses tâches en aval.
Les systèmes SLAM existants basés sur un champ de rayonnement sont principalement testés dans des environnements intérieurs à petite échelle bien éclairés et obtiennent des résultats satisfaisants en utilisant des entrées RVB-D ou RVB séquentielles. Des difficultés seront rencontrées lorsque ces méthodes seront étendues à des scènes extérieures incontrôlées à grande échelle, telles que des conditions d'éclairage difficiles, des arrière-plans encombrés et des mouvements personnels très dynamiques.
Utilisez Gaussian-LIC+ pour fusionner les données de plusieurs capteurs, y compris le lidar 3D, l'IMU et les caméras (appelées ALIC), dans des scènes extérieures non contrôlées
- Le premier 3DGS basé sur la fusion de caméras inertielles lidar - système SLAM, permettant un suivi d'attitude très précis et une construction de carte en ligne réaliste.
- Utilisez des nuages de points lidar colorés séquentiellement comme a priori pour reconstruire des cartes gaussiennes de manière en ligne. Utilisez une série de stratégies soigneusement conçues pour étendre progressivement la carte gaussienne et contrôler sa densité de manière adaptative afin d’obtenir une efficacité et une précision élevées.
- Largement éprouvé dans les scènes intérieures et extérieures, démontrant les dernières performances en matière de production de cartes photoréalistes. Robustesse démontrée dans des conditions difficiles, notamment des mouvements très dynamiques, un faible éclairage et un manque de géométrie et de texture visuelle.
La méthode spécifique
est illustrée dans la figure 1, qui est le processus du système LIC-SLAM.
Représentation de 3DGS
Représentez la scène comme une collection anisotrope de gaussiennes 3D, avec la variance de chaque gaussienne :
Projetez la gaussienne 3D sur le plan image pour obtenir une distribution gaussienne 2D :
La gaussienne 2D obtenue par la projection affecte les pixels via l'équation de pondération de l'opacité :
Rendu de l'image de contour pour déterminer si le pixel contient suffisamment d'informations de la carte gaussienne :
LiDAR -Compteur kilométrique IMU-Camera
L'odomètre adopte les travaux précédents Coco-LIC comme frontal de suivi, un système d'odométrie à caméra inertielle lidar étroitement couplé en temps continu. En intégrant trois capteurs complémentaires, Gaussian-LIC réalise une estimation d'attitude puissante, en temps réel et de haute précision, facilitant ainsi le fonctionnement de l'ensemble du système SLAM.
Chaque fois que les dernières données de la caméra inertielle lidar (0,1 seconde dans cet article) sont accumulées, la trajectoire dans cet intervalle de temps est optimisée efficacement en fonction du graphique de facteurs :
- Nuage de points Lidar à cartographier
- image Facteurs visuels sur la carte
- Facteur IMU
- Facteur de biais
Nous utilisons uniquement les dernières images pour l'optimisation pendant l'intervalle de temps.
Gaussian-LIC maintient une carte lidar globale stockée dans des voxels à une résolution de 0,1 mètre. Après avoir optimisé la trajectoire dans l'intervalle de temps actuel, pour améliorer l'efficacité, seul un quart des points lidar de cette période sont convertis en coordonnées mondiales et ajoutés aux voxels pour garantir que le nombre de points lidar dans chaque voxel correspond à la distance qui les sépare. doit être supérieur à 0,05 mètre pour réduire la redondance. Pour les points lidar attachés avec succès, projetez-les sur la dernière image et coloriez-les en interrogeant les valeurs des pixels. Ensuite, ils sont envoyés au fil de cartographie avec la dernière image de la pose estimée de la caméra, qui est considérée comme une image.
Cartographie réaliste basée sur 3DGS
Avec saisie continue : pose de caméra estimée, image sans distorsion, points lidar colorés, le module de cartographie construit et optimise progressivement la carte gaussienne, principalement en 4 étapes :
- Initialisation : Créer une nouvelle distribution gaussienne utilisant tous les points lidar reçus pendant le premier intervalle de temps. Pour atténuer les artefacts d'alias, nous attribuons des échelles plus petites aux gaussiennes plus proches du plan image et des échelles plus grandes aux gaussiennes plus éloignées du plan image :
- Extensions : généralement, chaque image reçue capture la géométrie et l'apparence d'une nouvelle zone de visualisation. Afin d'éviter la duplication ou la redondance d'informations extrêmement similaires, restituez d'abord une image de contour à partir de la vue d'image actuelle selon l'équation (6), et générez un masque pour sélectionner les pixels non fiables dans la carte gaussienne actuelle, et tendez à observer nouvelles zones, seuls les points lidar pouvant être projetés sur le pixel sélectionné sont exploités :
- Optimisation : utiliser toutes les images reçues pour l'optimisation de notre système de cartographie incrémentielle en ligne. Ceci est informatiquement irréalisable, donc une image sur cinq est prise en compte une image clé. Afin de limiter la complexité de calcul pour plus d'efficacité, nous sélectionnons images clés actives pour optimiser la carte gaussienne, y compris la première et la dernière image clé, et d'autres images clés sélectionnées au hasard pour éviter le désastre, résout le problème de l'oubli sexuel et maintient la géométrie. cohérence de la carte globale. Nous mélangeons au hasard les images clés sélectionnées et parcourons chaque image clé une par une, optimisant la carte en minimisant la perte de rendu :
- Contrôle adaptatif : le balayage LiDAR peut ne pas couvrir la totalité de la scène, en particulier en mode sans bordure. environnements extérieurs. Il est donc nécessaire d'effectuer un contrôle adaptatif pour densifier la carte gaussienne au sein d'une unité de volume. La stratégie originale gère les gaussiennes avec de grands gradients à intervalles fixes, tandis qu'en mode incrémental, puisqu'elles n'ont souvent pas encore convergé, les gaussiennes récemment ajoutées peuvent être incorrectement clonées ou divisées en raison de leurs gradients importants. La solution consiste à classer les distributions gaussiennes existantes en catégories stables et instables, et à densifier uniquement les distributions gaussiennes stables.
Expérience
Gaussian-LIC est un roman LiDAR - Système SLAM de champ de rayonnement de caméra inertielle, mis en œuvre un suivi très précis , double fonctionnalité avec reconstruction photoréaliste en ligne avec éclaboussures gaussiennes 3D. Les points LiDAR ombrés dans les coordonnées mondiales produits par une odométrie efficace de caméra inertielle LiDAR sont utilisés comme bons a priori pour aider à la construction incrémentielle de cartes gaussiennes avec une généralisation nettement meilleure dans les scènes intérieures et extérieures.
Possibilité d'amélioration :Essayez de supprimer les distributions gaussiennes inutiles dans la carte.
- Prend en charge divers lidar, essayant actuellement uniquement d'utiliser le lidar à semi-conducteurs.
- L'exposition automatique et le flou de mouvement de l'appareil photo affectent la qualité visuelle des cartes réalistes.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Samsung a officiellement lancé la version nationale du Samsung Galaxy Ring le 17 juillet, au prix de 2 999 yuans. Le vrai téléphone du Galaxy Ring est en réalité la version 2024 de "WowAwesome, c'est mon moment exclusif". C'est le produit électronique qui nous fait sentir le plus frais ces dernières années (même si cela ressemble à un drapeau) ces dernières années. (Sur la photo, les anneaux à gauche et à droite sont Galaxy Ring↑) Spécifications du Samsung Galaxy Ring (données du site officiel de la Banque de Chine) : système ZephyrRTOS, stockage 8 Mo étanche 10 ATM + capacité de la batterie 18 mAh à 23,5 ; mAh (différentes tailles

Récemment, de nouvelles nouvelles concernant l'iPhone SE4 ont été révélées sur Weibo. On dit que le processus de couverture arrière de l'iPhone SE4 est exactement le même que celui de la version standard de l'iPhone 16. En d'autres termes, l'iPhone SE4 utilisera un panneau arrière en verre et un. écran droit et conception à bord droit. Il est rapporté que l’iPhone SE4 sortira avant septembre de cette année, ce qui signifie qu’il sera probablement dévoilé en même temps que l’iPhone 16. 1. D'après les rendus exposés, le design avant de l'iPhone SE4 est similaire à celui de l'iPhone 13, avec une caméra frontale et un capteur FaceID sur l'écran à encoche. L'arrière utilise une disposition similaire à celle de l'iPhoneXr, mais il n'a qu'un seul appareil photo et n'a pas de module de caméra global.

L'article d'hier ne mentionnait pas la "taille du capteur". Je ne m'attendais pas à ce que les gens aient autant de malentendus... Combien fait 1 pouce ? En raison de certains problèmes historiques*, qu'il s'agisse d'un appareil photo ou d'un téléphone portable, « 1 pouce » dans la diagonale du capteur n'est pas 25,4 mm. *En ce qui concerne les tubes à vide, il n’y a pas d’expansion ici. C’est un peu comme la crosse d’un cheval qui décide de la largeur d’une voie ferrée. Afin d'éviter tout malentendu, l'écriture la plus rigoureuse est « Type 1.0 » ou « Type1.0 ». De plus, lorsque la taille du capteur est inférieure au type 1/2, type 1 = 18 mm et lorsque la taille du capteur est supérieure ou égale au type 1/2, type 1 = ;

L'étalonnage des caméras et du lidar constitue un travail de base crucial dans de nombreuses tâches. La précision de l'étalonnage affecte directement la limite supérieure de l'effet de la fusion ultérieure des solutions. Étant donné que de nombreuses entreprises de conduite autonome et de robotique investissent beaucoup de main-d'œuvre et de ressources matérielles pour améliorer continuellement la précision de l'étalonnage, nous allons vous présenter aujourd'hui quelques boîtes à outils d'étalonnage Caméra-Lidar courantes, et nous vous recommandons de les collecter ! 1.Libcbdetect détecte plusieurs damiers en une seule fois : https://www.cvlibs.net/software/libcbdetect/L'algorithme écrit à l'aide de MATLAB peut automatiquement extraire les points d'angle et les rendre précis au niveau du sous-pixel, et combiner ces points d'angle en damier rectangulaire. Il faudrait compter

Les AirPods Pro sont dotés de fonctionnalités intéressantes telles que la suppression du bruit et le mode transparence avec un design intra-auriculaire. Pour basculer entre ces fonctionnalités et d’autres, les capteurs de force des tiges AirPods Pro (et AirPods 3) offrent un contrôle facile. Lisez la suite pour savoir comment modifier les commandes des AirPods, notamment la vitesse d'appui, la durée d'appui, ce que font les capteurs de force gauche et droit, et bien plus encore. Les AirPods générations 1 et 2 utilisent une double pression sur les écouteurs pour le contrôle. Mais les AirPods Pro et AirPods 3 utilisent des capteurs de pression intégrés à la tige de chaque écouteur. Nous aborderons trois façons de basculer entre la réduction du bruit, la transparence et la désactivation, ainsi que la personnalisation du capteur de force.

Lorsqu'ils discutent de la fonction appareil photo des téléphones Android, la plupart des utilisateurs lui donnent des commentaires positifs. Par rapport aux téléphones Apple, les utilisateurs pensent généralement que les téléphones Android ont de meilleures performances en matière d'appareil photo. Cette opinion n’est pas sans fondement et les raisons pratiques sont évidentes. Les téléphones Android haut de gamme présentent de plus grands avantages concurrentiels en termes de configuration matérielle, notamment en termes de capteurs de caméra. De nombreux téléphones Android haut de gamme utilisent les derniers capteurs d'appareil photo haut de gamme, qui sont souvent plus remarquables que les iPhones commercialisés au même moment en termes de nombre de pixels, de taille d'ouverture et de capacités de zoom optique. Cet avantage permet aux téléphones Android de fournir des effets d'imagerie de meilleure qualité lors de la prise de photos et de l'enregistrement de vidéos, répondant ainsi aux besoins des utilisateurs en matière de photographie et de vidéographie. Par conséquent, l’avantage concurrentiel de la configuration matérielle est devenu un facteur attractif pour les téléphones Android.

Le fabricant national Howe a lancé un nouveau capteur CMOS-OV50K40. Ce capteur est le premier capteur d’image pour smartphone au monde utilisant la technologie TheiaCel. Sa conception unique permet d’atteindre une plage dynamique proche du niveau de l’œil humain en une seule exposition. Le capteur OV50K40 a une résolution native de 50 millions de pixels et utilise une grande surface de base de 1/1,3 pouce, la surface de chaque pixel atteignant 1,2 microns. En outre, il prend également en charge la sortie pixel quatre-en-un, qui combine quatre pixels en un pour produire une image de 12,5 mégapixels, apportant ainsi une photosensibilité plus puissante. La fréquence d'images du capteur prend en charge 120 images/seconde et 60 images/seconde (HDR) pour un écran B complet de 50 mégapixels.

La série Xiaomi Mi 15 devrait être officiellement lancée en octobre, et les noms de code de sa série complète ont été exposés dans la base de code MiCode des médias étrangers. Parmi eux, le produit phare Xiaomi Mi 15 Ultra porte le nom de code « Xuanyuan » (qui signifie « Xuanyuan »). Ce nom vient de l'Empereur Jaune dans la mythologie chinoise, qui symbolise la noblesse. Le Xiaomi 15 porte le nom de code « Dada », tandis que le Xiaomi 15Pro s'appelle « Haotian » (qui signifie « Haotian »). Le nom de code interne du Xiaomi Mi 15S Pro est « dijun », qui fait allusion à l'empereur Jun, le dieu créateur du « Classique des montagnes et des mers ». Couvertures de la série Xiaomi 15Ultra
