Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers-KI-php.cn

Inhaltsverzeichnis

Einführung

Methodeneinführung

Trägheitsbewegungserfassung

Kameraverfolgung

Mapping- und Schleifenschlusserkennung

Vergleich mit SLAM

Zusammenfassung

Heim

Technologie-Peripheriegeräte

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

王林

May 17, 2023 pm 09:16 PM

ai 技术

Dieser Artikel versucht, die „Augen“ der Trägheitsbewegungserfassung zu öffnen. Durch das Tragen einer zusätzlichen Handykamera erhält unser Algorithmus „Vision“. Es kann Umgebungsinformationen erfassen und gleichzeitig menschliche Bewegungen erfassen, wodurch eine präzise Positionierung des menschlichen Körpers erreicht wird. Diese Forschung stammt vom Team von Xu Feng an der Tsinghua-Universität und wurde von SIGGRAPH2023, der führenden internationalen Konferenz im Bereich Computergrafik, angenommen.

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Papieradresse: https://arxiv.org/abs/2305.01599
Projekthomepage: https://xinyu-yi.github.io/EgoLocate/
Open-Source-Code: https://github.com/Xinyu-Yi/EgoLocate

Einführung

Mit der Entwicklung der Computertechnologie sind die Wahrnehmung des menschlichen Körpers und der Umgebung zu zwei unverzichtbaren Bestandteilen moderner intelligenter Anwendungen geworden. Die Technologie zur Erfassung des menschlichen Körpers kann Mensch-Computer-Interaktion, intelligente medizinische Versorgung, Spiele und andere Anwendungen realisieren, indem sie Bewegungen und Aktionen des menschlichen Körpers erfasst. Mit der Umgebungssensorik können durch die Rekonstruktion von Szenenmodellen Anwendungen wie dreidimensionale Rekonstruktion, Szenenanalyse und intelligente Navigation realisiert werden. Die beiden Aufgaben sind voneinander abhängig, werden aber von den meisten im In- und Ausland vorhandenen Technologien unabhängig voneinander gelöst. Das Forschungsteam ist davon überzeugt, dass die kombinierte Wahrnehmung menschlicher Bewegung und Umwelt für Szenarien, in denen Menschen mit der Umwelt interagieren, sehr wichtig ist. Erstens kann die gleichzeitige Erfassung des menschlichen Körpers und der Umwelt die Effizienz und Sicherheit der menschlichen Interaktion mit der Umwelt verbessern. Bei selbstfahrenden Autos beispielsweise kann die gleichzeitige Erfassung des Verhaltens des Fahrers und der Umgebung die Sicherheit und den reibungslosen Fahrbetrieb besser gewährleisten. Zweitens kann durch die gleichzeitige Wahrnehmung des menschlichen Körpers und der Umgebung ein höheres Maß an Mensch-Computer-Interaktion erreicht werden. Beispielsweise kann in der virtuellen Realität und der erweiterten Realität durch die gleichzeitige Wahrnehmung der Aktionen des Benutzers und der Umgebung ein immersiveres Erlebnis erzielt werden . Daher kann uns die gleichzeitige Wahrnehmung des menschlichen Körpers und der Umwelt eine effizientere, sicherere und intelligentere Mensch-Computer-Interaktion und ein Anwendungserlebnis in der Umwelt ermöglichen. Auf dieser Grundlage schlug Das Team von Bild in 1). Die Inertial Motion Capture (Mocap)-Technologie erforscht „interne“ Informationen wie Bewegungssignale des menschlichen Körpers, während die Simultaneous Localization and Mapping (SLAM)-Technologie hauptsächlich auf „externen“ Informationen, also der von der Kamera erfassten Umgebung, basiert. Ersteres hat eine gute Stabilität, aber da es keine externe korrekte Referenz gibt, kommt es bei langfristigen Bewegungen zu einer globalen Positionsdrift. Letzteres kann die globale Position in der Szene mit hoher Genauigkeit schätzen, aber wenn die Umgebungsinformationen unzuverlässig sind (z. B keine Textur oder es liegt eine Okklusion vor), es ist leicht, die Verfolgung zu verlieren.

Daher kombiniert dieser Artikel effektiv diese beiden komplementären Technologien (Mocap und SLAM). Eine robuste und genaue menschliche Positionierung und Kartenrekonstruktion werden durch die Fusion menschlicher Bewegungsprioritäten und visueller Verfolgung auf mehreren Schlüsselalgorithmen erreicht.

Abbildung 1 Dieser Artikel schlägt eine Technologie zur gleichzeitigen Erfassung menschlicher Bewegungen und Umgebungskartierung vor

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Konkret trägt diese Studie 6 IMUs an menschlichen Gliedmaßen, Kopf und Rücken, eine monokulare Farbkamera am Kopf befestigt und schießt nach außen. Dieses Design ist von realem menschlichem Verhalten inspiriert: Wenn sich Menschen in einer neuen Umgebung befinden, beobachten sie die Umgebung mit ihren Augen, bestimmen ihre Position und planen so ihre Bewegungen innerhalb der Szene.

In unserem System fungiert die monokulare Kamera als menschliches Auge und liefert visuelle Signale für die Echtzeit-Szenenrekonstruktion und Selbstpositionierung für diese Technologie, während die IMU die Bewegung der menschlichen Gliedmaßen und des Kopfes misst. Dieses Setup ist mit vorhandener VR-Ausrüstung kompatibel und kann die Kamera im VR-Headset und eine zusätzliche IMU verwenden, um eine stabile, driftfreie Ganzkörper-Bewegungserfassung und Umgebungswahrnehmung durchzuführen.

Zum ersten Mal erreicht das gesamte System die gleichzeitige Erfassung menschlicher Bewegungen und die Rekonstruktion spärlicher Umgebungspunkte auf der Grundlage von nur 6 IMUs und 1 Kamera. Die Laufgeschwindigkeit erreicht 60 fps auf der CPU und die Genauigkeit übertrifft die fortschrittlichsten Technologien in beiden Bereichen zur gleichen Zeit.

Echtzeitbeispiele dieses Systems sind in Abbildung 2 und Abbildung 3 dargestellt.

Abbildung 2 Bei der komplexen Bewegung von 70 Metern verfolgt dieses System genau die Position des menschlichen Körpers und erfasst die Bewegungen des menschlichen Körpers ohne offensichtliche Positionsabweichung.

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Abbildung 3 Ein Echtzeitbeispiel dieses Systems, das gleichzeitig menschliche Bewegungen und spärliche Szenenpunkte rekonstruiert.

Methodeneinführung

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Abbildung 4 Gesamter Methodenablauf

Die Aufgabe des Systems besteht darin, Echtzeitinformationen aus den Orientierungs- und Beschleunigungsmessungen der 6 IMU-Sensoren zu gewinnen und die von der Kamera aufgenommenen Farbbilder rekonstruieren menschliche Bewegungen, spärliche Punktwolken dreidimensionaler Szenen und lokalisieren die Positionen von Personen in der Szene. Wir entwerfen ein tief gekoppeltes Framework, um die komplementären Vorteile der Sparse-Inertial-Motion-Capture- und SLAM-Technologien voll auszuschöpfen. In diesem Rahmen werden menschliche Bewegungsprioritäten mit mehreren Schlüsselkomponenten von SLAM kombiniert, und die Positionierungsergebnisse von SLAM werden auch an die menschliche Bewegungserfassung zurückgekoppelt. Wie in Abbildung 4 dargestellt, unterteilen wir das System entsprechend den Funktionen in vier Module: Trägheitsbewegungserfassungsmodul (Inertial Motion Capture), Kameraverfolgungsmodul (Camera Tracking), Mapping und Closed-Loop-Erkennungsmodul (Mapping). & Loop Closing) und das Aktualisierungsmodul für menschliche Bewegungen (Body Translation Updater). Jedes Modul wird im Folgenden vorgestellt.

Trägheitsbewegungserfassung

Das Modul zur Trägheitsbewegungserfassung schätzt die Körperhaltung und Bewegung des Menschen anhand von 6 IMU-Messungen. Das Design dieses Moduls basiert auf unserer vorherigen PIP-Arbeit [1], aber in dieser Arbeit gehen wir nicht mehr davon aus, dass es sich bei der Szene um einen flachen Boden handelt, sondern erwägen die Erfassung freier menschlicher Bewegungen im 3D-Raum. Zu diesem Zweck werden in diesem Artikel adaptive Änderungen am PIP-Optimierungsalgorithmus vorgenommen.

Konkret sagt dieses Modul zunächst die Rotation, Geschwindigkeit, Fuß- und Bodenkontaktwahrscheinlichkeit menschlicher Gelenke aus IMU-Messungen über ein mehrstufiges rekurrentes neuronales Netzwerk voraus. Der von PIP vorgeschlagene Dual-PD-Regler wird verwendet, um die optimale Steuerung der Winkelbeschleunigung Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers und der Linearbeschleunigung menschlicher Gelenke zu lösen. Anschließend optimiert dieses Modul die Haltungsbeschleunigung des menschlichen Körpers, sodass er die vom PD-Controller vorgegebene Beschleunigung erreichen und gleichzeitig die Kontaktbeschränkung C erfüllen kann:

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

wo J ist die gemeinsame Jacobi-Matrix, Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers ist die lineare Geschwindigkeit des Fußes in Kontakt mit dem Boden und die Einschränkung C erfordert, dass die Geschwindigkeit des Fußes in Kontakt mit dem Boden klein sein sollte (Nr es kommt zum Gleiten). Um dieses quadratische Programmierproblem zu lösen, lesen Sie bitte PIP[1]. Nachdem die Haltung und Bewegung des menschlichen Körpers durch Integration der Haltungsbeschleunigung ermittelt wurde, kann die Haltung der an den menschlichen Körper gebundenen Kamera für nachfolgende Module ermittelt werden.

Kameraverfolgung

Das Kameraverfolgungsmodul verwendet die vom Trägheitsbewegungserfassungsmodul vorgegebene anfängliche Kameraposition und das von der Kamera erfasste Farbbild als Eingabe und verwendet die Bildinformationen, um die Kameraposition zu optimieren und Positionsabweichungen zu vermeiden. Konkret basiert dieses Modul auf ORB-SLAM3 [2]. Es extrahiert zunächst die ORB-Merkmalspunkte des Bildes und führt unter Verwendung der Merkmalsähnlichkeit einen Merkmalsabgleich mit den rekonstruierten spärlichen Kartenpunkten durch, um passende 2D-3D-Punkte zu erhalten Paare und optimieren Sie dann die Kameraposition durch Optimierung des Reprojektionsfehlers. Es ist zu beachten, dass die Optimierung nur des Reprojektionsfehlers durch falsche Übereinstimmungen beeinträchtigt werden kann, was zu schlechten Ergebnissen bei der Optimierung der Kameraposition führt. Daher Dieser Artikel integriert Vorabinformationen zur menschlichen Bewegung in die Kameraverfolgungsoptimierung, verwendet Trägheitsbewegungserfassungsergebnisse als Einschränkungen, begrenzt den Optimierungsprozess von Neuprojektionsfehlern und erkennt und beseitigt rechtzeitig fehlerhafte Feature-Point-Map-Punktzuordnung.

Merken Sie sich die Weltkoordinaten des Kartenpunkts als Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers und die Pixelkoordinaten der passenden 2D-Bildmerkmalspunkte als , was alle übereinstimmenden Beziehungen anzeigt. Lassen Sie

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

die anfängliche Kameraposition vor der Optimierung darstellen, dann optimiert dieses Modul die Kameraposition R,t:

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Darunter ist Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers robuster Huber Kernelfunktion, ordnet dreidimensionale Drehung dem dreidimensionalen Vektorraum zu, ist die perspektivische Projektionsoperation, Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers steuert die Koeffizienten der Rotations- und Übersetzungsterme der Bewegungserfassung. Die Optimierung wurde dreimal durchgeführt, wobei jedes Mal 2D-3D-Übereinstimmungen basierend auf dem Reprojektionsfehler als richtig oder falsch klassifiziert wurden. Bei der nächsten Optimierung wurden nur korrekte Übereinstimmungen verwendet und falsche Übereinstimmungen gelöscht. Mit starkem Vorwissen, das durch Bewegungserfassungsbeschränkungen bereitgestellt wird, kann dieser Algorithmus besser zwischen richtigen und falschen Übereinstimmungen unterscheiden und dadurch die Genauigkeit der Kameraverfolgung verbessern. Nach dem Lösen der Kameraposition extrahiert dieses Modul die Anzahl der korrekt übereinstimmenden Kartenpunktpaare und verwendet sie als Glaubwürdigkeit der Kameraposition.

Mapping- und Schleifenschlusserkennung

Das Mapping- und Schleifenschlusserkennungsmodul verwendet Schlüsselbilder, um spärliche Kartenpunkte zu rekonstruieren und zu erkennen, ob der menschliche Körper den Ort erreicht hat, an dem er sich aufgehalten hat, um den kumulativen Fehler zu korrigieren. Während des Kartierungsprozesses verwenden wir die bewegungserfassungsbeschränkte Bündelanpassung (Bundle Adjustment, BA), um gleichzeitig spärliche Kartenpunktpositionen und Keyframe-Kamerapositionen zu optimieren und Kartenpunktsicherheit einzuführen, um Bewegungserfassungsbeschränkungen und die relative Stärke der Neuprojektion dynamisch auszugleichen Fehlerterm, wodurch die Genauigkeit der Ergebnisse verbessert wird. Wenn in der menschlichen Bewegung ein geschlossener Regelkreis auftritt, wird eine durch Bewegungserfassung unterstützte Pose-Graph-Optimierung durchgeführt, um den Fehler im geschlossenen Regelkreis zu korrigieren . Schließlich werden die optimierten Punktpositionen und Schlüsselbildpositionen der spärlichen Karte erhalten, die zum Ausführen des Algorithmus im nächsten Bild verwendet werden.

Konkret berechnet dieses Modul zunächst das Konfidenzniveau basierend auf der Beobachtung des Kartenpunkts, das für die anschließende BA-Optimierung verwendet wird. Wie in Abbildung 5 unten dargestellt, berechnet dieses Modul entsprechend der Position des Schlüsselrahmens des beobachteten Kartenpunkts die Grundlinienlänge bi des Schlüsselrahmens und den Beobachtungswinkel θi, um die Konfidenz des Kartenpunkts i zu bestimmen #🎜🎜 # Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers , wobei k der Kontrollkoeffizient ist.

#🎜🎜. # Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Bild 5 (a) Berechnung der Kartenpunktzuverlässigkeit. (b) Bei gleicher Basislinienlänge b1=b2 kann ein größerer Beobachtungswinkel (blau) der Störung der Kameraposition besser widerstehen, was zu kleineren Kartenpunktpositionsfehlern führt (e1

Anschließend werden die letzten 20 Keyframe-Kamerapositionen und ihre beobachteten Kartenpunkte gleichzeitig optimiert. Andere Keyframe-Posen, die diese Kartenpunkte sehen, werden während der Optimierung behoben. Bezeichnen Sie die Menge aller optimierbaren Schlüsselbilder als K0, die Menge aller festen Schlüsselbilder als Kf und die Menge der durch Schlüsselbild j gemessenen Kartenpunkte als Xj.

记

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

gibt die Keyframe-Ausrichtung und die dreidimensionale Position an, die optimiert werden müssen,

#🎜 🎜##🎜 🎜#

stellt die Position des Kartenpunkts dar. Dann ist die Strahlanpassungsoptimierung der Bewegungserfassungsbeschränkung wie folgt definiert: #🎜🎜 ## 🎜🎜 ## 🎜🎜#unter ihnen,#🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 # Stellt den vorherigen Schlüsselrahmen von Schlüsselrahmen j dar. Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

ist eine Bewegung Erfassen Sie den Einschränkungskoeffizienten des Termes. Diese Optimierung erfordert, dass der Neuprojektionsfehler der Kartenpunkte klein ist und die Drehung und relative Position jedes Schlüsselbilds den Ergebnissen der Bewegungserfassung ähneln sollte. Die Konfidenz der Kartenpunkte Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers ci

bestimmt dynamisch Bewegungserfassungsbeschränkungen Die relative Gewichtsbeziehung zwischen Elementen und Kartenpunkt-Neuprojektionselementen:

Für Bereiche, die nicht vollständig rekonstruiert sind, ist es umgekehrt wahrscheinlicher, dass das System an die Ergebnisse der Bewegungserfassung glaubt Wenn ein Bereich wiederholt beobachtet wird, vertraut das System stärker auf die visuelle Verfolgung. Das optimierte Faktordiagramm ist in Abbildung 6 unten dargestellt.

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

# 🎜 🎜# Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Abbildung 6 Optimierungsfaktordiagrammdarstellung der Strahlanpassungsmethode für Bewegungserfassungsbeschränkungen. Wenn der geschlossene Regelkreis der Flugbahn erkannt wird, führt das System eine geschlossene Regelkreisoptimierung durch. Basierend auf ORB-SLAM3[2] ist die Menge der Scheitelpunkte im Posendiagramm F und die Menge der Kanten ist C. Dann ist die Pose-Graph-Optimierung von Motion-Capture-Einschränkungen wie folgt definiert:

Unter ihnen ist Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers die Pose von Schlüsselbild j, ist die Pose Karte Optimieren Sie vorher die relative Pose zwischen den Schlüsselbildern i und j. wird Die Pose wird einem sechsdimensionalen Vektorraum zugeordnet und Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers ist der relative Koeffizient der Bewegungserfassungsbeschränkung. Diese Optimierung wird durch die vorherige Bewegungserfassung gesteuert und verteilt den Closed-Loop-Fehler auf jeden Keyframe. Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers Human Motion Update

Das Human Motion Update-Modul wird mithilfe der Kameraverfolgung optimiert Modul Kameraposition und Glaubwürdigkeit, aktualisieren Sie die globale Position des menschlichen Körpers, die vom Bewegungserfassungsmodul bereitgestellt wird. Dieses Modul wird mithilfe des Vorhersage-Korrektur-Algorithmus des Kalman-Filters implementiert. Unter anderem bietet das Bewegungserfassungsmodul eine konstante Varianz der Bewegungsbeschleunigung des menschlichen Körpers, die zur Vorhersage der globalen Position des menschlichen Körpers (vorherige Verteilung) verwendet werden kann, während das Kameraverfolgungsmodul Beobachtungen und Zuverlässigkeit der Kameraposition bereitstellt Korrigieren Sie die globale Position des menschlichen Körpers (hintere Verteilung). Darunter wird die Kovarianzmatrix der Kamerapositionsbeobachtungen

anhand der Anzahl übereinstimmender Kartenpunkte ungefähr wie folgt berechnet:

#🎜 ## # 🎜 🎜 # Vermeiden Sie den Teiler durch 0 für Dezimalzahlen. Das heißt, je größer die Anzahl erfolgreich abgeglichener Kartenpunkte bei der Kameraverfolgung ist, desto geringer ist die Varianz der Kamerapositionsbeobachtungen. Der Kalman-Filter-Algorithmus wird verwendet, um schließlich die globale Position des menschlichen Körpers vorherzusagen. Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Eine ausführlichere Methodeneinführung und Formelableitung finden Sie im Originaltext und im Anhang des Papiers.

Experiment Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Vergleich Mocap

Diese Methode löst hauptsächlich die globale Position bei der Erfassung spärlicher Trägheitsbewegungen (Mocap). Um das Driftproblem zu lösen, wird der globale Positionsfehler des menschlichen Körpers als Haupttestindikator ausgewählt. Der Vergleich der quantitativen Testergebnisse mit den SOTA-Mocap-Methoden TransPose[3], TIP[4] und PIP[1] an zwei öffentlichen Datensätzen, TotalCapture und HPS, ist in Tabelle 1 unten dargestellt Abbildungen 7 und 8 unten zeigen. Es ist ersichtlich, dass die Methode in diesem Artikel frühere Methoden zur Trägheitsbewegungserfassung hinsichtlich der globalen Positionierungsgenauigkeit deutlich übertrifft (bei TotalCapture und HPS um 41 % bzw. 38 % erhöht) und die Flugbahn die höchste Ähnlichkeit mit dem wahren Wert aufweist. Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Tabelle 1 und Trägheitsbewegungserfassung Quantitativer Vergleich globaler Positionsfehler von Arbeitsplätzen (Einheit: Meter). Der TotalCapture-Datensatz wird nach Aktionen klassifiziert, und der HPS-Datensatz wird nach Szenen klassifiziert. Für unsere Arbeit führen wir neun Tests durch und geben den Median und die Standardabweichung an.

Abbildung 7 Qualitativer Vergleich des globalen Positionsfehlers mit der Trägheitsbewegungserfassung. Der wahre Wert wird in Grün angezeigt und die Vorhersageergebnisse verschiedener Methoden werden in Blau angezeigt. Die Bewegungsbahn und die aktuelle Position des menschlichen Körpers (orangefarbene Punkte) werden in der Ecke jedes Bildes angezeigt.

Abbildung 8 Qualitativer Vergleich des globalen Positionsfehlers mit der Trägheitsbewegungserfassung (Video). Der wahre Wert wird in Grün angezeigt, die Methode in diesem Artikel ist in Weiß dargestellt und die Methoden früherer Arbeiten verwenden andere unterschiedliche Farben (siehe Legende).

Vergleich mit SLAM

In diesem Artikel werden die monokularen und monokularen Trägheitsversionen der SOTA-SLAM-Arbeit ORB-SLAM3 [2] aus den beiden Perspektiven Positionierungsgenauigkeit und Kartenrekonstruktionsgenauigkeit verglichen. Die quantitativen Vergleichsergebnisse der Positionierungsgenauigkeit sind in Tabelle 2 dargestellt. Die quantitativen Vergleichsergebnisse der Kartenrekonstruktionsgenauigkeit sind in Tabelle 3 und die qualitativen Vergleichsergebnisse in Abbildung 9 dargestellt. Es ist ersichtlich, dass die Methode in diesem Artikel im Vergleich zu SLAM die Robustheit des Systems, die Positionierungsgenauigkeit und die Genauigkeit der Kartenrekonstruktion erheblich verbessert.

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Tabelle 2 Quantitativer Vergleich von Positionierungsfehlern bei SLAM-Arbeit (Fehlereinheit: Meter). M/MI repräsentiert jeweils die monokulare/monokulare Trägheitsversion von ORB-SLAM3 und On/Off repräsentiert die Echtzeit- und Offline-Ergebnisse von SLAM. Da SLAM häufig das Tracking verliert, geben wir den durchschnittlichen Positionierungsfehler für die gesamte Sequenz (vollständig) und erfolgreich verfolgte Frames (Tracked) für SLAM an. Bei dieser Methode gibt es keinen Tracking-Verlust, sodass wir die Ergebnisse der gesamten Sequenz melden. Jede Methode wurde neunmal getestet und der Median und die Standardabweichung wurden angegeben. Bei Fehlern bei erfolgreich verfolgten Frames geben wir zusätzlich den Prozentsatz des Erfolgs an. Wenn eine Methode mehrmals fehlschlägt, markieren wir sie als fehlgeschlagen (angezeigt durch „-“).

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Tabelle 3 Quantitativer Vergleich von Kartenrekonstruktionsfehlern mit SLAM-Arbeit (Fehlereinheit: Meter). M/MI repräsentieren jeweils die monokulare/monokulare Trägheitsversion von ORB-SLAM3. Für drei verschiedene Szenen (Büro, Außenbereich, Fabrik) testen wir den durchschnittlichen Fehler aller rekonstruierten 3D-Kartenpunkte aus der Oberflächengeometrie der Szene. Jede Methode wurde neunmal getestet und der Median und die Standardabweichung wurden angegeben. Wenn eine Methode mehrmals fehlschlägt, markieren wir sie als fehlgeschlagen (gekennzeichnet durch „-“).

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Abbildung 9 Qualitativer Vergleich von Kartenrekonstruktionsfehlern mit SLAM-Arbeit. Wir zeigen Szenenpunkte, die mit verschiedenen Methoden rekonstruiert wurden, wobei die Farbe den Fehler für jeden Punkt anzeigt.

Darüber hinaus verbessert dieses System die Robustheit gegenüber visuellem Tracking-Verlust erheblich, indem es menschliche Bewegungen vorab einführt. Wenn die visuellen Funktionen schlecht sind, kann dieses System menschliche Bewegungsvorgaben nutzen, um die Verfolgung fortzusetzen, ohne die Verfolgung zu verlieren und wie bei anderen SLAM-Systemen neue Karten zurückzusetzen oder zu erstellen. Wie in Abbildung 10 unten dargestellt.

Sechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers

Abbildung 10 Vergleich der Okklusionsrobustheit mit SLAM-Arbeit. Die Ground-Truth-Trajektorienreferenz wird in der oberen rechten Ecke angezeigt. Aufgrund der Zufälligkeit der SLAM-Initialisierung sind das globale Koordinatensystem und der Zeitstempel nicht vollständig aufeinander abgestimmt.

Weitere experimentelle Ergebnisse finden Sie im Originaltext des Papiers, auf der Projekthomepage und im Papiervideo.

Zusammenfassung

Dieses Papier schlägt die erste Arbeit vor, die Trägheits-Mocap und SLAM kombiniert, um eine gleichzeitige Erfassung, Positionierung und Kartierung menschlicher Bewegungen in Echtzeit zu erreichen. Das System ist leicht genug, um nur einen spärlichen Satz an Sensoren zu benötigen, die der menschliche Körper trägt, darunter sechs Trägheitsmesseinheiten und eine Mobiltelefonkamera. Für die Online-Verfolgung werden Mocap und SLAM durch eingeschränkte Optimierung und Kalman-Filtertechniken zusammengeführt, um eine genauere menschliche Positionierung zu erreichen. Bei der Back-End-Optimierung werden Positionierungs- und Kartierungsfehler weiter reduziert, indem die menschliche Bewegung vorab in die Strahlanpassungsoptimierung und die Closed-Loop-Optimierung im SLAM integriert wird.

Diese Forschung zielt darauf ab, die Wahrnehmung des menschlichen Körpers mit der Wahrnehmung der Umwelt zu integrieren. Obwohl sich diese Arbeit hauptsächlich auf Lokalisierungsaspekte konzentriert, glauben wir, dass diese Arbeit einen ersten Schritt in Richtung gemeinsamer Bewegungserfassung und feinkörniger Umgebungswahrnehmung und -rekonstruktion darstellt.

Das obige ist der detaillierte Inhalt vonSechs Trägheitssensoren und ein Mobiltelefon ermöglichen die Erfassung, Positionierung und Rekonstruktion der Umgebungsbewegung des menschlichen Körpers. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Wie man alles in Myrise freischaltet

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7465

CakePHP-Tutorial

1376

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

So stellen Sie die Zeitüberschreitung von Vue Axios fest Apr 07, 2025 pm 10:03 PM

Um die Zeitüberschreitung für Vue Axios festzulegen, können wir eine Axios -Instanz erstellen und die Zeitleitungsoption angeben: in globalen Einstellungen: vue.Prototyp. $ Axios = axios.create ({Timeout: 5000}); In einer einzigen Anfrage: this. $ axios.get ('/api/user', {timeout: 10000}).

So verwenden Sie MySQL nach der Installation Apr 08, 2025 am 11:48 AM

Der Artikel führt den Betrieb der MySQL -Datenbank vor. Zunächst müssen Sie einen MySQL -Client wie MySQLworkBench oder Befehlszeilen -Client installieren. 1. Verwenden Sie den Befehl mySQL-uroot-P, um eine Verbindung zum Server herzustellen und sich mit dem Stammkonto-Passwort anzumelden. 2. Verwenden Sie die Erstellung von Createdatabase, um eine Datenbank zu erstellen, und verwenden Sie eine Datenbank aus. 3.. Verwenden Sie CreateTable, um eine Tabelle zu erstellen, Felder und Datentypen zu definieren. 4. Verwenden Sie InsertInto, um Daten einzulegen, Daten abzufragen, Daten nach Aktualisierung zu aktualisieren und Daten nach Löschen zu löschen. Nur indem Sie diese Schritte beherrschen, lernen, mit gemeinsamen Problemen umzugehen und die Datenbankleistung zu optimieren, können Sie MySQL effizient verwenden.

Wie man MySQL löst, kann nicht gestartet werden Apr 08, 2025 pm 02:21 PM

Es gibt viele Gründe, warum MySQL Startup fehlschlägt und durch Überprüfung des Fehlerprotokolls diagnostiziert werden kann. Zu den allgemeinen Ursachen gehören Portkonflikte (prüfen Portbelegung und Änderung der Konfiguration), Berechtigungsprobleme (Überprüfen Sie den Dienst Ausführen von Benutzerberechtigungen), Konfigurationsdateifehler (Überprüfung der Parametereinstellungen), Datenverzeichniskorruption (Wiederherstellung von Daten oder Wiederaufbautabellenraum), InnoDB-Tabellenraumprobleme (prüfen IBDATA1-Dateien), Plug-in-Ladeversagen (Überprüfen Sie Fehlerprotokolle). Wenn Sie Probleme lösen, sollten Sie sie anhand des Fehlerprotokolls analysieren, die Hauptursache des Problems finden und die Gewohnheit entwickeln, Daten regelmäßig zu unterstützen, um Probleme zu verhindern und zu lösen.

Laravels Geospatial: Optimierung interaktiver Karten und großen Datenmengen Apr 08, 2025 pm 12:24 PM

Verarbeiten Sie 7 Millionen Aufzeichnungen effizient und erstellen Sie interaktive Karten mit Geospatial -Technologie. In diesem Artikel wird untersucht, wie über 7 Millionen Datensätze mithilfe von Laravel und MySQL effizient verarbeitet und in interaktive Kartenvisualisierungen umgewandelt werden können. Erstes Herausforderungsprojektanforderungen: Mit 7 Millionen Datensätzen in der MySQL -Datenbank wertvolle Erkenntnisse extrahieren. Viele Menschen erwägen zunächst Programmiersprachen, aber ignorieren die Datenbank selbst: Kann sie den Anforderungen erfüllen? Ist Datenmigration oder strukturelle Anpassung erforderlich? Kann MySQL einer so großen Datenbelastung standhalten? Voranalyse: Schlüsselfilter und Eigenschaften müssen identifiziert werden. Nach der Analyse wurde festgestellt, dass nur wenige Attribute mit der Lösung zusammenhängen. Wir haben die Machbarkeit des Filters überprüft und einige Einschränkungen festgelegt, um die Suche zu optimieren. Kartensuche basierend auf der Stadt

Remote Senior Backend Engineers (Plattformen) benötigen Kreise Apr 08, 2025 pm 12:27 PM

Remote Senior Backend Engineer Job Vacant Company: Circle Standort: Remote-Büro-Jobtyp: Vollzeitgehalt: 130.000 bis 140.000 US-Dollar Stellenbeschreibung Nehmen Sie an der Forschung und Entwicklung von Mobilfunkanwendungen und öffentlichen API-bezogenen Funktionen, die den gesamten Lebenszyklus der Softwareentwicklung abdecken. Die Hauptaufgaben erledigen die Entwicklungsarbeit unabhängig von RubyonRails und arbeiten mit dem Front-End-Team von React/Redux/Relay zusammen. Erstellen Sie die Kernfunktionalität und -verbesserungen für Webanwendungen und arbeiten Sie eng mit Designer und Führung während des gesamten funktionalen Designprozesses zusammen. Fördern Sie positive Entwicklungsprozesse und priorisieren Sie die Iterationsgeschwindigkeit. Erfordert mehr als 6 Jahre komplexes Backend für Webanwendungen

Kann MySQL JSON zurückgeben? Apr 08, 2025 pm 03:09 PM

MySQL kann JSON -Daten zurückgeben. Die JSON_EXTRACT -Funktion extrahiert Feldwerte. Über komplexe Abfragen sollten Sie die Where -Klausel verwenden, um JSON -Daten zu filtern, aber auf die Leistungsauswirkungen achten. Die Unterstützung von MySQL für JSON nimmt ständig zu, und es wird empfohlen, auf die neuesten Versionen und Funktionen zu achten.

So optimieren Sie die Datenbankleistung nach der MySQL -Installation Apr 08, 2025 am 11:36 AM

Die MySQL -Leistungsoptimierung muss von drei Aspekten beginnen: Installationskonfiguration, Indexierung und Abfrageoptimierung, Überwachung und Abstimmung. 1. Nach der Installation müssen Sie die my.cnf -Datei entsprechend der Serverkonfiguration anpassen, z. 2. Erstellen Sie einen geeigneten Index, um übermäßige Indizes zu vermeiden und Abfrageanweisungen zu optimieren, z. B. den Befehl Erklärung zur Analyse des Ausführungsplans; 3. Verwenden Sie das eigene Überwachungstool von MySQL (ShowProcessList, Showstatus), um die Datenbankgesundheit zu überwachen und die Datenbank regelmäßig zu sichern und zu organisieren. Nur durch kontinuierliche Optimierung dieser Schritte kann die Leistung der MySQL -Datenbank verbessert werden.

Wie optimieren Sie die MySQL-Leistung für Hochlastanwendungen? Apr 08, 2025 pm 06:03 PM

Die MySQL-Datenbankleistung Optimierungshandbuch In ressourcenintensiven Anwendungen spielt die MySQL-Datenbank eine entscheidende Rolle und ist für die Verwaltung massiver Transaktionen verantwortlich. Mit der Erweiterung der Anwendung werden jedoch die Datenbankleistung Engpässe häufig zu einer Einschränkung. In diesem Artikel werden eine Reihe effektiver Strategien zur Leistungsoptimierung von MySQL -Leistung untersucht, um sicherzustellen, dass Ihre Anwendung unter hohen Lasten effizient und reaktionsschnell bleibt. Wir werden tatsächliche Fälle kombinieren, um eingehende Schlüsseltechnologien wie Indexierung, Abfrageoptimierung, Datenbankdesign und Caching zu erklären. 1. Das Design der Datenbankarchitektur und die optimierte Datenbankarchitektur sind der Eckpfeiler der MySQL -Leistungsoptimierung. Hier sind einige Kernprinzipien: Die Auswahl des richtigen Datentyps und die Auswahl des kleinsten Datentyps, der den Anforderungen entspricht, kann nicht nur Speicherplatz speichern, sondern auch die Datenverarbeitungsgeschwindigkeit verbessern.

See all articles