Inhaltsverzeichnis
Thesis-Idee:
Netzwerkdesign:
Heim Technologie-Peripheriegeräte KI Neue Range View3D-Erkennungsidee: RangePerception

Neue Range View3D-Erkennungsidee: RangePerception

Dec 14, 2023 pm 04:57 PM
框架 3d

Titel neu geschrieben: Range Awareness: Taming LiDAR Range View for Efficient and Accurate 3D Object Detection

Bitte klicken Sie auf den folgenden Link, um das Papier anzusehen: https://openreview.net/pdf?id=9kFQEJSyCM

Autorenzugehörigkeit: Shanghai Artificial Geheimdienstlabor der Fudan-Universität Nach dem Umschreiben: Abteilung: Shanghai Artificial Intelligence Laboratory, Fudan University

新的Range View3D检测思路:RangePerception

Thesis-Idee:

Derzeit verwenden LiDAR-basierte 3D-Erkennungsmethoden hauptsächlich die Vogelperspektive (BEV) oder die Entfernungsansicht (RV) als Grundlage . BEV-Methoden basieren auf Voxelisierung und 3D-Faltung, was zu weniger effizienten Trainings- und Inferenzprozessen führt. Im Gegensatz dazu weist die RV-Methode aufgrund ihrer Kompaktheit und Kompatibilität mit 2D-Faltungen eine höhere Effizienz auf, ihre Leistung bleibt jedoch immer noch hinter der BEV-Methode zurück. Um die Leistungslücke zu schließen und gleichzeitig die Effizienz der RV-Methode beizubehalten, schlägt diese Studie ein effizientes und genaues RV-basiertes 3D-Objekterkennungs-Framework namens RangePerception vor. Durch sorgfältige Analyse identifiziert diese Studie zwei Hauptherausforderungen, die die Leistung vorhandener RV-Methoden behindern: 1) Es besteht eine natürliche Domänenlücke zwischen den in der Ausgabe verwendeten 3D-Weltkoordinaten und den in der Eingabe verwendeten 2D-Bereichsbildkoordinaten, was dazu führt eine Änderung der Entfernung Es wird schwierig, Informationen aus Bildern zu extrahieren; 2) Das ursprüngliche Entfernungsbild weist visuelle Beschädigungsprobleme auf, die sich auf die Erkennungsgenauigkeit von Zielen auswirken, die sich am Rand des Entfernungsbilds befinden. Um diesen Herausforderungen zu begegnen, werden in diesem Artikel zwei neuartige Algorithmen namens Range Aware Kernel (RAK) und Vision Restoration Module (VRM) vorgeschlagen, die den Informationsfluss der Entfernungsbilddarstellung und der Ergebnisse der Weltkoordinaten-3D-Erkennung erleichtern. Mit Hilfe von RAK und VRM verbessert RangePerception den durchschnittlichen L1/L2-AP um 3,25/4,18 gegenüber der bisherigen hochmodernen RV-Methode RangeDet auf Waymo Open Dataset. RangePerception ist die erste RV-basierte 3D-Erkennungsmethode, deren durchschnittlicher AP etwas höher ist und die Inferenzgeschwindigkeit 1,3-mal so hoch ist wie die von CenterPoint.

Netzwerkdesign:

demonstriert ein effizientes und genaues RV-basiertes 3D-Erkennungsframework namens RangePerception. Um die oben genannten Hauptherausforderungen zu bewältigen, werden zwei neuartige Algorithmen namens Range Aware Kernel (RAK) und Vision Restoration Module (VRM) vorgeschlagen und in das RangePerception-Framework integriert, die beide die Darstellung von Entfernungsbildern und den 3D-Informationsfluss von Testergebnissen in Weltkoordinaten erleichtern. Mit Hilfe von RAK und VRM erreicht unser RangePerception eine hochmoderne Leistung als auf Entfernungsansichten basierende 3D-Erkennungsmethode, indem es 73,62, 80,24 und 70,33 L1 3D AP auf WOD für Fahrzeuge, Fußgänger und Radfahrer liefert. Die Beiträge dieses Artikels sind wie folgt.

RangePerception Framework In diesem Artikel wird ein neuartiges leistungsstarkes 3D-Erkennungsframework namens RangePerception vorgestellt. RangePerception ist der erste RV-basierte 3D-Detektor, der einen durchschnittlichen L1/L2-AP von 74,73/69,17 bei WOD erreicht, was besser ist als der bisherige hochmoderne RV-basierte Detektor RangeDet, der einen durchschnittlichen L1/L2 hat AP von 71,48/64,99, was einer Verbesserung von 3,25/4,18 entspricht. RangePerception zeigt auch eine leicht überlegene Leistung im Vergleich zur weit verbreiteten BEV-basierten Methode CenterPoint [6], die einen durchschnittlichen L1/L2-AP von 74,25/68,04 erreicht. Bemerkenswert ist, dass die Inferenzgeschwindigkeit von RangePerception 1,3-mal schneller ist als die von CenterPoint, was beweist, dass es sich besser für den Echtzeiteinsatz in autonomen Fahrzeugen eignet.

Range Aware Kernel Der Range Aware Kernel (RAK) ist Teil des RangePerception-Feature-Extraktors und ein bahnbrechender Algorithmus, der auf RV-basierte Netzwerke zugeschnitten ist. RAK zerlegt den Entfernungsbildraum in mehrere Unterräume und überwindet das Problem der räumlichen Fehlausrichtung, indem Merkmale aus jedem Unterraum unabhängig extrahiert werden. Experimentelle Ergebnisse zeigen, dass RAK den durchschnittlichen L1/L2-AP um 5,75/5,99 verbessert, und das bei vernachlässigbarem Rechenaufwand.

Vision Restoration Module Um das Problem der Sehkorruption (Vision Corruption Issue) zu lösen, schlägt diese Forschung das Vision Restoration Module (VRM) vor. VRM erweitert das Aufnahmefeld des Backbone-Netzwerks durch die Wiederherstellung zuvor beschädigter Bereiche. VRM ist besonders hilfreich bei der Fahrzeugerkennung, wie im experimentellen Teil gezeigt.

新的Range View3D检测思路:RangePerception

Abbildung 2: Das RangePerception-Framework verwendet ein Entfernungsbild I als Eingabe und generiert dichte Vorhersagen. Um den Darstellungslerneffekt zu verbessern, integriert das Framework nacheinander VRM- und RAK-Module vor Range Backbone. Anschließend wird ein speziell entwickelter Redundancy Pruner verwendet, um Redundanz in tiefen Features zu beseitigen und so den Rechenaufwand für nachfolgende Region Proposal Network- und Nachbearbeitungsschichten zu reduzieren

Abbildung 1: (a-d) Beispielbilder des oberen LiDAR-Signals, dargestellt durch RV bzw. BEV. (e) Phänomene der räumlichen Fehlausrichtung. (f) Phänomene der Sehkorruption.

新的Range View3D检测思路:RangePerception

Abbildung 3: Der Range Aware Kernel zerlegt den Bereichsbildraum in mehrere Unterräume und überwindet das Problem der räumlichen Fehlausrichtung, indem er unabhängige Merkmale aus jedem Unterraum extrahiert.

新的Range View3D检测思路:RangePerception

新的Range View3D检测思路:RangePerception

Abbildung 5: Modul zur Wiederherstellung der Sehkraft. Durch Vordefinieren des Erholungswinkels δ konstruiert VRM einen erweiterten sphärischen Raum mit Azimutwinkeln θ ∈ [−δ, 2π + δ]. Dadurch wird das Problem der visuellen Verfälschung auf beiden Seiten des Bereichsbildes I gelöst, wodurch der Prozess der Merkmalsextraktion aus den Kanten von I erheblich vereinfacht wird. Experimentelle Ergebnisse: Ausrichtung und optische Schäden Rätsel. Durch die Einführung der RAK- und VRM-Technologie hat RangePerception hervorragende Erkennungsfähigkeiten für WOD unter Beweis gestellt und gleichzeitig sein effizientes und genaues praktisches Einsatzpotenzial unter Beweis gestellt .com/s/EJCl5kLxhHaa7lh98g2I6w

Das obige ist der detaillierte Inhalt vonNeue Range View3D-Erkennungsidee: RangePerception. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

So bewerten Sie die Kosteneffizienz der kommerziellen Unterstützung für Java-Frameworks So bewerten Sie die Kosteneffizienz der kommerziellen Unterstützung für Java-Frameworks Jun 05, 2024 pm 05:25 PM

Die Bewertung des Kosten-/Leistungsverhältnisses des kommerziellen Supports für ein Java-Framework umfasst die folgenden Schritte: Bestimmen Sie das erforderliche Maß an Sicherheit und Service-Level-Agreement-Garantien (SLA). Die Erfahrung und das Fachwissen des Forschungsunterstützungsteams. Erwägen Sie zusätzliche Services wie Upgrades, Fehlerbehebung und Leistungsoptimierung. Wägen Sie die Kosten für die Geschäftsunterstützung gegen Risikominderung und Effizienzsteigerung ab.

Wie wirken sich die Lightweight-Optionen von PHP-Frameworks auf die Anwendungsleistung aus? Wie wirken sich die Lightweight-Optionen von PHP-Frameworks auf die Anwendungsleistung aus? Jun 06, 2024 am 10:53 AM

Das leichte PHP-Framework verbessert die Anwendungsleistung durch geringe Größe und geringen Ressourcenverbrauch. Zu seinen Merkmalen gehören: geringe Größe, schneller Start, geringer Speicherverbrauch, verbesserte Reaktionsgeschwindigkeit und Durchsatz sowie reduzierter Ressourcenverbrauch. Praktischer Fall: SlimFramework erstellt eine REST-API, nur 500 KB, hohe Reaktionsfähigkeit und hoher Durchsatz

Wie ist die Lernkurve von PHP-Frameworks im Vergleich zu anderen Sprach-Frameworks? Wie ist die Lernkurve von PHP-Frameworks im Vergleich zu anderen Sprach-Frameworks? Jun 06, 2024 pm 12:41 PM

Die Lernkurve eines PHP-Frameworks hängt von Sprachkenntnissen, Framework-Komplexität, Dokumentationsqualität und Community-Unterstützung ab. Die Lernkurve von PHP-Frameworks ist im Vergleich zu Python-Frameworks höher und im Vergleich zu Ruby-Frameworks niedriger. Im Vergleich zu Java-Frameworks haben PHP-Frameworks eine moderate Lernkurve, aber eine kürzere Einstiegszeit.

Best Practices für die Dokumentation des Golang-Frameworks Best Practices für die Dokumentation des Golang-Frameworks Jun 04, 2024 pm 05:00 PM

Das Verfassen einer klaren und umfassenden Dokumentation ist für das Golang-Framework von entscheidender Bedeutung. Zu den Best Practices gehört die Befolgung eines etablierten Dokumentationsstils, beispielsweise des Go Coding Style Guide von Google. Verwenden Sie eine klare Organisationsstruktur, einschließlich Überschriften, Unterüberschriften und Listen, und sorgen Sie für eine Navigation. Bietet umfassende und genaue Informationen, einschließlich Leitfäden für den Einstieg, API-Referenzen und Konzepte. Verwenden Sie Codebeispiele, um Konzepte und Verwendung zu veranschaulichen. Halten Sie die Dokumentation auf dem neuesten Stand, verfolgen Sie Änderungen und dokumentieren Sie neue Funktionen. Stellen Sie Support und Community-Ressourcen wie GitHub-Probleme und Foren bereit. Erstellen Sie praktische Beispiele, beispielsweise eine API-Dokumentation.

Die RedMagic Tablet 3D Explorer Edition bietet eine brillenlose 3D-Anzeige Die RedMagic Tablet 3D Explorer Edition bietet eine brillenlose 3D-Anzeige Sep 06, 2024 am 06:45 AM

Die RedMagic Tablet 3D Explorer Edition wurde zusammen mit dem Gaming Tablet Pro auf den Markt gebracht. Während sich Letzteres jedoch eher an Gamer richtet, ist Ersteres eher auf Unterhaltung ausgerichtet. Das neue Android-Tablet verfügt über das, was das Unternehmen als „3D-Funktion mit bloßem Auge“ bezeichnet

So wählen Sie das beste Golang-Framework für verschiedene Anwendungsszenarien aus So wählen Sie das beste Golang-Framework für verschiedene Anwendungsszenarien aus Jun 05, 2024 pm 04:05 PM

Wählen Sie das beste Go-Framework basierend auf Anwendungsszenarien aus: Berücksichtigen Sie Anwendungstyp, Sprachfunktionen, Leistungsanforderungen und Ökosystem. Gängige Go-Frameworks: Gin (Webanwendung), Echo (Webdienst), Fiber (hoher Durchsatz), gorm (ORM), fasthttp (Geschwindigkeit). Praktischer Fall: Erstellen einer REST-API (Fiber) und Interaktion mit der Datenbank (gorm). Wählen Sie ein Framework: Wählen Sie fasthttp für die Schlüsselleistung, Gin/Echo für flexible Webanwendungen und gorm für die Datenbankinteraktion.

Detaillierte praktische Erklärung der Golang-Framework-Entwicklung: Fragen und Antworten Detaillierte praktische Erklärung der Golang-Framework-Entwicklung: Fragen und Antworten Jun 06, 2024 am 10:57 AM

Bei der Go-Framework-Entwicklung treten häufige Herausforderungen und deren Lösungen auf: Fehlerbehandlung: Verwenden Sie das Fehlerpaket für die Verwaltung und Middleware zur zentralen Fehlerbehandlung. Authentifizierung und Autorisierung: Integrieren Sie Bibliotheken von Drittanbietern und erstellen Sie benutzerdefinierte Middleware zur Überprüfung von Anmeldeinformationen. Parallelitätsverarbeitung: Verwenden Sie Goroutinen, Mutexe und Kanäle, um den Ressourcenzugriff zu steuern. Unit-Tests: Verwenden Sie Gotest-Pakete, Mocks und Stubs zur Isolierung sowie Code-Coverage-Tools, um die Angemessenheit sicherzustellen. Bereitstellung und Überwachung: Verwenden Sie Docker-Container, um Bereitstellungen zu verpacken, Datensicherungen einzurichten und Leistung und Fehler mit Protokollierungs- und Überwachungstools zu verfolgen.

Leistungsvergleich des Golang-Frameworks: Metriken für kluge Entscheidungen Leistungsvergleich des Golang-Frameworks: Metriken für kluge Entscheidungen Jun 05, 2024 pm 10:02 PM

Zu den wichtigsten Leistungsindikatoren (KPIs) bei der Auswahl eines Go-Frameworks gehören: Antwortzeit, Durchsatz, Parallelität und Ressourcennutzung. Durch Benchmarking und Vergleich der KPIs der Frameworks können Entwickler fundierte Entscheidungen auf der Grundlage der Anwendungsanforderungen treffen und dabei die erwartete Auslastung, leistungskritische Abschnitte und Ressourcenbeschränkungen berücksichtigen.

See all articles