Da sich die Technologie des autonomen Fahrens immer weiter entwickelt, sind Fahrzeugverhalten und Flugbahnvorhersage von äußerst wichtiger Bedeutung für effizientes und sicheres Fahren. Obwohl herkömmliche Trajektorienvorhersagemethoden wie die dynamische Modellableitung und die Zugänglichkeitsanalyse die Vorteile einer klaren Form und einer guten Interpretierbarkeit bieten, ist ihre Fähigkeit, die Interaktion zwischen der Umgebung und Objekten zu modellieren, in komplexen Verkehrsumgebungen relativ begrenzt. Daher basierten in den letzten Jahren zahlreiche Forschungen und Anwendungen auf verschiedenen Deep-Learning-Methoden (wie LSTM, CNN, Transformer, GNN usw.) und verschiedenen Datensätzen wie BDD100K, nuScenes, Stanford Drone, ETH /UCY, INTERACTION, ApolloScape usw. sind ebenfalls entstanden und bieten starke Unterstützung für das Training und die Bewertung tiefer neuronaler Netzwerkmodelle. Viele SOTA-Modelle wie GroupNet, Trajectron++, MultiPath usw. haben eine gute Leistung gezeigt.
Die oben genannten Modelle und Datensätze konzentrieren sich auf normale Straßenfahrszenarien und nutzen die Infrastruktur und Funktionen wie Fahrspurlinien und Ampeln vollständig aus, um den Vorhersageprozess aufgrund von Einschränkungen durch Verkehrsvorschriften und Bewegungsmuster zu unterstützen der meisten Fahrzeuge sind ebenfalls begrenzt. Auf der „letzten Meile“ des autonomen Fahrens – autonomen Parkszenarien – werden wir jedoch mit vielen neuen Schwierigkeiten konfrontiert:
Auf der gerade zu Ende gegangenen 25. IEEE International Conference on Intelligent Transportation Systems (IEEE ITSC 2022) im Oktober 2022 veröffentlichten Forscher der University of California, Berkeley, das erste hochauflösende Video einer Parkszene &. Trajektoriendatensatz, und basierend auf diesem Datensatz wurde ein Trajektorienvorhersagemodell namens „ParkPredict+“ unter Verwendung der CNN- und Transformer-Architektur vorgeschlagen. 🔜 /berkeley.edu/dlp-dataset (Wenn Sie nicht darauf zugreifen können, können Sie die alternative Seite https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 ausprobieren)
Dataset Python API: https://github .com/ MPC-Berkeley/dlp-dataset
Die Daten set ist in zwei Downloadformaten verfügbar:
Nur JSON (empfohlen) : JSON-Dateien enthalten den Typ, die Form, die Flugbahn und andere Informationen aller Personen und können über das Open-Source-Programm Python The heruntergeladen werden Die API liest semantische Bilder (Semantic Images) direkt, zeigt eine Vorschau an und generiert sie. Wenn das Forschungsziel nur die Flugbahn- und Verhaltensvorhersage ist, kann das JSON-Format alle Anforderungen erfüllen.
Originalvideo und Anmerkung: Wenn die Forschung auf maschinellen Sichtfeldthemen wie Zielerkennung, -trennung und -verfolgung basierend auf dem Rohbild der Kamera (Rohbild) basiert, Dann müssen Sie möglicherweise das Originalvideo und das Originallabel herunterladen. Wenn dies erforderlich ist, muss der Forschungsbedarf im Datensatzantrag klar beschrieben werden. Darüber hinaus muss die Anmerkungsdatei selbst analysiert werden.
Als Anwendungsbeispiel verwendete das Forschungsteam diese Daten im Artikel „ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer“ auf der IEEE ITSC 2022 eingestellt, Basierend auf der CNN- und Transformer-Architektur werden die Absicht (Intent) und die Flugbahn (Trajectory) des Fahrzeugs in der Parkplatzszene vorhergesagt.
Das Team nutzte das CNN-Modell, um die Verteilungswahrscheinlichkeit der Fahrzeugabsicht (Intent) durch die Konstruktion semantischer Bilder vorherzusagen. Dieses Modell muss nur lokale Umgebungsinformationen des Fahrzeugs erstellen und kann die Anzahl der verfügbaren Absichten kontinuierlich entsprechend der aktuellen Umgebung ändern.
Das Team erreichte eine multimodale Absichts- und Verhaltensvorhersage, indem es das Transformer-Modell verbesserte und die Ergebnisse der Absichtsvorhersage, den Bewegungsverlauf des Fahrzeugs und die semantische Karte der Umgebung als Eingabe bereitstellte.
Das obige ist der detaillierte Inhalt vonBerkeley hat den ersten hochauflösenden Datensatz und das erste Vorhersagemodell für Parkszenarien als Open-Source-Lösung bereitgestellt, die die Zielerkennung und Flugbahnvorhersage unterstützen.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!