Table des matières
Informations sur l'ensemble de données
Modèle de prédiction de comportement et de trajectoire : ParkPredict+
Résumé
Maison Périphériques technologiques IA Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

Apr 12, 2023 pm 11:40 PM
数据 开源

Alors que la technologie de conduite autonome continue d'évoluer, le comportement du véhicule et la prédiction de trajectoire revêtent une importance extrêmement importante pour une conduite efficace et sûre. Bien que les méthodes traditionnelles de prédiction de trajectoire telles que la déduction de modèles dynamiques et l’analyse d’accessibilité présentent les avantages d’une forme claire et d’une forte interprétabilité, leurs capacités de modélisation de l’interaction entre l’environnement et les objets sont relativement limitées dans des environnements de trafic complexes. Ainsi, ces dernières années, un grand nombre de recherches et d'applications ont été basées sur diverses méthodes d'apprentissage profond (telles que LSTM, CNN, Transformer, GNN, etc.) et divers ensembles de données tels que BDD100K, nuScenes, Stanford Drone, ETH. /UCY, INTERACTION, ApolloScape, etc. ont également émergé, fournissent un support solide pour la formation et l'évaluation de modèles de réseaux neuronaux profonds tels que GroupNet, Trajectron++, MultiPath, etc.

Les modèles et ensembles de données ci-dessus sont concentrés dans des scénarios de conduite routière normale et utilisent pleinement les infrastructures et les fonctionnalités telles que les lignes de voie et les feux de circulation pour faciliter le processus de prévision en raison des limitations des règles de circulation et des schémas de mouvement ; de la plupart des véhicules sont également limités. Plus clair. Cependant, dans le « dernier kilomètre » des scénarios de conduite autonome et de stationnement autonome, nous serons confrontés à de nombreuses nouvelles difficultés :

  • Les règles de circulation et les exigences en matière de lignes de voie dans le parking ne sont pas strictes, et les véhicules ne sont pas stricts. Conduire fréquemment à volonté et « prendre des raccourcis »
  • Afin d'accomplir la tâche de stationnement, le véhicule doit effectuer des actions de stationnement plus complexes, notamment des marches arrière, un stationnement, une direction fréquentes, etc. Dans le cas des conducteurs inexpérimentés, le stationnement peut devenir un long processus
  • Il y a de nombreux obstacles et encombrements dans le parking, et la distance entre les véhicules est courte. Un peu de négligence peut entraîner des collisions et des rayures
  • Stationnement. Les piétons traversent souvent le site à volonté et les véhicules ont besoin de davantage d'actions d'évitement.
    Dans un tel scénario, il est difficile d'obtenir l'effet souhaité en appliquant simplement le modèle de prédiction de trajectoire existant, et le modèle de recyclage ne prend pas en charge les données correspondantes. . Les ensembles de données actuels basés sur les scènes de stationnement, tels que CNRPark+EXT et CARPK, sont uniquement conçus pour la détection de places de stationnement gratuites. Les images proviennent du point de vue à la première personne des caméras de surveillance, ont de faibles taux d'échantillonnage et comportent de nombreuses occlusions, ce qui les rend incapables de le faire. être utilisé pour la prédiction de trajectoire.

Lors de la 25e Conférence internationale de l'IEEE sur les systèmes de transport intelligents (IEEE ITSC 2022) qui vient de se terminer en octobre 2022, des chercheurs de l'Université de Californie à Berkeley ont publié la première vidéo haute définition d'une scène de stationnement. ensemble de données de trajectoire, et sur la base de cet ensemble de données, un modèle de prédiction de trajectoire nommé "ParkPredict+" a été proposé en utilisant l'architecture CNN et Transformer.

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

  • Lien papier : https://arxiv.org/abs/2204.10777
  • Application d'essai et de téléchargement de l'ensemble de données : https://sites.google.com /berkeley.edu/dlp-dataset (Si vous ne pouvez pas y accéder, vous pouvez essayer la page alternative https://www.php.cn/link/966eaa9527eb956f0dc8788132986707)
  • API Python Dataset : https://github. com/ MPC-Berkeley/dlp-dataset

Informations sur l'ensemble de données

L'ensemble de données a été collecté par un drone, avec une durée totale de 3,5 heures, une résolution vidéo de 4K et un taux d'échantillonnage de 25 Hz. La vue couvre une superficie de parking d'environ 140 mx 80 m, avec un total d'environ 400 places de stationnement. L'ensemble de données est annoté avec précision et un total de 1 216 véhicules à moteur, 3 904 vélos et 3 904 trajectoires de piétons ont été collectés.

Après retraitement, les données de trajectoire peuvent être lues sous forme de JSON et chargées dans la structure de données du graphe de connexion (Graph) :

  • Individu (Agent) : Chaque agent (Agent) est un objet se déplaçant dans la scène actuelle (Scène). Il possède des attributs tels que la forme géométrique et le type. Sa trajectoire de mouvement est stockée sous forme de liste chaînée contenant des instances (Instance). (Liste chaînée)
  • Instance : Chaque instance est l'état d'un individu (Agent) dans un cadre (Frame), y compris sa position, son angle de rotation, sa vitesse et son accélération. Chaque instance contient des pointeurs vers l'instance de l'individu dans l'image précédente et l'image suivante
  • Frame (Frame) : Chaque image (Frame) est un point d'échantillonnage, qui contient toutes les instances visibles à l'heure actuelle (Instance), et des pointeurs pointant vers l'image précédente et l'image suivante
  • Obstacle (Obstacle) : Les obstacles sont des objets qui n'ont pas bougé du tout dans cet enregistrement, y compris la position, le coin et la taille géométrique de chaque objet
  • Scène : Chaque scène (Scène) correspond à un fichier vidéo enregistré, qui contient des pointeurs pointant vers les première et dernière images de l'enregistrement, tous les individus (Agents) et tous les obstacles (Obstacles)

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

L'ensemble de données est disponible en deux formats de téléchargement :

JSON uniquement (recommandé)  : les fichiers JSON contiennent le type, la forme, la trajectoire et d'autres informations de tous les individus, et peuvent être téléchargés via le Python open source L'API lit directement , prévisualise et génère des images sémantiques (images sémantiques). Si l’objectif de recherche est uniquement la prédiction de trajectoires et de comportements, le format JSON peut répondre à tous les besoins.

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

Vidéo originale et annotation : Si la recherche est basée sur des sujets de champ de vision industrielle tels que la détection, la séparation et le suivi de cibles basés sur l'image brute de la caméra (Raw Image), alors vous devrez peut-être télécharger la vidéo originale et l'étiquette. Si cela est nécessaire, la recherche doit être clairement décrite dans la demande d’ensemble de données. De plus, le fichier d'annotation doit être analysé lui-même.

Modèle de prédiction de comportement et de trajectoire : ParkPredict+

À titre d'exemple d'application, dans l'article "ParkPredict+ : Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer" à l'IEEE ITSC 2022, l'équipe de recherche a utilisé ces données ensemble, sur la base de l'architecture CNN et Transformer, la prédiction de l'intention (Intent) et de la trajectoire (Trajectory) du véhicule dans la scène du parking est réalisée.

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

L'équipe a utilisé le modèle CNN pour prédire la probabilité de distribution de l'intention du véhicule (Intent) en créant des images sémantiques. Ce modèle n'a besoin que de construire des informations environnementales locales du véhicule et peut modifier en permanence le nombre d'intentions disponibles en fonction de l'environnement actuel.

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

L'équipe a réalisé une prédiction multimodale d'intention et de comportement en améliorant le modèle Transformer et en fournissant les résultats de prédiction d'intention, l'historique des mouvements du véhicule et la carte sémantique de l'environnement environnant en entrée.

Berkeley a mis en open source le premier ensemble de données haute définition et le premier modèle de prédiction dans les scénarios de stationnement, prenant en charge la reconnaissance de cibles et la prédiction de trajectoire.

Résumé

  • En tant que premier ensemble de données de haute précision pour les scénarios de stationnement, l'ensemble de données Dragon Lake Parking (DLP) peut permettre la reconnaissance et le suivi de cibles à grande échelle, la détection d'espaces de stationnement gratuits, les comportements et trajectoires des véhicules et des piétons dans ce domaine. Les données de scénario et la prise en charge des API sont fournies pour la prédiction, l'apprentissage par imitation et d'autres recherches
  • En utilisant l'architecture CNN et Transformer, le modèle ParkPredict+ montre de bonnes capacités de prédiction de comportement et de trajectoire dans les scénarios de stationnement
  • Dragon Lake Parking (DLP) L'ensemble de données est ouvert pour essai et candidature. Vous pouvez en savoir plus en visitant la page d'accueil de l'ensemble de données https://sites.google.com/berkeley.edu/dlp-dataset (si vous ne pouvez pas y accéder, vous pouvez essayer la page alternative https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 )

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Dix outils d'annotation de texte gratuits open source recommandés Dix outils d'annotation de texte gratuits open source recommandés Mar 26, 2024 pm 08:20 PM

L'annotation de texte est le travail d'étiquettes ou de balises correspondant à un contenu spécifique dans le texte. Son objectif principal est d’apporter des informations complémentaires au texte pour une analyse et un traitement plus approfondis, notamment dans le domaine de l’intelligence artificielle. L'annotation de texte est cruciale pour les tâches d'apprentissage automatique supervisées dans les applications d'intelligence artificielle. Il est utilisé pour entraîner des modèles d'IA afin de mieux comprendre les informations textuelles en langage naturel et d'améliorer les performances de tâches telles que la classification de texte, l'analyse des sentiments et la traduction linguistique. Grâce à l'annotation de texte, nous pouvons apprendre aux modèles d'IA à reconnaître les entités dans le texte, à comprendre le contexte et à faire des prédictions précises lorsque de nouvelles données similaires apparaissent. Cet article recommande principalement de meilleurs outils d'annotation de texte open source. 1.LabelStudiohttps://github.com/Hu

15 outils d'annotation d'images gratuits open source recommandés 15 outils d'annotation d'images gratuits open source recommandés Mar 28, 2024 pm 01:21 PM

L'annotation d'images est le processus consistant à associer des étiquettes ou des informations descriptives à des images pour donner une signification et une explication plus profondes au contenu de l'image. Ce processus est essentiel à l’apprentissage automatique, qui permet d’entraîner les modèles de vision à identifier plus précisément les éléments individuels des images. En ajoutant des annotations aux images, l'ordinateur peut comprendre la sémantique et le contexte derrière les images, améliorant ainsi la capacité de comprendre et d'analyser le contenu de l'image. L'annotation d'images a un large éventail d'applications, couvrant de nombreux domaines, tels que la vision par ordinateur, le traitement du langage naturel et les modèles de vision graphique. Elle a un large éventail d'applications, telles que l'assistance aux véhicules pour identifier les obstacles sur la route, en aidant à la détection. et le diagnostic des maladies grâce à la reconnaissance d'images médicales. Cet article recommande principalement de meilleurs outils d'annotation d'images open source et gratuits. 1.Makesens

Utilisez ddrescue pour récupérer des données sous Linux Utilisez ddrescue pour récupérer des données sous Linux Mar 20, 2024 pm 01:37 PM

DDREASE est un outil permettant de récupérer des données à partir de périphériques de fichiers ou de blocs tels que des disques durs, des SSD, des disques RAM, des CD, des DVD et des périphériques de stockage USB. Il copie les données d'un périphérique bloc à un autre, laissant derrière lui les blocs corrompus et ne déplaçant que les bons blocs. ddreasue est un puissant outil de récupération entièrement automatisé car il ne nécessite aucune interruption pendant les opérations de récupération. De plus, grâce au fichier map ddasue, il peut être arrêté et repris à tout moment. Les autres fonctionnalités clés de DDREASE sont les suivantes : Il n'écrase pas les données récupérées mais comble les lacunes en cas de récupération itérative. Cependant, il peut être tronqué si l'outil est invité à le faire explicitement. Récupérer les données de plusieurs fichiers ou blocs en un seul

Open source! Au-delà de ZoeDepth ! DepthFM : estimation rapide et précise de la profondeur monoculaire ! Open source! Au-delà de ZoeDepth ! DepthFM : estimation rapide et précise de la profondeur monoculaire ! Apr 03, 2024 pm 12:04 PM

0. À quoi sert cet article ? Nous proposons DepthFM : un modèle d'estimation de profondeur monoculaire génératif de pointe, polyvalent et rapide. En plus des tâches traditionnelles d'estimation de la profondeur, DepthFM démontre également des capacités de pointe dans les tâches en aval telles que l'inpainting en profondeur. DepthFM est efficace et peut synthétiser des cartes de profondeur en quelques étapes d'inférence. Lisons ce travail ensemble ~ 1. Titre des informations sur l'article : DepthFM : FastMonocularDepthEstimationwithFlowMatching Auteur : MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

Vitesse Internet lente des données cellulaires sur iPhone : correctifs Vitesse Internet lente des données cellulaires sur iPhone : correctifs May 03, 2024 pm 09:01 PM

Vous êtes confronté à un décalage et à une connexion de données mobile lente sur iPhone ? En règle générale, la puissance de l'Internet cellulaire sur votre téléphone dépend de plusieurs facteurs tels que la région, le type de réseau cellulaire, le type d'itinérance, etc. Vous pouvez prendre certaines mesures pour obtenir une connexion Internet cellulaire plus rapide et plus fiable. Correctif 1 – Forcer le redémarrage de l'iPhone Parfois, le redémarrage forcé de votre appareil réinitialise simplement beaucoup de choses, y compris la connexion cellulaire. Étape 1 – Appuyez simplement une fois sur la touche d’augmentation du volume et relâchez-la. Ensuite, appuyez sur la touche de réduction du volume et relâchez-la à nouveau. Étape 2 – La partie suivante du processus consiste à maintenir le bouton sur le côté droit. Laissez l'iPhone finir de redémarrer. Activez les données cellulaires et vérifiez la vitesse du réseau. Vérifiez à nouveau Correctif 2 – Changer le mode de données Bien que la 5G offre de meilleures vitesses de réseau, elle fonctionne mieux lorsque le signal est plus faible

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Apr 03, 2024 am 11:55 AM

La technologie de détection et de reconnaissance des visages est déjà une technologie relativement mature et largement utilisée. Actuellement, le langage d'application Internet le plus utilisé est JS. La mise en œuvre de la détection et de la reconnaissance faciale sur le front-end Web présente des avantages et des inconvénients par rapport à la reconnaissance faciale back-end. Les avantages incluent la réduction de l'interaction réseau et de la reconnaissance en temps réel, ce qui réduit considérablement le temps d'attente des utilisateurs et améliore l'expérience utilisateur. Les inconvénients sont les suivants : il est limité par la taille du modèle et la précision est également limitée ; Comment utiliser js pour implémenter la détection de visage sur le web ? Afin de mettre en œuvre la reconnaissance faciale sur le Web, vous devez être familier avec les langages et technologies de programmation associés, tels que JavaScript, HTML, CSS, WebRTC, etc. Dans le même temps, vous devez également maîtriser les technologies pertinentes de vision par ordinateur et d’intelligence artificielle. Il convient de noter qu'en raison de la conception du côté Web

La vitalité de la super intelligence s'éveille ! Mais avec l'arrivée de l'IA qui se met à jour automatiquement, les mères n'ont plus à se soucier des goulots d'étranglement des données. La vitalité de la super intelligence s'éveille ! Mais avec l'arrivée de l'IA qui se met à jour automatiquement, les mères n'ont plus à se soucier des goulots d'étranglement des données. Apr 29, 2024 pm 06:55 PM

Je pleure à mort. Le monde construit à la folie de grands modèles. Les données sur Internet ne suffisent pas du tout. Le modèle de formation ressemble à « The Hunger Games », et les chercheurs en IA du monde entier se demandent comment nourrir ces personnes avides de données. Ce problème est particulièrement important dans les tâches multimodales. À une époque où rien ne pouvait être fait, une équipe de start-up du département de l'Université Renmin de Chine a utilisé son propre nouveau modèle pour devenir la première en Chine à faire de « l'auto-alimentation des données générées par le modèle » une réalité. De plus, il s’agit d’une approche à deux volets, du côté compréhension et du côté génération, les deux côtés peuvent générer de nouvelles données multimodales de haute qualité et fournir un retour de données au modèle lui-même. Qu'est-ce qu'un modèle ? Awaker 1.0, un grand modèle multimodal qui vient d'apparaître sur le Forum Zhongguancun. Qui est l'équipe ? Moteur Sophon. Fondé par Gao Yizhao, doctorant à la Hillhouse School of Artificial Intelligence de l’Université Renmin.

See all articles