Maison > Périphériques technologiques > IA > Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il n'est plus difficile de faire face à des tâches de contrôle autonomes complexes

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il n'est plus difficile de faire face à des tâches de contrôle autonomes complexes

王林
Libérer: 2024-02-01 09:48:19
avant
1088 Les gens l'ont consulté

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Avec le développement rapide de l'intelligence artificielle et de la technologie robotique, l'importance de la manipulation fonctionnelle en robotique est devenue de plus en plus importante. Les tests benchmark traditionnels ne peuvent plus répondre aux besoins actuels des robots pour des tâches de manipulation complexes, nécessitant l'émergence de nouveaux benchmarks de manipulation (Functional Manipulation Benchmarks).

Aperçu

La manipulation d'un robot est confrontée à deux défis principaux : comment le robot gère intelligemment des dynamiques de contact complexes et comment faire face à la diversité des environnements et des objets. En réponse à ces défis, la technologie d’apprentissage robotique est considérée comme une solution clé. Par conséquent, le domaine a besoin d'un cadre complet et accessible qui fournit des tâches difficiles du monde réel, des données de haute qualité, des paramètres facilement reproductibles et des méthodes pertinentes intégrant les résultats de base. Sur la base de ce cadre, les chercheurs peuvent mener des expériences sur les tâches proposées. analyse en profondeur.

L'équipe de recherche du Robotics Intelligent Laboratory (RAIL) de l'Université de Californie à Berkeley, a proposé un benchmark du monde réel comme mentionné ci-dessus, appelé FMB (Functional Manipulation Benchmark for Generalizing Robotic Learning).

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

  • Page d'accueil du projet : https://functional-manipulation-benchmark.github.io/
  • Adresse du papier : https://arxiv.org/abs/2401.08553
  • Titre du papier : FMB : une référence de manipulation fonctionnelle pour l'apprentissage robotique généralisable
  • Page d'accueil du co-premier auteur : https://people.eecs.berkeley.edu/~jianlanluo/
  • https://charlesxu0124.github.io/

FMB présente les caractéristiques suivantes :

  • Conception innovante : la technologie d'impression 3D est utilisée pour produire des objets dans le cadre de la tâche visant à tester la capacité de généralisation du robot. Cette méthode est également facile à reproduire pour d'autres chercheurs.
  • Tâches diverses : y compris des tâches de manipulation en plusieurs étapes avec un seul objet et plusieurs objets, simulant véritablement les défis des environnements quotidiens.
  • Grands ensembles de données : grâce à un grand nombre de démonstrations humaines, le robot dispose d'un riche ensemble de données.
  • Base de référence d'apprentissage par imitation : à l'aide de méthodes d'apprentissage automatique de pointe, les résultats de base et les composants modulaires sont fournis pour être utilisés par d'autres chercheurs.

Objets et tâches

Les tâches dans FMB sont grossièrement divisées en deux catégories : les tâches de manipulation multi-étapes avec un seul objet et les tâches de manipulation multi-objets multi-étapes. Ces tâches sont conçues pour tester les compétences de base du robot telles que la préhension, le repositionnement et l'assemblage, qui sont nécessaires pour accomplir l'ensemble de la tâche. Les tâches de FMB nécessitent non seulement que le robot exécute une seule compétence de contrôle, mais également qu'il combine ces compétences pour effectuer des tâches en plusieurs étapes plus complexes.

La conception des tâches de FMB est flexible et modifiable. Les chercheurs peuvent choisir de se concentrer sur une seule compétence et étudier la capacité de contrôle du robot en profondeur selon les besoins, ou ils peuvent étudier des tâches complètes en plusieurs étapes, qui nécessitent que le robot effectue de longues tâches. -planification à terme et avoir la capacité de se remettre d'un échec. Des tâches plus complexes en plusieurs étapes nécessitent que le robot prenne des décisions complexes en temps réel, car elles impliquent de sélectionner des objets appropriés et de raisonner sur la séquence de leur manipulation.

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Grand ensemble de données

Dans le processus d'apprentissage des robots, le rôle des données ne peut être sous-estimé. Afin de permettre aux robots de mieux comprendre et maîtriser des tâches complexes, l’équipe de recherche a collecté un ensemble de données de démonstration humaine à grande échelle couvrant les tâches ci-dessus, contenant plus de 20 000 trajectoires opérationnelles. L'équipe de recherche a utilisé quatre caméras différentes pour enregistrer ces données de démonstration, dont deux étaient montées sur le poignet du robot et deux d'entre elles offraient une perspective globale. Ces caméras capturent des données telles que des informations sur l'image couleur RVB, des informations sur la profondeur, etc., qui sont essentielles pour que le robot apprenne à résoudre des tâches.

De plus, l'ensemble de données enregistre également les informations force/couple de l'effecteur final du robot, ce qui est très important pour les tâches comme l'assemblage qui nécessitent un contact avec un grand nombre d'objets. Grâce à ces riches données, les robots peuvent comprendre en profondeur chaque détail de la tâche et imiter plus précisément les compétences opérationnelles humaines. C’est précisément grâce à la profondeur et à l’étendue des données qu’elles constituent une base solide pour l’apprentissage des robots. Cela permet aux robots de répondre aux tâches de manière plus humaine et plus adroite lors de l’exécution de tâches complexes.

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Base de base d'apprentissage par imitation

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Schéma architectural de la stratégie de base.

Les deux modèles basés sur Transformer et ResNet utilisent un encodeur ResNet avec des poids partagés pour encoder chaque vue d'image, puis le combinent avec des informations proprioceptives et des fonctionnalités d'encodage d'objets facultatifs et de compétences de robot correspondantes, pour prédire les actions à 7 degrés. de liberté.

La partie expérimentale de FMB mène une série de tests sur les performances des systèmes d'apprentissage par imitation, en comparant différentes méthodes d'apprentissage et en explorant l'impact des différents modes de saisie et décisions de conception. Des expériences ont montré que l'utilisation d'informations sur la profondeur peut contribuer à améliorer l'efficacité des stratégies de préhension, et que les informations sur la force/le couple sont très importantes pour les tâches d'assemblage. Pour les tâches en plusieurs étapes, les méthodes traditionnelles ResNet, Transformer et Diffusion ont échoué, mais la méthode de contrôle hiérarchique proposée dans cet article montre son potentiel.

Tâche d'exploration

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Les résultats expérimentaux montrent que la stratégie ResNet qui intègre des informations de profondeur est systématiquement plus performante dans les tâches d'exploration que la stratégie qui utilise uniquement des informations RVB. Grâce à l'étude de réduction des données, l'équipe de recherche a exploré l'impact de différentes quantités de données d'entraînement sur les performances de la tâche d'exploration. Les résultats montrent que les performances de la stratégie ResNet qui intègre des informations de profondeur lors du traitement des objets vus s'amélioreront à mesure que la quantité de données d'entraînement augmentera. Notamment, cette stratégie montre des performances similaires aux objets vus pour les objets invisibles, indiquant que la diversité des objets d'entraînement contribue grandement à la capacité de généralisation du robot.

Tâches d'assemblage

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Dans les tâches d'assemblage, l'importance des informations force/couple est confirmée. Les informations force/couple sont très importantes pour la stratégie adoptée par le robot pour déterminer si l'objet a contacté la surface cible et pour mener efficacement des actions telles que la recherche.

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Cependant, lorsque la politique est entraînée sur tous les objets, le robot n'est pas toujours en mesure de mener à bien la tâche d'assemblage. En effet, la stratégie doit d'abord déterminer dans quel trou l'objet doit être inséré, puis générer les actions correspondantes, ce qui augmente considérablement la complexité de la tâche. Afin de résoudre ce problème, l'équipe de recherche a ajouté un mécanisme de sélection d'objets à la stratégie pour aider la stratégie à déterminer la forme des objets à assembler, se concentrant ainsi sur la génération d'actions d'assemblage correctes.

Tâches en plusieurs étapes

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Le cadre de
FMB se compose de deux tâches complexes. Ces tâches complexes nécessitent que les robots soient capables d’effectuer plusieurs étapes d’affilée, tout comme les humains. La méthode précédente consistait à laisser le robot apprendre l'intégralité du processus, mais cette méthode était sujette à l'accumulation d'erreurs dues à des erreurs dans un seul lien, conduisant finalement à l'échec de l'ensemble de la tâche. Cette approche a un taux de réussite de 0/10 dans les tâches de manipulation d'objets uniques et multiples.

Pour résoudre le problème des erreurs cumulatives, l'équipe de recherche a adopté une stratégie de contrôle hiérarchique. La stratégie hiérarchique décompose la tâche en plusieurs petits morceaux. Chaque morceau complété équivaut à passer un point de décision. Même si des erreurs surviennent, elles peuvent être rapidement corrigées pour éviter d'affecter les liens ultérieurs. Par exemple, si un robot ne parvient pas à saisir correctement un objet lors d’une saisie, il continuera d’essayer jusqu’à ce qu’il réussisse.

L'équipe de recherche a testé deux méthodes hiérarchiques. La première méthode fournit un vecteur efficace indiquant le type de tâche pour une seule stratégie, tandis que la seconde méthode entraîne différentes stratégies séparément pour chaque compétence de manipulation, toutes deux utilisant l'utilisation des instructions de l'opérateur comme méthode supérieure. Au niveau de la stratégie, l'équipe de recherche a constaté que les deux méthodes fonctionnaient bien lors des tests.

Les résultats des tests montrent l'efficacité de l'approche hiérarchique dans la gestion de tâches robotiques complexes et fournissent de nouvelles orientations de recherche pour les recherches futures.

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

Comme le montre l'image ci-dessus, le robot peut contrôler indépendamment les fonctions après l'apprentissage.

Référence de contrôle de robot à grande échelle de haute qualité open source de Berkeley, il nest plus difficile de faire face à des tâches de contrôle autonomes complexes

En général, les expériences ci-dessus démontrent l'innovation technologique de l'équipe de recherche dans le domaine de l'apprentissage des robots, et vérifient également que FMB est une référence appropriée pour développer des méthodes avancées d'apprentissage des robots. L’équipe de recherche attend avec impatience de futures recherches susceptibles de repousser davantage les limites de l’apprentissage robotique basé sur le FMB.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:jiqizhixin.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal