Promener le « chien » sur le ballon de yoga ! Eureka, sélectionné parmi les dix meilleurs projets de NVIDIA, a réalisé une nouvelle avancée-IA-php.cn

Maison

Promener le « chien » sur le ballon de yoga ! Eureka, sélectionné parmi les dix meilleurs projets de NVIDIA, a réalisé une nouvelle avancée

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 05, 2024 pm 01:01 PM

git 工程 dreureka

Le chien robot marche régulièrement sur la balle de yoga et son équilibre est assez bon :

Promener le « chien » sur le ballon de yoga ! Eureka, sélectionné parmi les dix meilleurs projets de NVIDIA, a réalisé une nouvelle avancée

Il peut gérer diverses scènes, qu'il s'agisse d'un trottoir plat ou d'une pelouse difficile, il peut tenir :

Promener le « chien » sur le ballon de yoga ! Eureka, sélectionné parmi les dix meilleurs projets de NVIDIA, a réalisé une nouvelle avancée

Même lorsque les chercheurs frappaient une balle de yoga, le chien robot ne se renversait pas :

Promener le « chien » sur le ballon de yoga ! Eureka, sélectionné parmi les dix meilleurs projets de NVIDIA, a réalisé une nouvelle avancée

Le chien robot pouvait également maintenir l'équilibre lors du dégonflage des ballons :

Promener le « chien » sur le ballon de yoga ! Eureka, sélectionné parmi les dix meilleurs projets de NVIDIA, a réalisé une nouvelle avancée

Les démonstrations ci-dessus sont toutes à une vitesse 1x, sans traitement d'accélération.

Adresse papier : https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf
Page d'accueil du projet : https://github.com/eureka- Research/DrEureka
Titre de l'article : DrEureka : Language Model Guided Sim-To-Real Transfer

Cette recherche a été créée conjointement par des chercheurs de l'Université de Pennsylvanie, de NVIDIA et de l'Université du Texas à Austin. , et est entièrement open source . Ils ont proposé DrEureka (Domain Randomized Eureka), un nouvel algorithme qui utilise LLM pour mettre en œuvre une conception de récompense et une configuration de paramètres aléatoires de domaine, qui peut simultanément réaliser un transfert de simulation à la réalité. L'étude démontre la capacité de l'algorithme DrEureka à résoudre de nouvelles tâches robotiques, telles que l'équilibrage d'un robot quadrupède et la marche sur un ballon de yoga, sans avoir recours à une conception manuelle itérative.

DrEureka est basé sur Eureka, qui a également été nommé l'un des dix meilleurs projets NVIDIA en 2023. Pour en savoir plus sur Eureka, veuillez vous référer à « Avec GPT-4, le robot a appris à faire tourner des stylos et à plaquer des noix ».

Dans la section des résumés de l'article, les chercheurs ont déclaré que le transfert des stratégies apprises lors des simulations vers le monde réel est une stratégie prometteuse pour l'acquisition à grande échelle de compétences robotiques. Cependant, les approches de simulation à la réalité reposent souvent sur la conception et le réglage manuels des fonctions de récompense des tâches et des paramètres physiques de simulation, ce qui rend le processus lent et fastidieux. Cet article examine l'utilisation de grands modèles de langage (LLM) pour automatiser et accélérer la simulation jusqu'à une conception réaliste.

Jim Fan, l'un des auteurs de l'article et scientifique principal chez NVIDIA, a également participé à cette recherche. Auparavant, NVIDIA avait créé un laboratoire d'IA, dirigé par Jim Fan, spécialisé dans l'intelligence embarquée. Jim Fan a déclaré :

« Nous avons entraîné un chien robot à s'équilibrer et à marcher sur une balle de yoga. Cela a été entièrement réalisé en simulation, puis transféré dans le monde réel avec zéro échantillon, sans réglage fin, et exécuté directement.

La tâche de promener la balle de yoga est particulièrement difficile pour le chien robot car nous ne pouvons pas simuler avec précision la surface de la balle rebondissante. Cependant, DrEureka peut facilement rechercher un grand nombre de configurations réelles simulées et autoriser le chien robot. pour contrôler le ballon sur différents terrains, voire aller de côté !

De manière générale, la migration de la simulation à la réalité se fait grâce à la randomisation de domaine, qui est un processus fastidieux qui nécessite que des experts en robotique examinent chaque paramètre et manuellement. ajustez-le. 4 De tels LLM de pointe ont beaucoup d'intuition physique intégrée, notamment la friction, l'amortissement, la rigidité, la gravité, etc. Avec GPT-4, DrEureka peut habilement ajuster ces paramètres et bien expliquer son raisonnement 》

Promener le « chien » sur le ballon de yoga ! Eureka, sélectionné parmi les dix meilleurs projets de NVIDIA, a réalisé une nouvelle avancée

Introduction au papier

Le processus DrEureka est le suivant, qui accepte les instructions de tâche et de sécurité et le code source de l'environnement, et exécute Eureka pour générer des fonctions et des politiques de récompense régularisées. Il teste ensuite la stratégie dans différentes conditions de simulation pour construire un a priori physique sensible aux récompenses, qui est transmis à un LLM pour générer un ensemble de paramètres de randomisation de domaine (DR). Enfin, la politique est formée à l’aide des paramètres de récompense et de DR synthétisés pour le déploiement réel.

Conception de récompense Eureka. Le composant de conception de récompense est basé sur Eureka en raison de sa simplicité et de son expressivité, mais cet article introduit quelques améliorations pour améliorer son applicabilité de la simulation aux environnements du monde réel. Le pseudocode est le suivant :

Récompense consciente de la physique préalable (RAPP, récompense consciente de la physique préalable). Les fonctions de récompense de sécurité peuvent réguler le comportement politique pour fixer les choix environnementaux, mais ne suffisent pas à elles seules à réaliser le transfert de la simulation à la réalité. Par conséquent, cet article présente un mécanisme RAPP simple pour limiter la portée de base du LLM.

LLM est utilisé pour la randomisation de domaine. Étant donné la plage RAPP pour chaque paramètre DR, la dernière étape de DrEureka demande à LLM de générer des configurations de randomisation de domaine dans les limites de la plage RAPP. Voir la figure 3 pour le processus spécifique :

Cette recherche utilise Unitree Go1 pour les expériences. Go1 est un petit robot quadrupède avec 12 degrés de liberté dans ses quatre pattes. Dans la tâche de locomotion quadrupède, cet article évalue également systématiquement les performances des politiques DrEureka sur plusieurs terrains du monde réel et constate qu'elles restent robustes et surpassent les politiques formées à l'aide de configurations de récompense et de DR conçues par l'homme.

Pour plus d'informations, veuillez vous référer au document original.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7455

Tutoriel CakePHP

1375

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Quelles bibliothèques sont utilisées pour les opérations du numéro de point flottantes en Go? Apr 02, 2025 pm 02:06 PM

La bibliothèque utilisée pour le fonctionnement du numéro de point flottante dans le langage go présente comment s'assurer que la précision est ...

Quelles bibliothèques de GO sont développées par de grandes entreprises ou fournies par des projets open source bien connus? Apr 02, 2025 pm 04:12 PM

Quelles bibliothèques de GO sont développées par de grandes entreprises ou des projets open source bien connus? Lors de la programmation en Go, les développeurs rencontrent souvent des besoins communs, ...

Gitee Pages STATIQUE Le déploiement du site Web a échoué: comment dépanner et résoudre les erreurs de fichier unique 404? Apr 04, 2025 pm 11:54 PM

GiteEpages STATIQUE Le déploiement du site Web a échoué: 404 Dépannage des erreurs et résolution lors de l'utilisation de Gitee ...

Comment exécuter le projet H5 Apr 06, 2025 pm 12:21 PM

L'exécution du projet H5 nécessite les étapes suivantes: Installation des outils nécessaires tels que le serveur Web, Node.js, les outils de développement, etc. Créez un environnement de développement, créez des dossiers de projet, initialisez les projets et écrivez du code. Démarrez le serveur de développement et exécutez la commande à l'aide de la ligne de commande. Aperçu du projet dans votre navigateur et entrez l'URL du serveur de développement. Publier des projets, optimiser le code, déployer des projets et configurer la configuration du serveur Web.

Comment obtenir les données de la région d'expédition de la version à l'étranger? Quelles sont les ressources prêtes à l'emploi disponibles? Apr 01, 2025 am 08:15 AM

Description de la question: Comment obtenir les données de la région d'expédition de la version à l'étranger? Y a-t-il des ressources prêtes à l'emploi disponibles? Soyez précis dans le commerce électronique transfrontalier ou les entreprises mondialisées ...

Comment résoudre le problème de conversion de type user_id lors de l'utilisation du flux redis pour implémenter les files d'attente de messages dans le langage Go? Apr 02, 2025 pm 04:54 PM

Le problème de l'utilisation de Redessstream pour implémenter les files d'attente de messages dans le langage GO consiste à utiliser le langage GO et redis ...

Dessin graphique de sablier Python: comment éviter les erreurs variables non définies? Apr 01, 2025 pm 06:27 PM

Précision avec Python: Source de sablier Dessin graphique et vérification d'entrée Cet article résoudra le problème de définition variable rencontré par un novice Python dans le programme de dessin graphique de sablier. Code...

Comment spécifier la base de données associée au modèle de Beego ORM? Apr 02, 2025 pm 03:54 PM

Dans le cadre du cadre de beegoorm, comment spécifier la base de données associée au modèle? De nombreux projets Beego nécessitent que plusieurs bases de données soient opérées simultanément. Lorsque vous utilisez Beego ...

See all articles