Maison Périphériques technologiques IA Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

Feb 21, 2024 pm 03:31 PM
机器人 强化学习 产业 机器人技术 serl

Maintenant, le robot a appris des tâches précises de contrôle d'usine.
Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.Ces dernières années, des progrès significatifs ont été réalisés dans le domaine des technologies d'apprentissage par renforcement des robots, comme la marche des quadrupèdes, la préhension, la manipulation adroite, etc., mais la plupart d'entre eux se limitent à la démonstration en laboratoire. scène. L’application généralisée de la technologie d’apprentissage par renforcement robotique aux environnements de production réels se heurte encore à de nombreux défis, ce qui limite dans une certaine mesure sa portée d’application dans des scénarios réels. Dans le processus d'application pratique de la technologie d'apprentissage par renforcement, il est nécessaire de surmonter plusieurs problèmes complexes, notamment la configuration du mécanisme de récompense, la réinitialisation de l'environnement, l'amélioration de l'efficacité des échantillons et la garantie de la sécurité des actions. Les experts du secteur soulignent que la résolution des nombreux problèmes liés à la mise en œuvre réelle de la technologie d’apprentissage par renforcement est aussi importante que l’innovation continue de l’algorithme lui-même.

Face à ce défi, des chercheurs de l'Université de Californie à Berkeley, de l'Université de Stanford, de l'Université de Washington et de Google ont développé conjointement un cadre logiciel open source appelé Efficient Robot Reinforcement Learning Suite (SERL), dédié à la promotion technologie d'apprentissage par renforcement Largement utilisée dans les applications robotiques pratiques.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

  • Page d'accueil du projet : https://serl-robot.github.io/
  • Code source ouvert : https://github.com/rail-berkeley/serl
  • Titre de l'article : SERL : un logiciel Suite for Sample-Efficient Robotic Reinforcement Learning

Le framework SERL comprend principalement les composants suivants :

1. Apprentissage par renforcement efficace

Dans le domaine de l'apprentissage par renforcement, les agents intelligents (tels que robots) réussir Interagissez avec l’environnement pour apprendre à effectuer des tâches. Il apprend un ensemble de stratégies conçues pour maximiser les récompenses cumulées en essayant divers comportements et en obtenant des signaux de récompense basés sur les résultats comportementaux. SERL utilise l'algorithme RLPD pour permettre aux robots d'apprendre simultanément des interactions en temps réel et des données hors ligne précédemment collectées, réduisant ainsi considérablement le temps de formation nécessaire aux robots pour maîtriser de nouvelles compétences.

2. Diverses méthodes d'attribution de récompenses

SERL propose une variété de méthodes d'attribution de récompenses, permettant aux développeurs de personnaliser la structure des récompenses en fonction des besoins de tâches spécifiques. Par exemple, les tâches d'installation à position fixe peuvent avoir des récompenses adaptées à la position du robot, et les tâches plus complexes peuvent utiliser des classificateurs ou VICE pour apprendre un mécanisme de récompense précis. Cette flexibilité permet de guider précisément le robot pour apprendre la stratégie la plus efficace pour une tâche spécifique.

3. Aucune fonction de reproduction

Les algorithmes d'apprentissage des robots traditionnels doivent réinitialiser régulièrement l'environnement pour le prochain cycle d'apprentissage interactif. Dans de nombreuses tâches, cela ne peut pas être effectué automatiquement. Les capacités d'apprentissage sans renforcement fournies par SERL entraînent simultanément les deux politiques avant-arrière, fournissant des réinitialisations d'environnement l'une pour l'autre.

4. Interface de contrôle du robot

SERL fournit une série d'interfaces d'environnement Gym pour les tâches du manipulateur Franka à titre d'exemples standard, permettant aux utilisateurs d'étendre facilement SERL à différents bras robotiques.

5. Contrôleur d'impédance

Afin de garantir que le robot puisse explorer et fonctionner en toute sécurité et avec précision dans des environnements physiques complexes, SERL fournit un contrôleur d'impédance spécial pour le bras robotique Franka, tout en garantissant la précision au niveau en même temps, assurez-vous qu'aucun couple excessif n'est généré après un contact avec des objets externes.

Grâce à la combinaison de ces technologies et méthodes, SERL réduit considérablement le temps de formation tout en maintenant un taux de réussite et une robustesse élevés, permettant aux robots d'apprendre à accomplir des tâches complexes en peu de temps et d'être appliqués efficacement dans le monde réel.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.Figure 1, 2 : Comparaison du taux de réussite et du nombre de battements entre SERL et les méthodes de clonage comportemental dans diverses tâches. Avec une quantité de données similaire, le taux de réussite du SERL est plusieurs fois supérieur (jusqu'à 10 fois) à celui des clones, et la fréquence de battement est au moins deux fois plus rapide.

Cas d'application

1. Assemblage de composants PCB :

L'assemblage de composants perforés sur des cartes PCB est une tâche robotique courante mais difficile. Les broches des composants électroniques sont très faciles à plier et la tolérance entre la position du trou et la broche est très faible, ce qui nécessite que le robot soit à la fois précis et doux lors de l'assemblage. Avec seulement 21 minutes d’apprentissage autonome, SERL a permis au robot d’atteindre un taux d’achèvement des tâches de 100 %. Même face à des interférences inconnues telles que la position du circuit imprimé en mouvement ou la ligne de vue partiellement bloquée, le robot peut terminer le travail d'assemblage de manière stable.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

: Figure 3, 4, 5 : Lors de l'exécution de la mission du composant du circuit imprimé, le robot peut gérer les diverses interférences qui n'ont pas été rencontrées lors de la phase de formation et terminer la tâche en douceur.
2. Acheminement des câbles :
Dans le processus d'assemblage de nombreux équipements mécaniques et électroniques, nous devons installer les câbles avec précision le long d'un chemin spécifique. Cette tâche nécessite précision et adaptabilité. Des exigences élevées. ont été faites. Étant donné que les câbles flexibles sont sujets à la déformation pendant le processus de câblage et que le processus de câblage peut être soumis à diverses perturbations, telles qu'un mouvement accidentel du câble ou des changements de position du support, il est difficile de gérer l'utilisation de câbles non traditionnels traditionnels. méthodes d'apprentissage. SERL est capable d’atteindre un taux de réussite de 100 % en seulement 30 minutes. Même lorsque la position de la pince est différente de celle qu'elle était pendant la formation, le robot est capable de généraliser les compétences acquises et de s'adapter aux nouveaux défis de câblage, garantissant ainsi une exécution correcte du travail de câblage. : Figure 6, 7, 8 : La robotique peut faire passer directement le câble à travers le clip, ce qui est différent de l'entraînement pendant l'entraînement sans entraînement plus particulier.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

3. Opérations de saisie et de placement d'objets :

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.

Apprenez à assembler un circuit imprimé en 20 minutes ! Le framework SERL open source a un taux de réussite de contrôle de précision de 100 % et est trois fois plus rapide que les humains.Dans la gestion d'entrepôt ou dans le secteur de la vente au détail, les robots doivent souvent déplacer des articles d'un endroit à un autre, ce qui nécessite que le robot soit capable de les identifier et de les transporter. éléments spécifiques. Au cours du processus de formation par apprentissage par renforcement, il est difficile de réinitialiser automatiquement les objets sous-actionnés. Tirant parti des capacités d'apprentissage par renforcement sans réinitialisation de SERL, le robot a appris simultanément deux politiques avec un taux de réussite de 100/100 en 1 heure et 45 minutes. Utilisez la stratégie avant pour placer les objets de la boîte A dans la boîte B, puis utilisez la stratégie arrière pour remettre les objets de la boîte B dans la boîte A.


Figures 9, 10, 11 : SERL a entraîné deux ensembles de stratégies, une pour transporter des objets de droite à gauche et une pour déplacer des objets de gauche vers la droite. Le robot atteint non seulement un taux de réussite de 100 % sur les objets d'entraînement, mais peut également manipuler intelligemment des objets qu'il n'a jamais vus auparavant.

Auteur principal
1. Jianlan Luo

Jianlan Luo est actuellement chercheur postdoctoral au Département d'électronique et d'informatique de l'Université de Californie à Berkeley. au Berkeley Artificial Intelligence Center (BAIR) en collaboration avec le professeur Sergey Levine. Ses principaux intérêts de recherche portent sur l'apprentissage automatique, la robotique et le contrôle optimal. Avant de retourner au monde universitaire, il était chercheur à temps plein chez Google X, en collaboration avec le professeur Stefan Schaal. Avant cela, il a obtenu une maîtrise en informatique et un doctorat en génie mécanique de l'Université de Californie à Berkeley ; durant cette période, il a travaillé avec le professeur Alice Agogino et le professeur Pieter Abbeel. Il a également été chercheur invité au siège de Deepmind à Londres.

2. Zheyuan Hu

Il est diplômé de l'Université de Californie à Berkeley, avec une spécialisation en informatique et en mathématiques appliquées. Actuellement, il mène des recherches au laboratoire RAIL dirigé par le professeur Sergey Levine. Il s'intéresse vivement au domaine de l'apprentissage robotique, en se concentrant sur le développement de méthodes permettant aux robots d'acquérir rapidement et largement des compétences de manipulation adroites dans le monde réel.

3. Charles Xu

Il est étudiant en quatrième année de premier cycle avec spécialisation en génie électrique et informatique à l'Université de Californie à Berkeley. Actuellement, il mène des recherches au laboratoire RAIL dirigé par le professeur Sergey Levine. Ses intérêts de recherche se situent à l’intersection de la robotique et de l’apprentissage automatique, visant à construire des systèmes de contrôle autonomes hautement robustes et capables de généralisation.

4. You Liang Tan

Il est ingénieur de recherche au laboratoire Berkeley RAIL, supervisé par le professeur Sergey Levine. Il a auparavant obtenu sa licence à l'Université technologique de Nanyang, à Singapour, et a complété sa maîtrise au Georgia Institute of Technology, aux États-Unis. Avant cela, il était membre de l’Open Robotics Foundation. Son travail se concentre sur les applications concrètes des technologies logicielles d’apprentissage automatique et de robotique.

5. Stefan Schaal

Il a obtenu son doctorat en génie mécanique et intelligence artificielle de l'Université technique de Munich, en Allemagne, en 1991. Il est chercheur postdoctoral au Département des sciences du cerveau et des sciences cognitives et au Laboratoire d'intelligence artificielle du MIT, chercheur invité au Laboratoire de recherche sur le traitement de l'information humaine ATR au Japon et professeur adjoint adjoint au Département de kinésiologie du Georgia Institute of Technology. et l'Université d'État de Pennsylvanie aux États-Unis. Il a également été chef du groupe d'apprentissage informatique au cours du projet japonais ERATO, le Jawa Kinetic Brain Project (ERATO/JST). En 1997, il est devenu professeur d'informatique, de neurosciences et de génie biomédical à l'USC et a été promu professeur titulaire. Ses intérêts de recherche comprennent des sujets tels que les statistiques et l'apprentissage automatique, les réseaux neuronaux et l'intelligence artificielle, les neurosciences computationnelles, l'imagerie fonctionnelle du cerveau, la dynamique non linéaire, la théorie du contrôle non linéaire, la robotique et les robots biomimétiques.

Il est l'un des directeurs fondateurs de l'Institut Max Planck pour les systèmes intelligents en Allemagne, où il a dirigé le département de mouvement autonome pendant de nombreuses années. Il est actuellement scientifique en chef chez Intrinsic, la nouvelle filiale robotique d'Alphabet [Google]. Stefan Schaal est membre de l'IEEE.

6. Chelsea Finn

Elle est professeure adjointe d'informatique et de génie électrique à l'Université de Stanford. Son laboratoire, IRIS, explore l'intelligence grâce à l'interaction robotique à grande échelle et fait partie de SAIL et du groupe ML. Elle est également membre de l'équipe Google Brain. Elle s'intéresse à la capacité des robots et autres agents intelligents à développer un large éventail de comportements intelligents grâce à l'apprentissage et à l'interaction. Elle a précédemment obtenu un doctorat en informatique de l'Université de Californie à Berkeley, ainsi qu'un baccalauréat en génie électrique et en informatique du Massachusetts Institute of Technology.

7. Abhishek Gupta

Il est professeur adjoint à la Paul G. Allen School of Computer Science and Engineering de l'Université de Washington, où il dirige le WEIRD Lab. Auparavant, il était chercheur postdoctoral au MIT, travaillant avec Russ Tedrake et Pulkit Agarwal. Il a complété son doctorat sur l'apprentissage automatique et la robotique au BAIR, UC Berkeley, sous la direction des professeurs Sergey Levine et Pieter Abbeel. Avant cela, il a également obtenu son baccalauréat à l'Université de Californie à Berkeley. Son principal objectif de recherche est de développer des algorithmes permettant aux systèmes robotiques d’apprendre à effectuer des tâches complexes dans divers environnements non structurés, tels que les bureaux et les maisons.

8. Sergey Levine

Il est professeur agrégé au Département de génie électrique et d'informatique de l'Université de Californie à Berkeley. Ses recherches portent sur les algorithmes qui permettent aux agents autonomes d'apprendre des comportements complexes, en particulier sur les méthodes générales qui permettent à tout système autonome d'apprendre à résoudre n'importe quelle tâche. Les applications de ces méthodes incluent la robotique, ainsi que toute une série d’autres domaines où une prise de décision autonome est requise.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Commandes de chat et comment les utiliser
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Le robot DeepMind joue au tennis de table, et son coup droit et son revers glissent dans les airs, battant complètement les débutants humains Aug 09, 2024 pm 04:01 PM

Mais peut-être qu’il ne pourra pas vaincre le vieil homme dans le parc ? Les Jeux Olympiques de Paris battent leur plein et le tennis de table suscite beaucoup d'intérêt. Dans le même temps, les robots ont également réalisé de nouvelles avancées dans le domaine du tennis de table. DeepMind vient tout juste de proposer le premier agent robot apprenant capable d'atteindre le niveau des joueurs amateurs humains de tennis de table de compétition. Adresse papier : https://arxiv.org/pdf/2408.03906 Quelle est la capacité du robot DeepMind à jouer au tennis de table ? Probablement à égalité avec les joueurs amateurs humains : tant en coup droit qu'en revers : l'adversaire utilise une variété de styles de jeu, et le robot peut également résister : recevoir des services avec des tours différents : Cependant, l'intensité du jeu ne semble pas aussi intense que le vieil homme dans le parc. Pour les robots, le tennis de table

La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison La première griffe mécanique ! Yuanluobao est apparu à la World Robot Conference 2024 et a lancé le premier robot d'échecs pouvant entrer dans la maison Aug 21, 2024 pm 07:33 PM

Le 21 août, la Conférence mondiale sur les robots 2024 s'est tenue en grande pompe à Pékin. La marque de robots domestiques de SenseTime, "Yuanluobot SenseRobot", a dévoilé toute sa famille de produits et a récemment lancé le robot de jeu d'échecs Yuanluobot AI - Chess Professional Edition (ci-après dénommé "Yuanluobot SenseRobot"), devenant ainsi le premier robot d'échecs au monde pour le maison. En tant que troisième produit robot jouant aux échecs de Yuanluobo, le nouveau robot Guoxiang a subi un grand nombre de mises à niveau techniques spéciales et d'innovations en matière d'IA et de machines d'ingénierie. Pour la première fois, il a réalisé la capacité de ramasser des pièces d'échecs en trois dimensions. grâce à des griffes mécaniques sur un robot domestique et effectuer des fonctions homme-machine telles que jouer aux échecs, tout le monde joue aux échecs, réviser la notation, etc.

Claude aussi est devenu paresseux ! Internaute : apprenez à vous accorder des vacances Claude aussi est devenu paresseux ! Internaute : apprenez à vous accorder des vacances Sep 02, 2024 pm 01:56 PM

La rentrée scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui sont sur le point de commencer le nouveau semestre qui doivent prendre soin d’eux-mêmes, mais aussi les grands modèles d’IA. Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude. « Son niveau a beaucoup baissé, il fait souvent des pauses et même la sortie devient très courte. Au cours de la première semaine de sortie, il pouvait traduire un document complet de 4 pages à la fois, mais maintenant il ne peut même plus produire une demi-page. !" https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dans un post intitulé "Totalement déçu par Claude", plein de

Lors de la World Robot Conference, ce robot domestique porteur de « l'espoir des futurs soins aux personnes âgées » a été entouré Lors de la World Robot Conference, ce robot domestique porteur de « l'espoir des futurs soins aux personnes âgées » a été entouré Aug 22, 2024 pm 10:35 PM

Lors de la World Robot Conference qui se tient à Pékin, l'exposition de robots humanoïdes est devenue le centre absolu de la scène. Sur le stand Stardust Intelligent, l'assistant robot IA S1 a réalisé trois performances majeures de dulcimer, d'arts martiaux et de calligraphie. un espace d'exposition, capable à la fois d'arts littéraires et martiaux, a attiré un grand nombre de publics professionnels et de médias. Le jeu élégant sur les cordes élastiques permet au S1 de démontrer un fonctionnement fin et un contrôle absolu avec vitesse, force et précision. CCTV News a réalisé un reportage spécial sur l'apprentissage par imitation et le contrôle intelligent derrière "Calligraphy". Le fondateur de la société, Lai Jie, a expliqué que derrière les mouvements soyeux, le côté matériel recherche le meilleur contrôle de la force et les indicateurs corporels les plus humains (vitesse, charge). etc.), mais du côté de l'IA, les données réelles de mouvement des personnes sont collectées, permettant au robot de devenir plus fort lorsqu'il rencontre une situation forte et d'apprendre à évoluer rapidement. Et agile

Annonce des prix ACL 2024 : l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Annonce des prix ACL 2024 : l'un des meilleurs articles sur le déchiffrement Oracle par HuaTech, GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

Les contributeurs ont beaucoup gagné de cette conférence ACL. L'ACL2024, d'une durée de six jours, se tient à Bangkok, en Thaïlande. ACL est la plus grande conférence internationale dans le domaine de la linguistique informatique et du traitement du langage naturel. Elle est organisée par l'Association internationale pour la linguistique informatique et a lieu chaque année. L'ACL s'est toujours classée première en termes d'influence académique dans le domaine de la PNL, et c'est également une conférence recommandée par le CCF-A. La conférence ACL de cette année est la 62e et a reçu plus de 400 travaux de pointe dans le domaine de la PNL. Hier après-midi, la conférence a annoncé le meilleur article et d'autres récompenses. Cette fois, il y a 7 Best Paper Awards (deux inédits), 1 Best Theme Paper Award et 35 Outstanding Paper Awards. La conférence a également décerné 3 Resource Paper Awards (ResourceAward) et Social Impact Award (

Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Hongmeng Smart Travel S9 et conférence de lancement de nouveaux produits avec scénario complet, un certain nombre de nouveaux produits à succès ont été lancés ensemble Aug 08, 2024 am 07:02 AM

Cet après-midi, Hongmeng Zhixing a officiellement accueilli de nouvelles marques et de nouvelles voitures. Le 6 août, Huawei a organisé la conférence de lancement de nouveaux produits Hongmeng Smart Xingxing S9 et Huawei, réunissant la berline phare intelligente panoramique Xiangjie S9, le nouveau M7Pro et Huawei novaFlip, MatePad Pro 12,2 pouces, le nouveau MatePad Air, Huawei Bisheng With de nombreux nouveaux produits intelligents tous scénarios, notamment la série d'imprimantes laser X1, FreeBuds6i, WATCHFIT3 et l'écran intelligent S5Pro, des voyages intelligents, du bureau intelligent aux vêtements intelligents, Huawei continue de construire un écosystème intelligent complet pour offrir aux consommateurs une expérience intelligente du Internet de tout. Hongmeng Zhixing : Autonomisation approfondie pour promouvoir la modernisation de l'industrie automobile intelligente Huawei s'associe à ses partenaires de l'industrie automobile chinoise pour fournir

L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o L'équipe de Li Feifei a proposé ReKep pour donner aux robots une intelligence spatiale et intégrer GPT-4o Sep 03, 2024 pm 05:18 PM

Intégration profonde de la vision et de l'apprentissage des robots. Lorsque deux mains de robot travaillent ensemble en douceur pour plier des vêtements, verser du thé et emballer des chaussures, associées au robot humanoïde 1X NEO qui a fait la une des journaux récemment, vous pouvez avoir le sentiment : nous semblons entrer dans l'ère des robots. En fait, ces mouvements soyeux sont le produit d’une technologie robotique avancée + d’une conception de cadre exquise + de grands modèles multimodaux. Nous savons que les robots utiles nécessitent souvent des interactions complexes et exquises avec l’environnement, et que l’environnement peut être représenté comme des contraintes dans les domaines spatial et temporel. Par exemple, si vous souhaitez qu'un robot verse du thé, le robot doit d'abord saisir la poignée de la théière et la maintenir verticalement sans renverser le thé, puis la déplacer doucement jusqu'à ce que l'embouchure de la théière soit alignée avec l'embouchure de la tasse. , puis inclinez la théière selon un certain angle. ce

Conférence sur l'intelligence artificielle distribuée Appel à communications DAI 2024 : Agent Day, Richard Sutton, le père de l'apprentissage par renforcement, sera présent ! Yan Shuicheng, Sergey Levine et les scientifiques de DeepMind prononceront des discours d'ouverture Conférence sur l'intelligence artificielle distribuée Appel à communications DAI 2024 : Agent Day, Richard Sutton, le père de l'apprentissage par renforcement, sera présent ! Yan Shuicheng, Sergey Levine et les scientifiques de DeepMind prononceront des discours d'ouverture Aug 22, 2024 pm 08:02 PM

Introduction à la conférence Avec le développement rapide de la science et de la technologie, l'intelligence artificielle est devenue une force importante dans la promotion du progrès social. À notre époque, nous avons la chance d’être témoins et de participer à l’innovation et à l’application de l’intelligence artificielle distribuée (DAI). L’intelligence artificielle distribuée est une branche importante du domaine de l’intelligence artificielle, qui a attiré de plus en plus d’attention ces dernières années. Les agents basés sur de grands modèles de langage (LLM) ont soudainement émergé. En combinant les puissantes capacités de compréhension du langage et de génération des grands modèles, ils ont montré un grand potentiel en matière d'interaction en langage naturel, de raisonnement par connaissances, de planification de tâches, etc. AIAgent reprend le grand modèle de langage et est devenu un sujet brûlant dans le cercle actuel de l'IA. Au

See all articles