Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé

Table des matières

Qu'est-ce qu'il y a de si génial dans ce PaLM-SayCan ?

Maison

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

王林

May 04, 2023 pm 02:13 PM

谷歌机器人模型

"Tu peux aller dans le hall, tu peux aller à la cuisine", c'est un compliment à l'épouse idéale et bienveillante, et je le dirai probablement aux robots de Google à l'avenir.

Avez-vous déjà vu un robot doté d'un grand modèle de langage et capable d'apprendre tout seul ? Vous ne savez pas comment faire ? Vous pouvez l'apprendre ! Ce n’est pas grave si vous ne le savez pas maintenant, vous pourrez le faire après un certain temps.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Comparé au "Iron Masked King Kong" extrêmement cool de Boston Dynamics qui escalade des montagnes de couteaux, descend dans des mers de feu et escalade des montagnes et des crêtes comme s'il marchait sur un terrain plat, cette fois " robot d'apprentissage" ressemble plus à un petit assistant attentionné autour de vous. Ce que je dis et ce que vous faites, ce sont les routines générales permettant aux robots d'exécuter des instructions. Les nouvelles recherches de Google permettent cette fois aux robots non seulement de suivre des instructions, mais aussi de le faire eux-mêmes.

C'est la première fois que Google combine un grand modèle de langage avec un robot pour apprendre au robot à faire les mêmes choses que les humains.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Adresse papier : https://arxiv.org/pdf/2204.01691.pdfUtilisation du titre du papier Google : "Faites ce que je peux, pas ce que je dis".

Cela signifie probablement ceci : "Vous êtes déjà un robot mature. Vous pouvez faire ce que je fais. Si vous ne le savez pas, vous pouvez l'apprendre. Si vous ne le connaissez pas, vous pouvez le pratiquer !" Google a nommé ce robot PaLM-SayCan . Dans le reportage du « Washington Post », le journaliste a vu des chercheurs demander à des robots de préparer des hamburgers à partir d'ingrédients de jouets en plastique. Il semble que ce bras robotique sache qu'il doit ajouter du ketchup après avoir mis la viande et avant de mettre la laitue, mais le chef estime actuellement qu'« ajouter du ketchup » signifie mettre toute la bouteille de ketchup dans le burger.

Bien que ce robot chef ne soit pas encore qualifié, Google estime qu'avec la formation d'un grand modèle de langage, ce ne sera qu'une question de temps avant qu'il apprenne à cuisiner des burgers. Le robot peut également reconnaître des canettes de 7-Up et de Coca-Cola, ouvrir des tiroirs et trouver un sac de chips. Grâce aux capacités d'abstraction de PaLM, il peut même comprendre que les bols jaunes, verts et bleus peuvent être comparés respectivement aux déserts, aux jungles et aux océans.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Différent des robots précédents, il y avait des robots qui préparaient des hamburgers, des nouilles frites et des pizzas dans le passé, mais en fait, ils complétaient une combinaison d'instructions claires pour une seule action, telles que « Bouger bras droit trois espaces vers la gauche." , "retourner", etc. L'objectif actuel de Google est de permettre aux robots de comprendre et d'exécuter des commandes telles que "Viens me préparer un hamburger", "J'ai faim, va m'acheter un petit pain" et "Sortez et joue au ballon avec moi". C’est comme parler à quelqu’un.

Par exemple, lorsqu'un chercheur en intelligence artificielle de Google a dit au robot PaLM-SayCan : "Ma boisson s'est renversée, pouvez-vous m'aider ?" appareil photo numérique pour découvrir l'Éponge sur le comptoir, saisissez-la avec le bras électrique et ramenez-la.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Brian Ichter de Google a déclaré : « Il s’agit d’un modèle fondamentalement différent. » Il est l'un des auteurs d'un article récemment publié décrivant les nouvelles avancées réalisées dans ces robots.

De nos jours, les robots ne sont plus une rareté. Des millions de robots travaillent dans des usines à travers le monde, mais ils suivent des instructions spécifiques et se concentrent souvent sur une ou deux tâches seulement. Mais construire un robot capable d’accomplir une série de tâches et d’apprendre en les accomplissant est beaucoup plus compliqué. Depuis des années, les entreprises technologiques, grandes et petites, tentent de construire de tels « robots universels ».

Le grand modèle de langage devenu populaire ces dernières années a permis à Google de trouver l'inspiration pour le développement de « robots universels ». Les grands modèles de langage utilisent de grandes quantités de texte provenant d’Internet pour entraîner les logiciels d’IA à deviner les types de réponses qui pourraient suivre certaines questions ou commentaires.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

De BERT à GPT-3, et plus tard à MT-NLP , à mesure que le nombre de paramètres a augmenté à pas de géant, ces modèles sont devenus si efficaces pour prédire la réponse correcte que traiter un modèle donne souvent l'impression de parler à une personne bien informée. Avec autant de connaissances, ne serait-il pas dommage de discuter avec les autres à longueur de journée ? Si vous pouvez parler, vous pouvez travailler. Des chatbots aux robots assistants, on peut dire que les idées de recherche de Google sont venues naturellement.

Qu'est-ce qu'il y a de si génial dans ce PaLM-SayCan ?

Cette fois, Google AI a collaboré avec le projet Everyday Robot lancé par l'équipe moonshot X de la société mère de Google Alphabet pour proposer une méthode. Autrement dit, les connaissances sont extraites d'un grand modèle de langage (LLM) via une pré-formation, permettant au robot de suivre des instructions textuelles de haut niveau pour accomplir des tâches physiques.

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Le projet Everyday Robot dure depuis de nombreuses années, et de nombreux ont collaboré avec les membres de l'équipe Google AI qui ont rejoint Alphabet en 2015 ou 2016. L’idée est de permettre aux robots d’utiliser des caméras et des algorithmes d’apprentissage automatique sophistiqués pour voir et apprendre du monde qui les entoure, sans avoir à leur enseigner toutes les situations potentielles qu’ils pourraient rencontrer. L’idée de Google est la suivante : les modèles Large Language peuvent coder de riches connaissances sémantiques sur le monde, ce qui est utile pour les robots conçus pour effectuer des tâches en langage naturel. Le défaut évident du LLM est « le manque d’expérience du monde réel ». Il peut fonctionner parfaitement en laboratoire mais peut être inutile dans la vie réelle. Par conséquent, les chercheurs recommandent de « fournir une base réelle grâce à des compétences de pré-formation » pour contraindre le modèle à effectuer des actions en langage naturel conformes à l’environnement.

Le robot peut agir comme les « mains et les yeux » du modèle de langage, tandis que le modèle de langage fournit des connaissances sémantiques de haut niveau/une expérience du monde réel sur la tâche . Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage

Google a utilisé une énorme machine à processeur 6144 pour entraîner PaLM (Pathways Language Model). Les ressources de formation comprennent une vaste collection de documents Web multilingues trouvés sur le site Web GitHub de Microsoft, des livres, des articles Wikipédia, des conversations et du code de programmation. L’agent IA ainsi formé peut expliquer des blagues, compléter des phrases, répondre aux questions et raisonner selon sa propre chaîne de pensée.

La question suivante se pose : si cet agent est utilisé dans des robots, comment extraire et utiliser la connaissance d'un grand modèle de langage (LLM) pour accomplir des tâches physiques ? Par exemple, si ma boisson est renversée, GPT-3 dira que vous pouvez utiliser un aspirateur, et LaMDA dira si vous avez besoin que je trouve un nettoyeur pour vous ? (C'est très déroutant)

Les grands modèles de langage ne peuvent pas effectuer cette opération car ils n'interagissent pas avec l'environnement réel. réaction. La capacité de jugement de valeur formée par SayCan, basé sur LLM, grâce au modèle pré-entraîné, peut gérer des instructions dans des environnements complexes et réels. Inspirés par cet exemple, nous avons examiné comment extraire des connaissances LLM pour permettre aux robots de suivre des instructions textuelles de haut niveau. Le robot est doté d'un ensemble de compétences d'apprentissage de comportements « atomiques » capables d'un contrôle visuomoteur de bas niveau. En plus de demander au LLM d'expliquer simplement les instructions, nous pouvons également l'utiliser pour évaluer la probabilité que les compétences d'un individu progressent vers l'exécution d'instructions de haut niveau.

En supposant que chaque compétence a une fonction d'affordance, alors la probabilité de son succès à partir de l'état actuel peut être quantifiée (comme l'apprentissage de la fonction de valeur), et cette valeur peut mesurer la probabilité de la compétence. De cette manière, LLM complète la description de la probabilité de contribution de chaque compétence à l'exécution des instructions. Les chercheurs ont utilisé deux mesures pour évaluer les performances du système :

🎜#

Si vous avez quelque chose à dire, parlez-en ! Le robot de Google peut apprendre et réfléchir par lui-même après avoir « mangé » un grand modèle de langage (1) Taux de réussite du plan, indiquant si le robot a sélectionné le bon compétence pour l'instruction ;

(2) taux de réussite de l'exécution, indiquant si l'instruction a été exécutée avec succès.

Les données montrent que le taux d'exécution des instructions de PaLM-SayCan est également le plus élevé parmi tous les modèles.

Risque : Que dois-je faire si j'échoue en robotique ?

L'idée est géniale, mais ce travail n'est pas sans risques. Le corpus de formation des grands modèles linguistiques provient d'Internet, et certains modèles linguistiques ont montré des tendances négatives telles que le racisme ou le sexisme, et sont parfois incités à publier des discours haineux ou à mentir. Si ce modèle est utilisé pour entraîner un chatbot, le résultat sera un assistant vocal capable de jurer et de bavarder. Mais que se passerait-il s'il était utilisé pour entraîner un robot doté de mains et de pieds à faire de mauvaises choses ?

De plus, ce qui est plus dangereux que cela, c'est que si le robot ainsi entraîné devient conscient, les choses peuvent devenir incontrôlables (il existe de nombreux films de science-fiction similaires ).

En juillet de cette année, un employé de Google a affirmé que le logiciel est un employé vivant. Le consensus parmi les experts en IA est que ces modèles ne sont pas vivants, mais beaucoup craignent qu’ils ne présentent des biais parce qu’ils sont formés sur de grandes quantités de texte généré par l’homme, non filtré.

Malgré cela, Google continue de travailler dur. Désormais, les chercheurs n'ont plus besoin de coder des instructions techniques spécifiques pour chaque tâche du robot, mais peuvent plus simplement leur parler. dans le langage courant. De plus, le nouveau logiciel peut aider les robots à analyser eux-mêmes des instructions complexes en plusieurs étapes.

Désormais, les robots peuvent interpréter des instructions qu'ils n'ont jamais entendues auparavant et proposer eux-mêmes des réactions et des actions significatives.

Peut-être que pour les robots, une nouvelle porte vient de s'ouvrir, et l'avenir est peut-être encore un long processus. Les techniques d’intelligence artificielle telles que les réseaux neuronaux et l’apprentissage par renforcement sont utilisées depuis des années pour former des robots. Des progrès ont été réalisés, mais les progrès sont encore lents.

Le robot de Google est loin d'être prêt pour une utilisation dans le monde réel. Les chercheurs ont répété à plusieurs reprises que le robot était encore au stade du laboratoire et n'avait pas encore été commercialisé. plan.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7466

Tutoriel CakePHP

1376

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Comment commenter Deepseek Feb 19, 2025 pm 05:42 PM

Deepseek est un puissant outil de récupération d'informations. .

Comment rechercher Deepseek Feb 19, 2025 pm 05:39 PM

Deepseek est un moteur de recherche propriétaire qui ne recherche que dans une base de données ou un système spécifique, plus rapide et plus précis. Lorsque vous l'utilisez, il est conseillé aux utilisateurs de lire le document, d'essayer différentes stratégies de recherche, de demander de l'aide et des commentaires sur l'expérience utilisateur afin de tirer le meilleur parti de leurs avantages.

Sesame Open Door Exchange Page d'enregistrement de page Enregistrement Gate Trading App The Registration Site Web Feb 28, 2025 am 11:06 AM

Cet article présente le processus d'enregistrement de la version Web de Sesame Open Exchange (GATE.IO) et l'application Gate Trading en détail. Qu'il s'agisse de l'enregistrement Web ou de l'enregistrement de l'application, vous devez visiter le site Web officiel ou l'App Store pour télécharger l'application authentique, puis remplir le nom d'utilisateur, le mot de passe, l'e-mail, le numéro de téléphone mobile et d'autres informations et terminer la vérification des e-mails ou du téléphone mobile.

Pourquoi le lien d'échange de Bybit ne peut-il pas être téléchargé directement et installé? Feb 21, 2025 pm 10:57 PM

Pourquoi le lien d'échange de Bybit ne peut-il pas être téléchargé directement et installé? Bybit est un échange de crypto-monnaie qui fournit des services de trading aux utilisateurs. Les applications mobiles de l'échange ne peuvent pas être téléchargées directement via AppStore ou GooglePlay pour les raisons suivantes: 1. La politique de l'App Store empêche Apple et Google d'avoir des exigences strictes sur les types d'applications autorisées dans l'App Store. Les demandes d'échange de crypto-monnaie ne répondent souvent pas à ces exigences car elles impliquent des services financiers et nécessitent des réglementations et des normes de sécurité spécifiques. 2. Conformité des lois et réglementations Dans de nombreux pays, les activités liées aux transactions de crypto-monnaie sont réglementées ou restreintes. Pour se conformer à ces réglementations, l'application ByBit ne peut être utilisée que via des sites Web officiels ou d'autres canaux autorisés

Sesame Open Door Trading Platform Download Version mobile Gateio Trading Plateforme de téléchargement Adresse de téléchargement Feb 28, 2025 am 10:51 AM

Il est crucial de choisir un canal formel pour télécharger l'application et d'assurer la sécurité de votre compte.

Top 10 recommandé pour l'application de trading d'actifs numériques crypto (2025 Global Ranking) Mar 18, 2025 pm 12:15 PM

Cet article recommande les dix principales plates-formes de trading de crypto-monnaie qui méritent d'être prêtées, notamment Binance, Okx, Gate.io, Bitflyer, Kucoin, Bybit, Coinbase Pro, Kraken, Bydfi et Xbit décentralisées. Ces plateformes ont leurs propres avantages en termes de quantité de devises de transaction, de type de transaction, de sécurité, de conformité et de fonctionnalités spéciales. Le choix d'une plate-forme appropriée nécessite une considération complète en fonction de votre propre expérience de trading, de votre tolérance au risque et de vos préférences d'investissement. J'espère que cet article vous aide à trouver le meilleur costume pour vous-même

Binance Binance Site officiel Dernière version Portail de connexion Feb 21, 2025 pm 05:42 PM

Pour accéder à la dernière version du portail de connexion du site Web de Binance, suivez simplement ces étapes simples. Accédez au site officiel et cliquez sur le bouton "Connectez-vous" dans le coin supérieur droit. Sélectionnez votre méthode de connexion existante. Entrez votre numéro de mobile ou votre mot de passe enregistré et votre mot de passe et complétez l'authentification (telles que le code de vérification mobile ou Google Authenticator). Après une vérification réussie, vous pouvez accéder à la dernière version du portail de connexion du site Web officiel de Binance.

Sesame Open Door Exchange Page Web Login Dernière version GATEIO Entrée du site officiel Mar 04, 2025 pm 11:48 PM

Une introduction détaillée à l'opération de connexion de la version Web Sesame Open Exchange, y compris les étapes de connexion et le processus de récupération de mot de passe.

See all articles