Maison > Périphériques technologiques > IA > Le « secret » de la mise en œuvre du robot : apprentissage continu, transfert de connaissances et participation autonome

Le « secret » de la mise en œuvre du robot : apprentissage continu, transfert de connaissances et participation autonome

王林
Libérer: 2023-04-12 20:22:10
avant
977 Les gens l'ont consulté

Le « secret » de la mise en œuvre du robot : apprentissage continu, transfert de connaissances et participation autonome

Cet article est reproduit à partir de Lei Feng.com Si vous devez le réimprimer, veuillez vous rendre sur le site officiel de Lei Feng.com pour demander une autorisation.

​Le 23 mai 2022, l'ICRA 2022 (IEEE International Conference on Robotics and Automation), la plus grande conférence internationale annuelle dans le domaine de la robotique, s'est tenue comme prévu à Philadelphie, aux États-Unis.

C'est la 39ème année de l'ICRA. L'ICRA est la conférence phare de l'IEEE Robotics and Automation Society et le principal forum international permettant aux chercheurs en robotique de présenter et de discuter de leurs travaux.

Lors de l'ICRA de cette année, trois des principaux experts en robotique d'Amazon, Sidd Srinivasa, Tye Brady et Philipp Michel, ont brièvement discuté des défis liés à la construction de systèmes robotiques pour l'interaction homme-machine dans le monde réel.

Le « secret » de la mise en œuvre du robot : apprentissage continu, transfert de connaissances et participation autonome

Légende : De gauche à droite se trouvent Sidd Srinivasa, directeur de l'intelligence artificielle pour Amazon Robotics, Tye Brady, expert technique en chef d'Amazon Robotics (Global), et Philipp MichelSidd, directeur principal des sciences appliquées pour Amazon Scout

Srinivasa est un expert en robotique de renommée mondiale, membre de l'IEEE, actuellement professeur émérite chez Boeing à l'Université de Washington et leader du projet Amazon Robot Artificial Intelligence. Il est responsable de la gestion des algorithmes des robots autonomes qui assistent le centre logistique d'Amazon. employés, et recherche de robots capables d'emballer et d'emballer des produits et de manutention autonome et d'un robot de type chariot qui transporte des marchandises.

Tye Brady est l'expert technique en chef d'Amazon Robotics (mondial) et est titulaire d'une maîtrise en ingénierie aérospatiale du MIT. Philipp Michel et Sidd Srinivasa sont tous deux anciens doctorants du CMU Robotics Institute et cadres supérieurs du projet de robot Scout d'Amazon.

Ils exposent leurs propres opinions sur la résolution des défis liés à la mise en œuvre d'un robot. Les commentaires sur la technologie de l'IA ont été compilés sans changer le sens original, comme suit :

Q : Vos recherches dans le domaine de la robotique résolvent différents problèmes. Quelles sont les similitudes entre ces problèmes ?

Sidd Srinivasa : Une difficulté importante dans la recherche en robotique est la suivante : nous vivons dans un monde ouvert. Nous ne savons même pas à quoi « l’entrée » est sur le point de faire face. Dans notre centre de distribution, j'ai plus de 20 millions d'articles à contrôler, et le nombre d'articles augmente par centaines chaque jour. La plupart du temps, nos robots ne savent pas quels sont les objets qu'ils récupèrent, mais ils doivent les récupérer avec soin et les emballer rapidement sans les endommager.

Philipp Michel : Pour Scout, la difficulté, ce sont les objets rencontrés sur le trottoir, et l'environnement des transports. Nous avons des installations de livraison privées déployées dans quatre États des États-Unis. Conditions météorologiques, conditions d'éclairage... il était clair dès le départ que nous devions gérer un grand nombre de variables pour permettre au robot de s'adapter à des environnements complexes.

Tye Brady : Dans le processus de développement de robots d'exécution, nous avons un avantage non négligeable, qui est d'opérer dans un environnement semi-structuré. Nous pouvons établir nos propres règles de circulation pour les robots, et la compréhension de l'environnement aide réellement nos scientifiques et ingénieurs à acquérir une compréhension approfondie des objets que nous souhaitons déplacer, manipuler, classer et identifier pour exécuter les commandes. En d’autres termes, nous pouvons réaliser la poursuite de la technologie dans le monde réel.

Philipp Michel : Une autre chose que nous avons en commun est que nous nous appuyons fortement sur l'apprentissage à partir des données pour résoudre les problèmes. Scout reçoit des données du monde réel au fur et à mesure qu'il effectue des tâches, puis développe de manière itérative des solutions d'apprentissage automatique pour la perception, la localisation et la navigation.

Sidd Srinivasa : Je suis tout à fait d'accord (apprendre des données pour résoudre des problèmes). Je pense que l'apprentissage automatique et le contrôle adaptatif sont essentiels à la mise à l'échelle super-linéaire. Si nous déployons des milliers de robots, nous ne pouvons pas faire travailler des milliers de scientifiques et d’ingénieurs sur eux. Nous devons nous appuyer sur des données réelles pour parvenir à une croissance ultra-linéaire.

De plus, je pense que le monde ouvert va nous obliger à réfléchir à la manière de "l'apprentissage continu". Nos modèles d'apprentissage automatique sont souvent formés sur la base de certaines distributions de données d'entrée, mais comme il s'agit d'un monde ouvert, nous rencontrerons le problème du « changement de covariable », c'est-à-dire que les données que nous voyons ne correspondent pas à la distribution, ce qui provoque une machine. les modèles d’apprentissage sont souvent trop confiants sans raison.

Une grande partie du travail que nous avons effectué a donc consisté à créer des « chiens de garde » (des chiens de garde, une sorte de dispositif de supervision) qui identifient quand la distribution des données d'entrée s'écarte de la distribution sur laquelle elle a été formée. Ensuite, nous effectuons un « échantillonnage d'importance » afin de pouvoir sélectionner les données modifiées et recycler le modèle d'apprentissage automatique.

Philipp Michel : C'est l'une des raisons pour lesquelles nous souhaitons entraîner des robots dans différents endroits, afin de connaître très tôt les données du monde réel que le robot peut rencontrer, ce qui nous oblige à développer des solutions qui peuvent résoudre de nouvelles données.

Sidd Srinivasa : C'est en effet une bonne idée. L'un des avantages d'avoir plusieurs robots est la capacité du système à reconnaître le contenu modifié, à se recycler, puis à partager ces connaissances avec d'autres robots.

Pensez à l'histoire d'un robot de tri : Dans un coin du monde, un robot rencontre un nouveau type d'emballage. Au début, il était troublé car il n'avait jamais rien vu de pareil auparavant et ne pouvait pas le reconnaître. Puis une nouvelle solution est apparue : un robot capable de transmettre de nouveaux types d’emballages à tous les robots du monde. Ainsi, lorsque ce nouveau type d'emballage apparaîtra ailleurs, les autres robots sauront quoi en faire. Cela équivaut à avoir une "sauvegarde". Lorsque de nouvelles données apparaissent à un point, d'autres points le connaîtront, car le système a su se recycler et partager des informations.

Philipp Michel : Notre robot fait des choses similaires. Si nos robots rencontrent de nouveaux obstacles qu'ils n'ont jamais rencontrés auparavant, nous essayons d'ajuster le modèle pour reconnaître et gérer ces obstacles, puis déployons le nouveau modèle sur tous les robots.

Une des choses qui m'empêche de dormir la nuit, c'est l'idée que nos robots rencontreront de nouveaux objets sur le trottoir qu'ils ne rencontreront plus avant les trois prochaines années, par exemple : les gens les utilisent à Halloween, les gargouilles décorent les pelouses, ou les gens placent un parapluie sur une table de pique-nique pour la faire ressembler moins à une « table de pique-nique ». Dans ce cas, tous les algorithmes d’apprentissage automatique ne parviennent pas à reconnaître qu’il s’agit d’une table de pique-nique.

Une partie de nos recherches porte donc sur la manière d’équilibrer les choses communes qui n’ont pas besoin d’être mêlées à des catégories spécifiques de choses. S’il s’agit d’un couvercle de regard ouvert, le robot doit être capable de l’identifier, sinon il tombera. Mais s'il ne s'agit que d'une boîte aléatoire, nous n'avons probablement pas besoin de connaître la hiérarchie de la boîte, mais simplement de savoir que c'est l'objet que nous voulons contourner.

Sidd Srinivasa : Un autre défi est que lorsque vous changez de modèle, il peut y avoir des conséquences inattendues. Le modèle modifié peut ne pas affecter la perception du robot, mais il peut modifier la façon dont le robot « freine », provoquant une usure des roulements à billes au bout de deux mois. Dans les systèmes de bout en bout, de nombreuses recherches futures intéressantes porteront sur « la compréhension de l’impact des changements intervenus dans certaines parties du système sur les performances du système dans son ensemble ».

Philipp Michel : Nous avons passé beaucoup de temps à réfléchir à la question de savoir si nous devions diviser les différentes parties de la pile de robots. L’intégration entre eux peut apporter de nombreux avantages, mais elle est également limitée. Un cas extrême est l’apprentissage caméra-moteur-couple, qui est très difficile dans toute application robotique réelle. Ensuite, il y a la pile robotique traditionnelle, qui est joliment divisée en parties telles que la localisation, la perception, la planification et le contrôle.

Nous avons également passé beaucoup de temps à réfléchir à la manière dont la pile devrait évoluer au fil du temps et aux améliorations de performances apportées en rapprochant ces éléments ? En même temps, nous voulons avoir un système qui reste aussi interprétable que possible. Nous essayons de maximiser l'intégration des composants d'apprentissage en exploitant l'ensemble de la pile tout en conservant l'interprétabilité et le nombre de fonctionnalités de sécurité.

Sidd Srinivasa : C'est un excellent point. Je suis entièrement d'accord avec Philipp. Il n'est pas nécessairement correct d'utiliser un modèle pour gouverner tous les modèles. Mais souvent, nous finissons par créer des modèles d’apprentissage automatique qui partagent une base avec plusieurs têtes appliquées. Qu'est-ce qu'un objet et que signifie segmenter un objet ? Il peut s'agir de quelque chose comme la cueillette, l'empilage ou l'emballage, mais chacun nécessite une tête spécialisée, reposant sur une colonne vertébrale spécialisée dans les tâches.

Philipp Michel : Certains facteurs que nous prenons en compte sont la batterie, l'autonomie, la température, l'espace et les contraintes informatiques. Nous devons donc être efficaces avec nos modèles, les optimiser et essayer de tirer parti autant que possible de l'épine dorsale partagée, comme l'a mentionné Sidd, différentes têtes pour différentes tâches.

Le « secret » de la mise en œuvre du robot : apprentissage continu, transfert de connaissances et participation autonome

Légende : Amazon Scout est un robot de livraison autonome qui peut se déplacer à la vitesse du marche sur les trottoirs publics et est actuellement en cours de tests sur le terrain dans quatre États des États-Unis.

Q : Lorsque j'ai posé des questions sur les points communs entre vos projets, une chose qui m'est venue à l'esprit est que vos robots travaillent tous dans le même environnement que les humains. Pourquoi cela complique-t-il le problème ?

Sidd Srinivasa : Les robots se rapprochent de la vie humaine, et nous devons respecter toutes les interactions complexes qui se produisent dans le monde humain. Outre la marche, la conduite automobile et l’exécution de tâches, il existe également des interactions sociales complexes. Ce qui est important pour un robot, c’est d’abord d’être conscient et ensuite d’être impliqué.

C'est vraiment difficile, quand on conduit, il est parfois difficile de dire ce que pensent les autres et de décider comment agir en fonction de ce qu'ils pensent. Il est difficile de simplement raisonner sur le problème, et boucler la boucle est encore plus difficile.

Si un robot joue aux échecs ou contre un humain, il est beaucoup plus facile de prédire ce qu'il va faire car les règles sont déjà bien énoncées. Si vous supposez que vos adversaires sont optimaux, vous réussirez même s’ils ne sont pas optimaux. Ceci est garanti dans certains jeux à deux joueurs.

Mais la situation réelle n'est pas la suivante. Lorsque nous jouons à ce genre de jeu coopératif qui garantit une situation gagnant-gagnant, nous constatons qu'il est en fait difficile de prédire avec précision pendant le jeu, même si les collaborateurs ont de bonnes intentions.

Philipp Michel : Et le comportement du monde humain change beaucoup. Certains animaux ignorent complètement le robot et certains animaux se dirigent vers le robot. Il en va de même pour les piétons, certains fermant les yeux sur le robot et d’autres marchant droit vers lui. Les enfants, en particulier, sont extrêmement curieux et très interactifs. Nous devons être capables de gérer toutes les situations en toute sécurité, et cette variabilité est passionnante.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:51cto.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal