Avec le développement continu des grands modèles de langage (LLM), les utiliser pour construire des agents d'IA est devenu un nouveau domaine de recherche. Des recherches antérieures ont utilisé avec succès le LLM pour amener des agents multi-agents à accomplir de manière autonome certaines tâches. Cependant, les recherches actuelles se concentrent principalement sur des tâches simples et n'explorent pas suffisamment les tâches complexes. C'est principalement parce que les grands modèles de langage ont des problèmes d'"illusion", en particulier lorsque plusieurs agents interagissent, le problème d'hallucination sera plus grave, ce qui rendra impossible l'application à des tâches complexes
Récemment, un framework open source appelé "MetaGPT" a essayé pour résoudre ce problème. L'objectif de MetaGPT est d'injecter un flux de travail humain efficace dans la collaboration multi-agents pilotée par LLM en tant qu'approche de méta-programmation. MetaGPT a rapidement gagné plus de 11,1k étoiles quelques jours après sa mise en ligne
L'URL de ce projet est : https://github.com/geekan/MetaGPT
En un mot, MetaGPT Simulate le flux de travail d'une société de développement de logiciels, nécessitant l'attribution de rôles à chaque agent et la planification du processus de collaboration, similaire à la situation d'allocation du personnel d'une société de développement de logiciels
MetaGPT intègre d'abord la procédure opérationnelle standardisée (SOP) dans l'invite , structurant ainsi le processus collaboratif de plusieurs agents. Ensuite, l'équipe de recherche a encore modularisé le résultat, donnant à l'agent une expertise du domaine équivalente à celle des travailleurs humains pour vérifier le résultat et réduire les erreurs composées. MetaGPT attribue des rôles à différents agents via un pipeline de travail, construisant ainsi un cadre capable de résoudre efficacement des problèmes complexes. problèmes de collaboration multi-agents et le rendre plus cohérent
En prenant le développement d'un moteur de recommandation comme exemple, l'équipe de recherche a montré que "l'agent architecte" dans MetaGPT générait indépendamment la conception de l'interface système, il s'agit d'une étape cruciale pour le logiciel développement
MetaGPT est capable d'effectuer diverses tâches complexes, telles que le développement de logiciels de jeu simples, et son processus d'exécution de tâches peut être comparé aux normes des développeurs humains. Correspondance un à un entre les procédures opérationnelles (SOP)
Une fois que MetaGPT a reçu les exigences de saisie de l'utilisateur, l'agent assume le rôle de chef de produit et analyse les exigences et la faisabilité. L'agent agit ensuite en tant qu'architecte, chef de projet et ingénieur, réalisant le développement du logiciel en séquence. Enfin, un autre agent est responsable des tests complets du logiciel. Ce processus simule très bien le processus de développement réel. Examinons un cas où MetaGPT accomplit une tâche de développement spécifique. Les utilisateurs n'ont qu'à fournir une exigence, telle que "Écrire un jeu de blackjack", MetaGPT passera par l'analyse des exigences et la planification des tâches, et générera avec succès le code du jeu
L'équipe de recherche a indiqué dans la feuille de route du projet : Plan MetaGPT pour réaliser de manière indépendante des projets de taille moyenne (environ 2 000 lignes de code) à court terme, et finalement atteindre la capacité de former, affiner, optimiser, appliquer et mettre à jour de manière indépendante
MetaGPT a publié un article intitulé « METAGPT: META PROGRAMMING FOR MULTI-AGENT COLLABORATIVE FRAMEWORK » document de recherche
L'article peut être consulté sur le lien suivant : https://arxiv.org/pdf/2308.00352.pdf
Les lecteurs intéressés peuvent consulter l'article pour avoir une compréhension approfondie du sujet de recherche.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!