Récemment, Wall-Facing Intelligence, l'une des principales sociétés nationales de grands modèles d'intelligence artificielle, a fait un autre grand pas en avant. Elle s'est associée au Laboratoire PNL de l'Université Tsinghua pour développer et lancer conjointement le grand modèle "super-héros" -. XAgent.
Grâce au test de tâches, les capacités de traitement de XAgent dans des tâches réellement complexes ont complètement dépassé AutoGPT.
XAgent est un nouvel agent d'IA capable de résoudre des tâches complexes de manière autonome. Avec LLM comme noyau, il peut comprendre les instructions humaines, formuler des plans complexes et prendre des mesures de manière autonome. Les agents traditionnels sont généralement limités par des règles personnalisées par l'homme et ne peuvent résoudre des problèmes que dans une plage limitée. Ils ressemblent davantage à des « outils » à usage humain qu’à de véritables « agents autonomes » et sont difficiles à résoudre de manière autonome des problèmes complexes.
planification et prise de décision autonomes, lui permettant de fonctionner de manière indépendante et de découvrir de nouvelles stratégies et solutions sans être lié par des préréglages humains.
Ses capacités ont complètement dépassé AutoGPT, montrant une autonomie incroyable et des capacités de résolution de tâches complexes dans de nombreuses tâches de scène, élevant le niveau d'intelligence des agents IA à un nouveau niveau.
Puis la question revient : comment est-il mis en œuvre ?
Collaboration "cerveau gauche et droit", mécanisme à double cycleTout comme les humains ont un "cerveau gauche" et un "cerveau droit", lorsqu'ils traitent des tâches complexes, ils le considèrent généralement sous deux angles : "macro" et « micro ». Il est nécessaire de coordonner et de planifier la situation globale, ainsi que de la considérer au niveau de l'exécution.
" dans la conception de XAgent :
Boucle externe : responsable de la situation globale Tâche planification, décomposant les tâches complexes en tâches simples et exploitables.
"PlanAgent". Il divisera les tâches complexes en plusieurs tâches simples et supervisera le processus complet de résolution de problèmes.
Premièrement, il décompose une tâche complexe donnée en « sous-tâches » plus petites et plus faciles à gérer, génère un « plan initial
» et forme une séquence de tâches.Par la suite, il transmettra chaque sous-tâche à la boucle interne pour solution une par une. Au cours de ce processus, la boucle externe surveillera en permanence la progression et l'état de la tâche, et effectuera une « optimisation itérative
» sur les plans ultérieurs en fonction des commentaires.Dans la boucle interne, XAgent change rapidement d'identité, démontrant son professionnalisme en tant qu'« exécuteur » efficace (ToolAgent
) pour s'assurer que les sous-tâches délivrées par la boucle externe répondent aux attentes.Selon la nature de la sous-tâche, il peut récupérer des outils à partir de systèmes externes et résoudre la sous-tâche étape par étape. Une fois la sous-tâche terminée, elle générera un reflet du processus d'exécution de la sous-tâche en cours et le renverra à la boucle externe pour indiquer si la tâche en cours est terminée et les points d'optimisation potentiels dans l'exécution de la tâche. Comme le montre la figure, l'utilisateur a soumis le fichier iris.zip à XAgent pour que XAgent analyse les données. Comme vous pouvez le voir, XAgent décompose d'abord cette tâche en 4 sous-tâches via la boucle externe : Par la suite, lors de l'exécution de chaque sous-tâche, XAgent utilise habilement la lecture et l'écriture de fichiers, les commandes shell, le notebook python et les pandas correspondants, sci-kit learn, seaborn, matplotlib et d'autres bibliothèques d'analyse de données via la boucle interne, et même effectuer une analyse visuelle des données.
Lors de l'exécution de la même tâche, AutoGPT n'a pas prévu de vérifier l'environnement Python et les bibliothèques associées, mais a directement commencé à écrire du code pour l'exécution, ce qui a entraîné des échecs et des rapports d'erreurs lorsque en utilisant des bibliothèques connexes. Une analyse sophistiquée des données n’a pas non plus été réalisée. Bien qu'AutoGPT ait dans une certaine mesure dépassé les limites du modèle GPT traditionnel, il présente toujours le phénomène d'erreurs d'exécution telles que des boucles infinies et des erreurs les appels qui nécessitent une intervention manuelle peuvent être résolus. XAgent a pris en compte les problèmes connexes dès le début de sa conception et a introduit un mécanisme d'interaction spécialement conçu pour améliorer la collaboration homme-machine : il peut interagir avec les utilisateurs de manière autonome et émettre des demandes d'intervention et de guidage de la part des humains. Pour un agent intelligent, « sa capacité à coopérer avec les humains » est également un indicateur important qui reflète son intelligence. Tout d'abord, XAgent dispose d'une interface intuitive qui permet aux utilisateurs de remplacer ou de modifier directement les suggestions qu'il fait, combinant efficacement l'efficacité de l'IA avec l'intuition et l'expertise humaines. Deuxièmement, face à des défis inconnus, XAgent a la capacité de « demander de l'aide aux humains ». Il recherchera des commentaires, des suggestions ou des conseils en temps réel auprès des utilisateurs pour garantir que même dans des domaines incertains, l'agent peut fonctionner. c'est le meilleur. Pictures Ce paradigme d'interaction intègre organiquement l'autonomie de l'IA avec la sagesse humaine, démontrant une nouvelle relation de collaboration entre les humains et XAgent. Comme le montre l'image, l'utilisateur souhaite que XAgent l'aide à recommander de délicieux restaurants pour faire la fête entre amis, mais aucune information spécifique et détaillée n'est fournie. À ce stade, XAgent peut se rendre compte que les informations actuellement fournies par l'utilisateur ne suffisent pas pour faire des recommandations, il fait donc une demande aux humains, demandant l'emplacement préféré de l'utilisateur, la fourchette budgétaire, les préférences gustatives, les tabous, etc. , et après avoir obtenu l'utilisateur, les restaurants recommandés sont fournis en fonction des commentaires. Mais AutoGPT a directement commencé à rechercher des informations sur les restaurants sur Internet pour obtenir des recommandations. Les résultats finaux recommandés étaient au mauvais endroit, ne tenaient pas compte du budget de l'utilisateur et ne répondaient pas à ses besoins. Indépendamment du mécanisme de fonctionnement à « double cycle » ou de la capacité interactive de « collaboration homme-machine », dans la conception globale de XAgent, Wallface Intelligence et l'équipe Tsinghua se sont concentrées sur fonctionnalités de base de l'intelligence telles que la stabilité, l'efficacité et la sécurité. Et la méthode de communication structurée est également l'un des facteurs importants dans la construction d'un agent intelligent fort et stable. XAgent utilise Function Call comme langage de communication interne, ce qui présente les avantages de structuration, de standardisation et d'unification. De plus, l'invocation d'outils est également l'une des capacités importantes pour évaluer si l'agent IA a la capacité de résoudre des problèmes complexes. XAgent dispose d'un moteur d'exécution d'outils original ToolServer dans sa conception, qui peut atteindre des capacités d'exécution d'outils plus sécurisées, efficaces et évolutives. Il fonctionne dans un environnement Docker isolé, garantissant que l'exécution de l'outil ne compromet pas la stabilité ou la sécurité du système principal. Cette conception apporte de multiples avantages : Les composants clés de ToolServer incluent : ToolServerNode, ToolServerMonitor et ToolServerManager, qui offrent de puissantes fonctionnalités dans les opérations d'exécution, l'inspection des nœuds, la gestion des cycles, etc. Actuellement, ToolSever de XAgent prend en charge FileSystemEnv, PythonNotoBook, WebEnv, ExecuteShell, RapidAPIEnv, AskHumanforHelp et d'autres outils. XAgent peut non seulement nous aider à effectuer quelques tâches simples, mais il peut même nous aider à former des modèles. Par exemple, les utilisateurs espèrent analyser les critiques de films et déterminer la qualité de l'évaluation du film par le public. À ce stade, XAgent téléchargera d'abord l'ensemble de données imdb pour entraîner un modèle BERT et utilisera le modèle BERT entraîné pour prédire les critiques de films. Après des tests dans une série de tâches, cela peut être vu (comme le montrent les figures a et b ci-dessous), basé sur les performances XAgent de GPT-4, dépasse celles du GPT-4 d'origine dans tous les tests de référence et surpasse AutoGPT dans tous les aspects. Ces tâches nécessitent une planification du raisonnement de l'agent et la capacité d'utiliser des outils externes, notamment : la capacité de répondre à des questions avec les moteurs de recherche (FreshQA+HotpotQA), la capacité de programmation Python (MBPP), la capacité de raisonnement mathématique (MATH) et l'interactivité. capacité de programmation (InterCode), capacité de raisonnement incarné (ALFWorld), tâches réelles complexes, etc. Figure a : XAgent surpasse complètement AutoGPT dans le traitement de tâches réellement complexes Figure b : Il surpasse AutoGPTXAgent et mène GPT-4 dans six tests de référence majeurs d'agent IA On peut voir que XAgent La conception du système peut libérer pleinement les capacités de base du GPT-4 et obtenir des résultats de tests et une préférence humaine extrêmement élevés (préférence humaine). Cela montre non seulement que XAgent fonctionne bien dans les tests d'IA traditionnels qui nécessitent une planification d'inférence, mais qu'il a également des performances plus élevées lors du traitement d'instructions réelles complexes AI Agent L'émergence de Big Model a permis à l'ensemble du secteur de voir l'orientation importante de la mise en œuvre de la technologie des grands modèles, qui peut réaliser l'exécution de tâches d'un ensemble complet de flux de travail sans avoir besoin d'une exploration rapide et complexe. En tant que « super-héros » grand modèle au potentiel illimité, XAgent peut devenir un « assistant personnel » pour chaque personne ordinaire. Cela peut nous aider à planifier notre emploi du temps, à organiser des itinéraires et à gérer le temps et l'allocation des ressources dans la vie et au travail. Il peut également utiliser de manière indépendante une variété d'outils de collecte, de traitement et d'analyse de données pour analyser de manière entièrement automatique des données massives et former des rapports, aidant ainsi les utilisateurs à obtenir efficacement des informations importantes. De plus, XAgent peut combiner des outils externes avec des algorithmes de planification autonomes pour prendre des décisions basées sur des informations environnementales afin d'obtenir une exécution des tâches plus efficace et plus précise. L'équipe R&D de XAgent est formée d'un certain nombre d'experts et d'universitaires dans le domaine des grands modèles de Wall-Facing Intelligence et du laboratoire THUNLP de l'Université Tsinghua. Ils s’apparentent plutôt aux « super-héros » des grands modèles. La raison pour laquelle cette réalisation innovante peut être lancée avec succès est que l'équipe a construit une série de grands modèles Infra innovants de pointe au cours du processus de recherche scientifique à long terme, solidifiant les bases techniques et repoussant les limites de l'innovation et R&D. Wallface Intelligence s'est associé au laboratoire NLP de l'Université Tsinghua et à la communauté open source OpenBMB pour créer une présentation écologique de grand modèle industrie-université-recherche « Trinity », et a proposé et publié plusieurs cadres et moteurs d'utilisation d'outils de grand modèle : XAgent étend la limite supérieure de la capacité des agents d'IA à effectuer des tâches complexes, nous permettant de voir la tendance de pointe et le potentiel illimité de l'intégration de la technologie des grands modèles dans la production et la vie.
Collaboration homme-machine : un nouveau paradigme d'interaction entre agents
Langage de communication efficace, appel d'outil super puissant
Libérez le potentiel des grands modèles et dépassez complètement AutoGPT
étend les limites des applications et une base technique solide
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!