


Surpassant largement AutoGPT, Wall-Facing Intelligence coopère avec le grand modèle open source « Superhero » XAgent du laboratoire Tsinghua NLP.
Récemment, Wall-Facing Intelligence, l'une des principales sociétés nationales de grands modèles d'intelligence artificielle, a fait un autre grand pas en avant. Elle s'est associée au Laboratoire PNL de l'Université Tsinghua pour développer et lancer conjointement le grand modèle "super-héros" -. XAgent.
Grâce au test de tâches, les capacités de traitement de XAgent dans des tâches réellement complexes ont complètement dépassé AutoGPT.
- Adresse du blog : https://blog.x-agent.net
- XAgent Qui est une « personne » ?
XAgent est un nouvel agent d'IA capable de résoudre des tâches complexes de manière autonome. Avec LLM comme noyau, il peut comprendre les instructions humaines, formuler des plans complexes et prendre des mesures de manière autonome. Les agents traditionnels sont généralement limités par des règles personnalisées par l'homme et ne peuvent résoudre des problèmes que dans une plage limitée. Ils ressemblent davantage à des « outils » à usage humain qu’à de véritables « agents autonomes » et sont difficiles à résoudre de manière autonome des problèmes complexes.
planification et prise de décision autonomes, lui permettant de fonctionner de manière indépendante et de découvrir de nouvelles stratégies et solutions sans être lié par des préréglages humains.
Ses capacités ont complètement dépassé AutoGPT, montrant une autonomie incroyable et des capacités de résolution de tâches complexes dans de nombreuses tâches de scène, élevant le niveau d'intelligence des agents IA à un nouveau niveau.
Puis la question revient : comment est-il mis en œuvre ?
Collaboration "cerveau gauche et droit", mécanisme à double cycleTout comme les humains ont un "cerveau gauche" et un "cerveau droit", lorsqu'ils traitent des tâches complexes, ils le considèrent généralement sous deux angles : "macro" et « micro ». Il est nécessaire de coordonner et de planifier la situation globale, ainsi que de la considérer au niveau de l'exécution.
Par rapport à AutoGPT, Wallface Intelligence et l'Université Tsinghua ont introduit de manière innovante un "
mécanisme à double boucle" dans la conception de XAgent :
Boucle externe : responsable de la situation globale Tâche planification, décomposant les tâches complexes en tâches simples et exploitables.
- Boucle intérieure : Responsable de l'exécution des tâches locales et concentration sur les détails.
- Grâce à la coopération du mécanisme à double boucle, XAgent est comme un « super-héros » dans le domaine des grands modèles. Il fait preuve d'un super professionnalisme et de riches compétences lorsqu'il traite différents aspects de tâches complexes. Tout comme "Captain America" dans l'univers Marvel, XAgent a à la fois un leadership global et une exécution méticuleuse.
"PlanAgent". Il divisera les tâches complexes en plusieurs tâches simples et supervisera le processus complet de résolution de problèmes.
Premièrement, il décompose une tâche complexe donnée en « sous-tâches » plus petites et plus faciles à gérer, génère un « plan initial
» et forme une séquence de tâches.Par la suite, il transmettra chaque sous-tâche à la boucle interne pour solution une par une. Au cours de ce processus, la boucle externe surveillera en permanence la progression et l'état de la tâche, et effectuera une « optimisation itérative
» sur les plans ultérieurs en fonction des commentaires.Dans la boucle interne, XAgent change rapidement d'identité, démontrant son professionnalisme en tant qu'« exécuteur » efficace (ToolAgent
) pour s'assurer que les sous-tâches délivrées par la boucle externe répondent aux attentes.Selon la nature de la sous-tâche, il peut récupérer des outils à partir de systèmes externes et résoudre la sous-tâche étape par étape. Une fois la sous-tâche terminée, elle générera un reflet du processus d'exécution de la sous-tâche en cours et le renverra à la boucle externe pour indiquer si la tâche en cours est terminée et les points d'optimisation potentiels dans l'exécution de la tâche. Comme le montre la figure, l'utilisateur a soumis le fichier iris.zip à XAgent pour que XAgent analyse les données. Comme vous pouvez le voir, XAgent décompose d'abord cette tâche en 4 sous-tâches via la boucle externe : Par la suite, lors de l'exécution de chaque sous-tâche, XAgent utilise habilement la lecture et l'écriture de fichiers, les commandes shell, le notebook python et les pandas correspondants, sci-kit learn, seaborn, matplotlib et d'autres bibliothèques d'analyse de données via la boucle interne, et même effectuer une analyse visuelle des données. Lors de l'exécution de la même tâche, AutoGPT n'a pas prévu de vérifier l'environnement Python et les bibliothèques associées, mais a directement commencé à écrire du code pour l'exécution, ce qui a entraîné des échecs et des rapports d'erreurs lorsque en utilisant des bibliothèques connexes. Une analyse sophistiquée des données n’a pas non plus été réalisée. Bien qu'AutoGPT ait dans une certaine mesure dépassé les limites du modèle GPT traditionnel, il présente toujours le phénomène d'erreurs d'exécution telles que des boucles infinies et des erreurs les appels qui nécessitent une intervention manuelle peuvent être résolus. XAgent a pris en compte les problèmes connexes dès le début de sa conception et a introduit un mécanisme d'interaction spécialement conçu pour améliorer la collaboration homme-machine : il peut interagir avec les utilisateurs de manière autonome et émettre des demandes d'intervention et de guidage de la part des humains. Pour un agent intelligent, « sa capacité à coopérer avec les humains » est également un indicateur important qui reflète son intelligence. Tout d'abord, XAgent dispose d'une interface intuitive qui permet aux utilisateurs de remplacer ou de modifier directement les suggestions qu'il fait, combinant efficacement l'efficacité de l'IA avec l'intuition et l'expertise humaines. Deuxièmement, face à des défis inconnus, XAgent a la capacité de « demander de l'aide aux humains ». Il recherchera des commentaires, des suggestions ou des conseils en temps réel auprès des utilisateurs pour garantir que même dans des domaines incertains, l'agent peut fonctionner. c'est le meilleur. Ce paradigme d'interaction intègre organiquement l'autonomie de l'IA avec la sagesse humaine, démontrant une nouvelle relation de collaboration entre les humains et XAgent. Comme le montre l'image, l'utilisateur souhaite que XAgent l'aide à recommander de délicieux restaurants pour faire la fête entre amis, mais aucune information spécifique et détaillée n'est fournie. À ce stade, XAgent peut se rendre compte que les informations actuellement fournies par l'utilisateur ne suffisent pas pour faire des recommandations, il fait donc une demande aux humains, demandant l'emplacement préféré de l'utilisateur, la fourchette budgétaire, les préférences gustatives, les tabous, etc. , et après avoir obtenu l'utilisateur, les restaurants recommandés sont fournis en fonction des commentaires. Mais AutoGPT a directement commencé à rechercher des informations sur les restaurants sur Internet pour obtenir des recommandations. Les résultats finaux recommandés étaient au mauvais endroit, ne tenaient pas compte du budget de l'utilisateur et ne répondaient pas à ses besoins. Indépendamment du mécanisme de fonctionnement à « double cycle » ou de la capacité interactive de « collaboration homme-machine », dans la conception globale de XAgent, Wallface Intelligence et l'équipe Tsinghua se sont concentrées sur fonctionnalités de base de l'intelligence telles que la stabilité, l'efficacité et la sécurité. Et la méthode de communication structurée est également l'un des facteurs importants dans la construction d'un agent intelligent fort et stable. XAgent utilise Function Call comme langage de communication interne, ce qui présente les avantages de structuration, de standardisation et d'unification. De plus, l'invocation d'outils est également l'une des capacités importantes pour évaluer si l'agent IA a la capacité de résoudre des problèmes complexes. XAgent dispose d'un moteur d'exécution d'outils original ToolServer dans sa conception, qui peut atteindre des capacités d'exécution d'outils plus sécurisées, efficaces et évolutives. Il fonctionne dans un environnement Docker isolé, garantissant que l'exécution de l'outil ne compromet pas la stabilité ou la sécurité du système principal. Cette conception apporte de multiples avantages : Les composants clés de ToolServer incluent : ToolServerNode, ToolServerMonitor et ToolServerManager, qui offrent de puissantes fonctionnalités dans les opérations d'exécution, l'inspection des nœuds, la gestion des cycles, etc. Actuellement, ToolSever de XAgent prend en charge FileSystemEnv, PythonNotoBook, WebEnv, ExecuteShell, RapidAPIEnv, AskHumanforHelp et d'autres outils. XAgent peut non seulement nous aider à effectuer quelques tâches simples, mais il peut même nous aider à former des modèles. Par exemple, les utilisateurs espèrent analyser les critiques de films et déterminer la qualité de l'évaluation du film par le public. À ce stade, XAgent téléchargera d'abord l'ensemble de données imdb pour entraîner un modèle BERT et utilisera le modèle BERT entraîné pour prédire les critiques de films. Après des tests dans une série de tâches, cela peut être vu (comme le montrent les figures a et b ci-dessous), basé sur les performances XAgent de GPT-4, dépasse celles du GPT-4 d'origine dans tous les tests de référence et surpasse AutoGPT dans tous les aspects. Ces tâches nécessitent une planification du raisonnement de l'agent et la capacité d'utiliser des outils externes, notamment : la capacité de répondre à des questions avec les moteurs de recherche (FreshQA+HotpotQA), la capacité de programmation Python (MBPP), la capacité de raisonnement mathématique (MATH) et l'interactivité. capacité de programmation (InterCode), capacité de raisonnement incarné (ALFWorld), tâches réelles complexes, etc. Figure b : Il surpasse AutoGPTXAgent et mène GPT-4 dans six tests de référence majeurs d'agent IA On peut voir que XAgent La conception du système peut libérer pleinement les capacités de base du GPT-4 et obtenir des résultats de tests et une préférence humaine extrêmement élevés (préférence humaine). Cela montre non seulement que XAgent fonctionne bien dans les tests d'IA traditionnels qui nécessitent une planification d'inférence, mais qu'il a également des performances plus élevées lors du traitement d'instructions réelles complexes AI Agent L'émergence de Big Model a permis à l'ensemble du secteur de voir l'orientation importante de la mise en œuvre de la technologie des grands modèles, qui peut réaliser l'exécution de tâches d'un ensemble complet de flux de travail sans avoir besoin d'une exploration rapide et complexe. En tant que « super-héros » grand modèle au potentiel illimité, XAgent peut devenir un « assistant personnel » pour chaque personne ordinaire. Cela peut nous aider à planifier notre emploi du temps, à organiser des itinéraires et à gérer le temps et l'allocation des ressources dans la vie et au travail. Il peut également utiliser de manière indépendante une variété d'outils de collecte, de traitement et d'analyse de données pour analyser de manière entièrement automatique des données massives et former des rapports, aidant ainsi les utilisateurs à obtenir efficacement des informations importantes. De plus, XAgent peut combiner des outils externes avec des algorithmes de planification autonomes pour prendre des décisions basées sur des informations environnementales afin d'obtenir une exécution des tâches plus efficace et plus précise. L'équipe R&D de XAgent est formée d'un certain nombre d'experts et d'universitaires dans le domaine des grands modèles de Wall-Facing Intelligence et du laboratoire THUNLP de l'Université Tsinghua. Ils s’apparentent plutôt aux « super-héros » des grands modèles. La raison pour laquelle cette réalisation innovante peut être lancée avec succès est que l'équipe a construit une série de grands modèles Infra innovants de pointe au cours du processus de recherche scientifique à long terme, solidifiant les bases techniques et repoussant les limites de l'innovation et R&D. Wallface Intelligence s'est associé au laboratoire NLP de l'Université Tsinghua et à la communauté open source OpenBMB pour créer une présentation écologique de grand modèle industrie-université-recherche « Trinity », et a proposé et publié plusieurs cadres et moteurs d'utilisation d'outils de grand modèle : XAgent étend la limite supérieure de la capacité des agents d'IA à effectuer des tâches complexes, nous permettant de voir la tendance de pointe et le potentiel illimité de l'intégration de la technologie des grands modèles dans la production et la vie.
Collaboration homme-machine : un nouveau paradigme d'interaction entre agents
Pictures
Langage de communication efficace, appel d'outil super puissant
Libérez le potentiel des grands modèles et dépassez complètement AutoGPT
Figure a : XAgent surpasse complètement AutoGPT dans le traitement de tâches réellement complexes
étend les limites des applications et une base technique solide
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

GO POINTER SYNTAXE ET ATTENDRE DES PROBLÈMES DANS LA BIBLIOTHÈQUE VIPER Lors de la programmation en langage Go, il est crucial de comprendre la syntaxe et l'utilisation des pointeurs, en particulier dans ...

Pourquoi l'itération de la carte dans GO fait-elle que toutes les valeurs deviennent le dernier élément? En langue go, face à des questions d'entrevue, vous rencontrez souvent des cartes ...

Il n'y a pas d'outil XML à PDF simple et direct sur mobile. Le processus de visualisation des données requis implique une compréhension et un rendu complexes des données, et la plupart des outils dits "gratuits" sur le marché ont une mauvaise expérience. Il est recommandé d'utiliser des outils côté informatique ou d'utiliser des services cloud, ou de développer vous-même des applications pour obtenir des effets de conversion plus fiables.

Dans le développement du langage GO, l'introduction correctement des packages personnalisés est une étape cruciale. Cet article ciblera "Golang ...

L'embellissement XML améliore essentiellement sa lisibilité, y compris l'indentation raisonnable, les pauses-lignes et l'organisation des étiquettes. Le principe est de traverser l'arbre XML, d'ajouter l'indentation en fonction du niveau et de gérer les balises et les balises vides contenant du texte. La bibliothèque XML.ETREE.ElementTree de Python fournit une fonction Pretty_xml () pratique qui peut implémenter le processus d'embellissement ci-dessus.

Pourquoi l'utilisation des serrures provoque-t-elle une panique de temps en temps? Jetons un coup d'œil à une question intéressante: pourquoi en Go, même si des verrous sont ajoutés dans le code, parfois ...

La validation du format XML consiste à vérifier sa structure et sa conformité avec DTD ou schéma. Un analyseur XML est requis, tel que ElementTree (Basic Syntax Heatking) ou LXML (vérification plus puissante, prise en charge XSD). Le processus de vérification implique l'analyse du fichier XML, le chargement du schéma XSD et l'exécution de la méthode AssertValid pour lancer une exception lorsqu'une erreur est détectée. La vérification du format XML nécessite également de gérer diverses exceptions et de mieux comprendre le langage du schéma XSD.

Le Array Char stocke des séquences de caractères en C et est déclaré Char Array_name [Taille]. L'élément d'accès est passé par l'opérateur d'indice, et l'élément se termine par le terminateur nul «\ 0», qui représente le point final de la chaîne. Le langage C fournit une variété de fonctions de manipulation de cordes, telles que strlen (), strcpy (), strcat () et strcmp ().
