Les performances de l'agent découvert basé sur l'ADAS surpassent considérablement les lignes de base de pointe conçues à la main.
Les modèles fondamentaux (FM) tels que GPT et Claude deviennent un support solide pour les agents à usage général et sont de plus en plus utilisés pour une variété de tâches de raisonnement et de planification.
Cependant, lors de la résolution de problèmes, les agents requis sont généralement des systèmes d'agents composites avec plusieurs composants plutôt que des requêtes de modèle monolithique. De plus, pour que les agents puissent résoudre des tâches complexes du monde réel, ils ont souvent besoin d'accéder à des outils externes tels que les moteurs de recherche, l'exécution de code et les requêtes de bases de données.
Par conséquent, de nombreux éléments de base efficaces pour les systèmes d'agents ont été proposés, tels que la planification et le raisonnement de la chaîne de pensée, les structures de mémoire, l'utilisation d'outils et l'auto-réflexion. Bien que ces agents aient connu un succès remarquable dans diverses applications, le développement de ces éléments de base et leur combinaison dans des systèmes d'agents complexes nécessitent souvent un réglage manuel spécifique au domaine et des efforts considérables de la part des chercheurs et des ingénieurs.
Cependant, l'histoire de l'apprentissage automatique nous dit que les solutions conçues à la main finiront par être remplacées par des solutions apprises par des modèles.
Dans cet article, des chercheurs de l'Université de la Colombie-Britannique et de l'institut de recherche à but non lucratif sur l'intelligence artificielle Vector Institute ont formulé un nouveau domaine de recherche, à savoir la conception automatisée de systèmes agentiques (ADAS), et ont proposé un algorithme ADAS simple mais efficace. appelé Meta Agent Search pour prouver que les agents peuvent inventer des conceptions d'agents nouvelles et puissantes grâce à la programmation de code.
Cette recherche vise à créer automatiquement des conceptions de systèmes d'agents puissants, notamment en développant de nouveaux éléments de base et en les combinant de nouvelles manières.
Les expériences montrent que les performances des agents découverts sur la base de l'ADAS surpassent considérablement les lignes de base de pointe conçues à la main. Par exemple, l'agent conçu dans cet article a amélioré le score F1 de 13,6/100 (par rapport à la ligne de base) dans la tâche de compréhension écrite de DROP, et a amélioré la précision de 14,4 % dans la tâche mathématique de MGSM. De plus, après le transfert entre domaines, leur précision sur les tâches mathématiques GSM8K et GSM-Hard s'améliore respectivement de 25,9 % et 13,2 % par rapport à la ligne de base.
Comparé aux solutions conçues manuellement, l'algorithme de cet article fonctionne bien, ce qui illustre le potentiel de l'ADAS dans la conception de systèmes d'agents automatisés. En outre, les expériences montrent que les agents découverts fonctionnent bien non seulement lors du transfert entre des domaines similaires, mais également lors du transfert entre des domaines différents, comme des mathématiques à la compréhension écrite.
Adresse papier : https://arxiv.org/pdf/2408.08435
Adresse du projet : https://github.com/ShengranHu/ADAS
Page d'accueil papier : https:// www.shengranhu.com/ADAS/
Titre de l'article : Conception automatisée de systèmes agentiques
Nouveau domaine de recherche : Conception automatisée de systèmes agentiques (ADAS)
Cette étude propose un nouveau domaine de recherche ——Automatisé Conception de systèmes agentiques (ADAS) et décrit les trois composants clés de l'algorithme ADAS : l'espace de recherche, l'algorithme de recherche et la fonction d'évaluation. ADAS utilise des algorithmes de recherche pour découvrir les systèmes d'agents dans l'espace de recherche.
Espace de recherche : L'espace de recherche définit quels systèmes d'agents peuvent être caractérisés et découverts dans ADAS. Par exemple, un travail comme PromptBreeder (Fernando et al., 2024) ne modifie que les invites textuelles de l'agent, tandis que les autres composants (par exemple, le flux de contrôle) restent inchangés. Par conséquent, dans l’espace de recherche, il est impossible de caractériser un agent avec un flux de contrôle différent du flux de contrôle prédéfini.
Algorithme de recherche : L'algorithme de recherche définit la manière dont l'algorithme ADAS explore l'espace de recherche. Étant donné que les espaces de recherche sont souvent très vastes, voire illimités, le compromis entre exploration et exploitation doit être pris en compte (Sutton et Barto, 2018). Idéalement, cet algorithme peut découvrir rapidement des systèmes d’agents performants tout en évitant de tomber dans les optima locaux. Les méthodes existantes incluent l'utilisation de l'apprentissage par renforcement (Zhuge et al., 2024) ou du FM qui génère de manière itérative de nouvelles solutions (Fernando et al., 2024) comme algorithmes de recherche.
Fonction d'évaluation : En fonction de l'application de l'algorithme ADAS, différents objectifs d'optimisation peuvent devoir être pris en compte, tels que les performances, le coût, la latence ou la sécurité de l'agent. La fonction d'évaluation définit comment évaluer ces métriques pour un agent candidat. Par exemple, pour évaluer les performances d'un agent sur des données invisibles, une approche simple consiste à calculer la précision des données de validation des tâches.
Le concept de base de l'algorithme ADAS simple mais efficace proposé dans cette étude - la recherche de méta-agents consiste à demander au méta-agent de créer de manière itérative de nouveaux agents intéressants, de les évaluer, de les ajouter au référentiel d'agents et de les utiliser. Le référentiel aide le méta-agent crée de nouveaux agents plus intéressants dans les itérations suivantes. Semblable aux algorithmes ouverts existants qui exploitent le concept d’intérêt humain, cette recherche encourage les agents méta-agents à explorer des agents intéressants et précieux.
L'idée principale de la recherche de méta-agents est d'utiliser FM comme algorithme de recherche pour programmer de manière itérative de nouveaux agents intéressants sur la base d'un référentiel d'agents en pleine croissance. L'étude définit un cadre simple (dans les 100 lignes de code) pour le méta-agent, lui fournissant un ensemble de fonctionnalités de base, telles que des requêtes FM ou des conseils de formatage.
Par conséquent, le méta-agent n'a besoin que d'écrire une fonction "forward" pour définir un nouveau système d'agents, similaire à ce qui se fait dans FunSearch (Romera-Paredes et al., 2024). Cette fonction reçoit des informations sur la tâche et génère la réponse de l'agent à la tâche.
Comme le montre la figure 1, l'idée principale de la recherche de méta-agents est de permettre au méta-agent de programmer de manière itérative de nouveaux agents dans le code. Programme méta-agent L'invite principale pour un nouveau programme d'agent est présentée ci-dessous, avec les variables de l'invite en surbrillance.
Expériences
Tous les résultats expérimentaux montrent que l'agent découvert dans cet article surpasse considérablement les agents de pointe conçus à la main. Notamment, l’agent trouvé dans cette étude s’est amélioré de 13,6/100 (score F1) par rapport à la ligne de base pour la tâche de compréhension en lecture DROP et de 14,4 % (précision) pour la tâche mathématique MGSM. De plus, l'agent découvert par les chercheurs a amélioré ses performances sur la tâche ARC de 14 % (précision) par rapport à la ligne de base après la migration de GPT-3.5 vers GPT-4 et lors de la migration des tâches mathématiques MGSM vers GSM8K et GSM-Hard. Après la tâche mathématique réalisée, la précision a augmenté respectivement de 25,9 % et 13,2 %.
Étude de cas : ARC Challenge
Comme le montre la figure 3a, la recherche de méta-agents peut découvrir efficacement et progressivement des agents qui surpassent les derniers agents conçus à la main. Les avancées importantes sont mises en évidence dans la zone de texte.
De plus, la figure 3b montre le meilleur agent découvert, où un mécanisme de rétroaction complexe a été utilisé pour affiner la réponse plus efficacement. Un examen plus attentif de l’avancée des recherches révèle que ce mécanisme de rétroaction complexe n’est pas apparu soudainement.
Domaines de raisonnement et de résolution de problèmes
Les résultats dans plusieurs domaines montrent que la recherche de méta-agents peut découvrir des agents plus performants que les agents conçus manuellement par SOTA (Tableau 1).
Généralisation et transférabilité
Les chercheurs ont en outre démontré la transférabilité et la généralisabilité de l'agent découvert.
Comme le montre le tableau 2, les chercheurs ont observé que l'agent recherché était toujours meilleur que l'agent conçu à la main, et que l'écart était grand. Il convient de noter que les chercheurs ont constaté que le modèle le plus puissant d’Anthropic, Claude-Sonnet, était le plus performant parmi tous les modèles testés, permettant aux agents basés sur ce modèle d’atteindre une précision de près de 50 % sur l’ARC.
Comme le montre le tableau 3, les chercheurs ont observé que les performances de la recherche de méta-agents présentent des avantages similaires par rapport à la ligne de base. Il convient de noter que par rapport à la référence, la précision de notre agent sur GSM8K et GSM-Hard a augmenté respectivement de 25,9 % et 13,2 %.
Plus surprenant encore, les chercheurs ont observé que les agents découverts dans le domaine mathématique peuvent être transférés vers des domaines non mathématiques (Tableau 4).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!