communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison

Périphériques technologiques

IA

Le framework open source MetaGPT est devenu populaire sur GitHub, atteignant 11 000 étoiles, simulant le processus de développement logiciel

Le framework open source MetaGPT est devenu populaire sur GitHub, atteignant 11 000 étoiles, simulant le processus de développement logiciel

PHPz

Aug 09, 2023 pm 10:53 PM

智能开源

Avec le développement continu des grands modèles de langage (LLM), les utiliser pour construire des agents d'IA est devenu un nouveau domaine de recherche. Des recherches antérieures ont utilisé avec succès le LLM pour amener des agents multi-agents à accomplir de manière autonome certaines tâches. Cependant, les recherches actuelles se concentrent principalement sur des tâches simples et n'explorent pas suffisamment les tâches complexes. C'est principalement parce que les grands modèles de langage ont des problèmes d'"illusion", en particulier lorsque plusieurs agents interagissent, le problème d'hallucination sera plus grave, ce qui rendra impossible l'application à des tâches complexes

Récemment, un framework open source appelé "MetaGPT" a essayé pour résoudre ce problème. L'objectif de MetaGPT est d'injecter un flux de travail humain efficace dans la collaboration multi-agents pilotée par LLM en tant qu'approche de méta-programmation. MetaGPT a rapidement gagné plus de 11,1k étoiles quelques jours après sa mise en ligne

L'URL de ce projet est : https://github.com/geekan/MetaGPT MetaGPT开源框架爆红 GitHub，达到1.1万星，模拟软件开发流程

En un mot, MetaGPT Simulate le flux de travail d'une société de développement de logiciels, nécessitant l'attribution de rôles à chaque agent et la planification du processus de collaboration, similaire à la situation d'allocation du personnel d'une société de développement de logiciels

MetaGPT intègre d'abord la procédure opérationnelle standardisée (SOP) dans l'invite , structurant ainsi le processus collaboratif de plusieurs agents. Ensuite, l'équipe de recherche a encore modularisé le résultat, donnant à l'agent une expertise du domaine équivalente à celle des travailleurs humains pour vérifier le résultat et réduire les erreurs composées. MetaGPT attribue des rôles à différents agents via un pipeline de travail, construisant ainsi un cadre capable de résoudre efficacement des problèmes complexes. problèmes de collaboration multi-agents et le rendre plus cohérent MetaGPT开源框架爆红 GitHub，达到1.1万星，模拟软件开发流程

En prenant le développement d'un moteur de recommandation comme exemple, l'équipe de recherche a montré que "l'agent architecte" dans MetaGPT générait indépendamment la conception de l'interface système, il s'agit d'une étape cruciale pour le logiciel développement

MetaGPT开源框架爆红 GitHub，达到1.1万星，模拟软件开发流程

MetaGPT est capable d'effectuer diverses tâches complexes, telles que le développement de logiciels de jeu simples, et son processus d'exécution de tâches peut être comparé aux normes des développeurs humains. Correspondance un à un entre les procédures opérationnelles (SOP)

MetaGPT开源框架爆红 GitHub，达到1.1万星，模拟软件开发流程

Une fois que MetaGPT a reçu les exigences de saisie de l'utilisateur, l'agent assume le rôle de chef de produit et analyse les exigences et la faisabilité. L'agent agit ensuite en tant qu'architecte, chef de projet et ingénieur, réalisant le développement du logiciel en séquence. Enfin, un autre agent est responsable des tests complets du logiciel. Ce processus simule très bien le processus de développement réel. Examinons un cas où MetaGPT accomplit une tâche de développement spécifique. Les utilisateurs n'ont qu'à fournir une exigence, telle que "Écrire un jeu de blackjack", MetaGPT passera par l'analyse des exigences et la planification des tâches, et générera avec succès le code du jeu

MetaGPT开源框架爆红 GitHub，达到1.1万星，模拟软件开发流程

L'équipe de recherche a indiqué dans la feuille de route du projet : Plan MetaGPT pour réaliser de manière indépendante des projets de taille moyenne (environ 2 000 lignes de code) à court terme, et finalement atteindre la capacité de former, affiner, optimiser, appliquer et mettre à jour de manière indépendante

MetaGPT开源框架爆红 GitHub，达到1.1万星，模拟软件开发流程

MetaGPT a publié un article intitulé « METAGPT: META PROGRAMMING FOR MULTI-AGENT COLLABORATIVE FRAMEWORK » document de recherche

MetaGPT开源框架爆红 GitHub，达到1.1万星，模拟软件开发流程

L'article peut être consulté sur le lien suivant : https://arxiv.org/pdf/2308.00352.pdf

Les lecteurs intéressés peuvent consulter l'article pour avoir une compréhension approfondie du sujet de recherche.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7469

15

Tutoriel CakePHP

1376

52

Quel est le format du nom de compte de Steam

77

11

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

48

19

NYT Connexions Indices et réponses

19

29

Afficher plus

Related knowledge

Dix outils d'annotation de texte gratuits open source recommandés

Dix outils d'annotation de texte gratuits open source recommandés Mar 26, 2024 pm 08:20 PM

L'annotation de texte est le travail d'étiquettes ou de balises correspondant à un contenu spécifique dans le texte. Son objectif principal est d’apporter des informations complémentaires au texte pour une analyse et un traitement plus approfondis, notamment dans le domaine de l’intelligence artificielle. L'annotation de texte est cruciale pour les tâches d'apprentissage automatique supervisées dans les applications d'intelligence artificielle. Il est utilisé pour entraîner des modèles d'IA afin de mieux comprendre les informations textuelles en langage naturel et d'améliorer les performances de tâches telles que la classification de texte, l'analyse des sentiments et la traduction linguistique. Grâce à l'annotation de texte, nous pouvons apprendre aux modèles d'IA à reconnaître les entités dans le texte, à comprendre le contexte et à faire des prédictions précises lorsque de nouvelles données similaires apparaissent. Cet article recommande principalement de meilleurs outils d'annotation de texte open source. 1.LabelStudiohttps://github.com/Hu

15 outils d'annotation d'images gratuits open source recommandés

15 outils d'annotation d'images gratuits open source recommandés Mar 28, 2024 pm 01:21 PM

L'annotation d'images est le processus consistant à associer des étiquettes ou des informations descriptives à des images pour donner une signification et une explication plus profondes au contenu de l'image. Ce processus est essentiel à l’apprentissage automatique, qui permet d’entraîner les modèles de vision à identifier plus précisément les éléments individuels des images. En ajoutant des annotations aux images, l'ordinateur peut comprendre la sémantique et le contexte derrière les images, améliorant ainsi la capacité de comprendre et d'analyser le contenu de l'image. L'annotation d'images a un large éventail d'applications, couvrant de nombreux domaines, tels que la vision par ordinateur, le traitement du langage naturel et les modèles de vision graphique. Elle a un large éventail d'applications, telles que l'assistance aux véhicules pour identifier les obstacles sur la route, en aidant à la détection. et le diagnostic des maladies grâce à la reconnaissance d'images médicales. Cet article recommande principalement de meilleurs outils d'annotation d'images open source et gratuits. 1.Makesens

Les traits du visage volent, ouvrent la bouche, regardent fixement et lèvent les sourcils. L'IA peut les imiter parfaitement, ce qui rend impossible la prévention des escroqueries vidéo.

Les traits du visage volent, ouvrent la bouche, regardent fixement et lèvent les sourcils. L'IA peut les imiter parfaitement, ce qui rend impossible la prévention des escroqueries vidéo. Dec 14, 2023 pm 11:30 PM

Avec une capacité d'imitation de l'IA aussi puissante, il est vraiment impossible de l'empêcher. Le développement de l’IA a-t-il atteint ce niveau aujourd’hui ? Votre pied avant fait voler les traits de votre visage, et sur votre pied arrière, la même expression est reproduite. Regarder fixement, lever les sourcils, faire la moue, aussi exagérée que soit l'expression, tout est parfaitement imité. Augmentez la difficulté, haussez les sourcils, ouvrez plus grand les yeux, et même la forme de la bouche est tordue, et l'avatar du personnage virtuel peut parfaitement reproduire l'expression. Lorsque vous ajustez les paramètres à gauche, l'avatar virtuel à droite modifiera également ses mouvements en conséquence pour donner un gros plan de la bouche et des yeux. On ne peut pas dire que l'imitation soit exactement la même, seule l'expression est exactement la même. idem (extrême droite). La recherche provient d'institutions telles que l'Université technique de Munich, qui propose GaussianAvatars, qui

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Apr 03, 2024 am 11:55 AM

La technologie de détection et de reconnaissance des visages est déjà une technologie relativement mature et largement utilisée. Actuellement, le langage d'application Internet le plus utilisé est JS. La mise en œuvre de la détection et de la reconnaissance faciale sur le front-end Web présente des avantages et des inconvénients par rapport à la reconnaissance faciale back-end. Les avantages incluent la réduction de l'interaction réseau et de la reconnaissance en temps réel, ce qui réduit considérablement le temps d'attente des utilisateurs et améliore l'expérience utilisateur. Les inconvénients sont les suivants : il est limité par la taille du modèle et la précision est également limitée ; Comment utiliser js pour implémenter la détection de visage sur le web ? Afin de mettre en œuvre la reconnaissance faciale sur le Web, vous devez être familier avec les langages et technologies de programmation associés, tels que JavaScript, HTML, CSS, WebRTC, etc. Dans le même temps, vous devez également maîtriser les technologies pertinentes de vision par ordinateur et d’intelligence artificielle. Il convient de noter qu'en raison de la conception du côté Web

Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA

Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA Apr 02, 2024 am 11:31 AM

Nouveau SOTA pour des capacités de compréhension de documents multimodaux ! L'équipe Alibaba mPLUG a publié le dernier travail open source mPLUG-DocOwl1.5, qui propose une série de solutions pour relever les quatre défis majeurs que sont la reconnaissance de texte d'image haute résolution, la compréhension générale de la structure des documents, le suivi des instructions et l'introduction de connaissances externes. Sans plus tarder, examinons d’abord les effets. Reconnaissance et conversion en un clic de graphiques aux structures complexes au format Markdown : Des graphiques de différents styles sont disponibles : Une reconnaissance et un positionnement de texte plus détaillés peuvent également être facilement traités : Des explications détaillées sur la compréhension du document peuvent également être données : Vous savez, « Compréhension du document " est actuellement un scénario important pour la mise en œuvre de grands modèles linguistiques. Il existe de nombreux produits sur le marché pour aider à la lecture de documents. Certains d'entre eux utilisent principalement des systèmes OCR pour la reconnaissance de texte et coopèrent avec LLM pour le traitement de texte.

Fraichement publié! Un modèle open source pour générer des images de style anime en un seul clic

Fraichement publié! Un modèle open source pour générer des images de style anime en un seul clic Apr 08, 2024 pm 06:01 PM

Permettez-moi de vous présenter le dernier projet open source AIGC-AnimagineXL3.1. Ce projet est la dernière itération du modèle texte-image sur le thème de l'anime, visant à offrir aux utilisateurs une expérience de génération d'images d'anime plus optimisée et plus puissante. Dans AnimagineXL3.1, l'équipe de développement s'est concentrée sur l'optimisation de plusieurs aspects clés pour garantir que le modèle atteigne de nouveaux sommets en termes de performances et de fonctionnalités. Premièrement, ils ont élargi les données d’entraînement pour inclure non seulement les données des personnages du jeu des versions précédentes, mais également les données de nombreuses autres séries animées bien connues dans l’ensemble d’entraînement. Cette décision enrichit la base de connaissances du modèle, lui permettant de mieux comprendre les différents styles et personnages d'anime. AnimagineXL3.1 introduit un nouvel ensemble de balises et d'esthétiques spéciales

Une seule carte exécute Llama 70B plus rapidement que deux cartes, Microsoft vient de mettre le FP6 dans l'Open source A100 |

Une seule carte exécute Llama 70B plus rapidement que deux cartes, Microsoft vient de mettre le FP6 dans l'Open source A100 | Apr 29, 2024 pm 04:55 PM

Le FP8 et la précision de quantification inférieure en virgule flottante ne sont plus le « brevet » du H100 ! Lao Huang voulait que tout le monde utilise INT8/INT4, et l'équipe Microsoft DeepSpeed a commencé à exécuter FP6 sur A100 sans le soutien officiel de NVIDIA. Les résultats des tests montrent que la quantification FP6 de la nouvelle méthode TC-FPx sur A100 est proche ou parfois plus rapide que celle de INT4, et a une précision supérieure à celle de cette dernière. En plus de cela, il existe également une prise en charge de bout en bout des grands modèles, qui ont été open source et intégrés dans des cadres d'inférence d'apprentissage profond tels que DeepSpeed. Ce résultat a également un effet immédiat sur l'accélération des grands modèles : dans ce cadre, en utilisant une seule carte pour exécuter Llama, le débit est 2,65 fois supérieur à celui des cartes doubles. un

1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT

1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT Mar 11, 2024 pm 12:07 PM

Adresse papier : https://arxiv.org/abs/2307.09283 Adresse code : https://github.com/THU-MIG/RepViTRepViT fonctionne bien dans l'architecture ViT mobile et présente des avantages significatifs. Ensuite, nous explorons les contributions de cette étude. Il est mentionné dans l'article que les ViT légers fonctionnent généralement mieux que les CNN légers sur les tâches visuelles, principalement en raison de leur module d'auto-attention multi-têtes (MSHA) qui permet au modèle d'apprendre des représentations globales. Cependant, les différences architecturales entre les ViT légers et les CNN légers n'ont pas été entièrement étudiées. Dans cette étude, les auteurs ont intégré des ViT légers dans le système efficace.

See all articles