Table des matières
HuggingGPT bridge
"Jarvis" est open source
Internaute : L'avenir de la recherche
Maison Périphériques technologiques IA ChatGPT peut choisir lui-même les modèles ! Le nouvel article de l'Institut de recherche Microsoft en Asie et de l'Université du Zhejiang, le projet HuggingGPT, est open source

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de l'Institut de recherche Microsoft en Asie et de l'Université du Zhejiang, le projet HuggingGPT, est open source

Apr 11, 2023 am 08:41 AM
系统 模型

L'engouement pour l'IA déclenché par ChatGPT a également "brûlé" le cercle financier.

Récemment, des chercheurs de Bloomberg ont également développé un GPT dans le domaine financier - Bloomberg GPT, avec 50 milliards de paramètres.

L'émergence de GPT-4 a donné à de nombreuses personnes un avant-goût des puissantes capacités des grands modèles de langage.

Cependant, OpenAI n'est pas ouvert. De nombreuses personnes dans l'industrie ont commencé à cloner GPT, et de nombreux modèles de remplacement de ChatGPT sont construits sur des modèles open source, en particulier le modèle open source Meta LLMa.

Par exemple, Stanford’s Alpaca, UC Berkeley ont fait équipe avec CMU, Stanford et autres Vicuna, Dolly de la startup Databricks, etc.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Divers modèles de langage à grande échelle de type ChatGPT, conçus pour différentes tâches et applications, sont en compétition entre des centaines d'écoles de pensée dans l'ensemble du domaine.

La question est alors de savoir comment les chercheurs choisissent-ils un modèle approprié, voire plusieurs modèles, pour accomplir une tâche complexe ?

Récemment, l'équipe de recherche de Microsoft Research Asia et de l'Université du Zhejiang a publié HuggingGPT, un système de collaboration à grande échelle.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Adresse papier : https://arxiv.org/pdf/2303.17580.pdf

HuggingGPT utilise ChatGPT comme contrôleur pour connecter divers modèles d'IA dans la communauté HuggingFace afin de compléter le complexe multimodal tâches.

Cela signifie que vous aurez une sorte de super magie. Grâce à HuggingGPT, vous pourrez disposer de capacités multimodales, notamment des images, des vidéos et des voix.

HuggingGPT bridge

Les chercheurs ont souligné que la résolution des problèmes actuels des grands modèles de langage (LLM) pourrait être la première et cruciale étape vers l'AGI.

Étant donné que la technologie actuelle des grands modèles de langage présente encore certaines lacunes, il existe des défis urgents sur la voie de la construction de systèmes AGI.

- Limités par les formes d'entrée et de sortie de génération de texte, les LLM actuels n'ont pas la capacité de traiter des informations complexes (telles que la vision et la parole)

- Dans des scénarios d'application pratiques, certaines tâches complexes sont généralement composé de plusieurs Il se compose de sous-tâches, nécessitant ainsi la planification et la collaboration de plusieurs modèles, ce qui dépasse également les capacités des modèles de langage

- Pour certaines tâches difficiles, les LLM fonctionnent bien en mode zéro ou ; réglages pour quelques prises de vues Excellents résultats, mais ils restent plus faibles que ceux de certains experts (comme les modèles affinés).

Pour gérer des tâches d'IA complexes, les LLM doivent être capables de se coordonner avec des modèles externes pour exploiter leurs capacités. Par conséquent, le point clé est de savoir comment choisir le middleware approprié pour relier les modèles LLM et IA.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Les chercheurs ont découvert que chaque modèle d'IA peut être exprimé sous forme de langage en résumant ses fonctions de modèle.

Ainsi, un concept est introduit, "Le langage, ce sont les LLM, à savoir ChatGPT, une interface universelle pour connecter des modèles d'intelligence artificielle."

En incorporant des descriptions de modèles d'IA dans les invites, ChatGPT peut être considéré comme le cerveau de la gestion des modèles d'IA. Par conséquent, cette méthode permet à ChatGPT d'appeler des modèles externes pour résoudre des tâches pratiques.

Pour parler simplement, HuggingGPT est un système de collaboration, pas un grand modèle.

Sa fonction est de connecter ChatGPT et HuggingFace pour traiter les entrées dans différentes modalités et résoudre de nombreuses tâches complexes d'intelligence artificielle.

Ainsi, chaque modèle d'IA de la communauté HuggingFace a une description de modèle correspondante dans la bibliothèque HuggingGPT et est intégrée dans l'invite pour établir une connexion avec ChatGPT.

HuggingGPT utilise ensuite ChatGPT comme cerveau pour déterminer la réponse à la question.

Jusqu'à présent, HuggingGPT a intégré des centaines de modèles sur HuggingFace autour de ChatGPT, couvrant 24 modèles comprenant la classification de texte, la détection de cible, la segmentation sémantique, la génération d'images, les questions et réponses, la synthèse vocale, la synthèse textuelle, etc. Tâche.

Les résultats expérimentaux prouvent que HuggingGPT a la capacité de gérer des informations multimodales et des tâches complexes d'intelligence artificielle.

four du flux de travail en passant tâches en plusieurs étapes et planifie la séquence de tâches et les dépendances en fonction de ses connaissances

- Sélection du modèle : LLM attribue les tâches analysées à des modèles experts en fonction de la description du modèle dans HuggingFace

- Exécution des tâches : Expert Le modèle exécute les tâches assignées sur le point de terminaison d'inférence et enregistre les informations d'exécution et les résultats d'inférence dans LLM

- Génération de réponse : LLM résume les journaux du processus d'exécution et les résultats d'inférence et renvoie le résumé à l'utilisateur

Capacités multimodales, avec

Paramètres expérimentaux

Dans l'expérience, les chercheurs ont utilisé deux variantes du modèle GPT, gpt-3.5-turbo et text-davinci-003, comme grand- des modèles de langages à l'échelle (LLM), qui sont accessibles au public via l'API OpenAI.

Afin de rendre la sortie de LLM plus stable, nous définissons la température de décodage sur 0.

En même temps, afin d'ajuster la sortie de LLM pour qu'elle corresponde au format attendu, nous définissons logit_bias à 0,1 sur la contrainte de format.

Les chercheurs fournissent des invites détaillées conçues pour les phases de planification de mission, de sélection de modèle et de génération de réaction dans le tableau suivant, où {{variable}} indique que l'invite doit être remplie avec le texte correspondant avant d'être saisie. dans la valeur du domaine LLM.

Les chercheurs ont testé HuggingGPT sur un large éventail de tâches multimodales.

Avec la coopération de ChatGP et de modèles experts, HuggingGPT peut résoudre des tâches dans plusieurs modes tels que le langage, l'image, l'audio et la vidéo, y compris la détection, la génération, la classification et la réponse aux questions.

Bien que ces tâches semblent simples, maîtriser les capacités de base de HuggingGPT est une condition préalable pour résoudre des tâches complexes.

Par exemple, tâche visuelle de questions et réponses :

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Génération de texte :

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Vincent photo :

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

HuggingGPT peut intégrer plusieurs Faire des inférences simples basées sur le contenu d'entrée. On peut constater que même s'il existe plusieurs ressources de tâches, HuggingGPT peut décomposer la tâche principale en plusieurs tâches de base et enfin intégrer les résultats d'inférence de plusieurs modèles pour obtenir la bonne réponse.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

De plus, les chercheurs ont évalué l'efficacité de HuggingGPT dans des situations de tâches complexes au moyen de tests.

a démontré la capacité de HuggingGPT à gérer plusieurs tâches complexes.

Lors du traitement de plusieurs demandes, elles peuvent contenir plusieurs tâches ou besoins implicites et d'autres informations. À l'heure actuelle, il ne suffit pas de s'appuyer sur un modèle expert pour résoudre le problème.

HuggingGPT peut organiser la collaboration de plusieurs modèles grâce à la planification des tâches.

Une demande utilisateur peut explicitement contenir plusieurs tâches :

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

La figure suivante montre la capacité de HuggingGPT à gérer des tâches complexes dans un scénario de conversation à plusieurs tours.

Les utilisateurs divisent une demande complexe en plusieurs étapes et atteignent l'objectif final grâce à plusieurs séries de demandes. Il a été constaté que HuggingGPT peut suivre l'état de la situation des demandes des utilisateurs grâce à la gestion de la situation de dialogue au cours de la phase de planification des tâches, et peut bien résoudre les ressources demandées et la planification des tâches mentionnées par les utilisateurs.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

"Jarvis" est open source

Actuellement, ce projet est open source sur GitHub, mais le code n'a pas été entièrement publié.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Fait intéressant, les chercheurs ont nommé ce projet Jarvis dans "Iron Man", et l'IA invincible est là.

JARVIS : Un système connectant les LLM et les communautés ML

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

D'ailleurs, HuggingGPT nécessite l'utilisation de l'API OpenAI.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Internaute : L'avenir de la recherche

JARVIS / HuggingGPT, comme le Toolformer proposé par Meta précédemment, fait office de connecteur.

Même, y compris les plugins ChatGPT.

Un internaute a déclaré : « Je soupçonne fortement que la première intelligence générale artificielle (AGI) apparaîtra plus tôt que prévu. Elle s'appuiera sur une intelligence artificielle « colle » qui peut combiner intelligemment une série d'intelligence artificielle étroite et de pratiques. Les outils sont collés ensemble.

J'ai eu accès au module complémentaire, qui m'a transformé du jour au lendemain d'un noob en mathématiques à un génie des mathématiques. Bien sûr, ce n’est qu’un petit pas, mais c’est un signe des tendances de développement futures.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Je prédis que dans l'année prochaine, nous verrons un assistant IA connecté à des dizaines de grands modèles de langage (LLM) et d'outils similaires, et à l'utilisateur final uniquement. Ils doivent donner des instructions à leurs assistants pour accomplir des tâches à leur place. Ce moment de science-fiction arrive.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Certains internautes ont dit que c'était la future méthode de recherche.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

GPT Devant beaucoup d'outils, vous savez les utiliser.

ChatGPT peut choisir lui-même les modèles ! Le nouvel article de lInstitut de recherche Microsoft en Asie et de lUniversité du Zhejiang, le projet HuggingGPT, est open source

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Repo: Comment relancer ses coéquipiers
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

Le système de conduite intelligent Qiankun ADS3.0 de Huawei sera lancé en août et sera lancé pour la première fois sur Xiangjie S9 Le système de conduite intelligent Qiankun ADS3.0 de Huawei sera lancé en août et sera lancé pour la première fois sur Xiangjie S9 Jul 30, 2024 pm 02:17 PM

Le 29 juillet, lors de la cérémonie de lancement de la 400 000e nouvelle voiture d'AITO Wenjie, Yu Chengdong, directeur général de Huawei, président de Terminal BG et président de la BU Smart Car Solutions, a assisté et prononcé un discours et a annoncé que les modèles de la série Wenjie seraient sera lancé cette année En août, la version Huawei Qiankun ADS 3.0 a été lancée et il est prévu de pousser successivement les mises à niveau d'août à septembre. Le Xiangjie S9, qui sortira le 6 août, lancera le système de conduite intelligent ADS3.0 de Huawei. Avec l'aide du lidar, la version Huawei Qiankun ADS3.0 améliorera considérablement ses capacités de conduite intelligente, disposera de capacités intégrées de bout en bout et adoptera une nouvelle architecture de bout en bout de GOD (identification générale des obstacles)/PDP (prédictive prise de décision et contrôle), fournissant la fonction NCA de conduite intelligente d'une place de stationnement à l'autre et mettant à niveau CAS3.0

KAN, qui remplace MLP, a été étendu à la convolution par des projets open source KAN, qui remplace MLP, a été étendu à la convolution par des projets open source Jun 01, 2024 pm 10:03 PM

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Bonjour, Atlas électrique ! Le robot Boston Dynamics revient à la vie, des mouvements étranges à 180 degrés effraient Musk Bonjour, Atlas électrique ! Le robot Boston Dynamics revient à la vie, des mouvements étranges à 180 degrés effraient Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas entre officiellement dans l’ère des robots électriques ! Hier, l'Atlas hydraulique s'est retiré "en larmes" de la scène de l'histoire. Aujourd'hui, Boston Dynamics a annoncé que l'Atlas électrique était au travail. Il semble que dans le domaine des robots humanoïdes commerciaux, Boston Dynamics soit déterminé à concurrencer Tesla. Après la sortie de la nouvelle vidéo, elle a déjà été visionnée par plus d’un million de personnes en seulement dix heures. Les personnes âgées partent et de nouveaux rôles apparaissent. C'est une nécessité historique. Il ne fait aucun doute que cette année est l’année explosive des robots humanoïdes. Les internautes ont commenté : Les progrès des robots ont fait ressembler la cérémonie d'ouverture de cette année à des êtres humains, et le degré de liberté est bien plus grand que celui des humains. Mais n'est-ce vraiment pas un film d'horreur ? Au début de la vidéo, Atlas est allongé calmement sur le sol, apparemment sur le dos. Ce qui suit est à couper le souffle

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

L'IA bouleverse la recherche mathématique ! Le lauréat de la médaille Fields et mathématicien sino-américain a dirigé 11 articles les mieux classés | Aimé par Terence Tao L'IA bouleverse la recherche mathématique ! Le lauréat de la médaille Fields et mathématicien sino-américain a dirigé 11 articles les mieux classés | Aimé par Terence Tao Apr 09, 2024 am 11:52 AM

L’IA change effectivement les mathématiques. Récemment, Tao Zhexuan, qui a prêté une attention particulière à cette question, a transmis le dernier numéro du « Bulletin de l'American Mathematical Society » (Bulletin de l'American Mathematical Society). En se concentrant sur le thème « Les machines changeront-elles les mathématiques ? », de nombreux mathématiciens ont exprimé leurs opinions. L'ensemble du processus a été plein d'étincelles, intense et passionnant. L'auteur dispose d'une équipe solide, comprenant Akshay Venkatesh, lauréat de la médaille Fields, le mathématicien chinois Zheng Lejun, l'informaticien de l'Université de New York Ernest Davis et de nombreux autres universitaires bien connus du secteur. Le monde de l’IA a radicalement changé. Vous savez, bon nombre de ces articles ont été soumis il y a un an.

FisheyeDetNet : le premier algorithme de détection de cible basé sur une caméra fisheye FisheyeDetNet : le premier algorithme de détection de cible basé sur une caméra fisheye Apr 26, 2024 am 11:37 AM

La détection de cibles est un problème relativement mature dans les systèmes de conduite autonome, parmi lesquels la détection des piétons est l'un des premiers algorithmes à être déployés. Des recherches très complètes ont été menées dans la plupart des articles. Cependant, la perception de la distance à l’aide de caméras fisheye pour une vue panoramique est relativement moins étudiée. En raison de la distorsion radiale importante, la représentation standard du cadre de délimitation est difficile à mettre en œuvre dans les caméras fisheye. Pour alléger la description ci-dessus, nous explorons les conceptions étendues de boîtes englobantes, d'ellipses et de polygones généraux dans des représentations polaires/angulaires et définissons une métrique de segmentation d'instance mIOU pour analyser ces représentations. Le modèle fisheyeDetNet proposé avec une forme polygonale surpasse les autres modèles et atteint simultanément 49,5 % de mAP sur l'ensemble de données de la caméra fisheye Valeo pour la conduite autonome.

Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! May 06, 2024 pm 04:13 PM

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

See all articles