Table des matières

Comment laisser les grands modèles « commander » diverses IA ?

Un ensemble de modèles d'IA par défaut a été configuré

Maison

Laissez ChatGPT appeler plus de 100 000 modèles d'IA open source ! La nouvelle fonctionnalité de HuggingFace est en plein essor : les grands modèles peuvent être facilement utilisés avec des outils d'IA multimodaux

Laissez ChatGPT appeler plus de 100 000 modèles d'IA open source ! La nouvelle fonctionnalité de HuggingFace est en plein essor : les grands modèles peuvent être facilement utilisés avec des outils d'IA multimodaux

PHPz

May 19, 2023 am 09:47 AM

工具 ai chatgpt

Discutez simplement avec ChatGPT et cela vous aidera à appeler plus de 100 000 modèles HuggingFace !

Il s'agit de HuggingFace Transformers Agents, la dernière fonction lancée par HuggingFace, qui a fait l'objet d'une grande attention depuis son lancement :

Laissez ChatGPT appeler plus de 100 000 modèles dIA open source ! La nouvelle fonctionnalité de HuggingFace est en plein essor : les grands modèles peuvent être facilement utilisés avec des outils dIA multimodaux

Cette fonction équivaut à équiper de grands modèles tels que ChatGPT de capacités « multimodales »— —

Non limité au texte, mais toutes les tâches multimodales telles que les images, les voix, les documents, etc. peuvent être résolues.

Par exemple, vous pouvez faire une demande « décrire cette image » à ChatGPT et lui donner une photo d'un castor. En utilisant ChatGPT, vous pouvez appeler l'interpréteur d'image et afficher "Un castor nage"

Ensuite, ChatGPT appelle la synthèse vocale et vous pouvez lire cette phrase en quelques minutes :

Un castor nage dans le water Audio : 00:0000:01

Il prend non seulement en charge les modèles à grande échelle d'OpenAI, tels que ChatGPT, mais prend également en charge d'autres modèles gratuits à grande échelle, tels qu'OpenAssistant.

Transformer Agent est chargé d'"apprendre" à ces grands modèles à appeler directement n'importe quel modèle d'IA sur Hugging Face et à afficher les résultats traités.

Alors quel est le principe de cette nouvelle fonction ?

Comment laisser les grands modèles « commander » diverses IA ?

En termes simples, Transformers Agents est un « package d'intégration d'outils d'IA époustouflant » exclusif aux grands modèles.

Différents modèles d'IA, grands et petits, sur HuggingFace sont inclus dans ce package et classés en "générateur d'images", "interprète d'images", "outil de synthèse vocale"...

En même temps, chaque outil sera avoir une explication textuelle correspondante pour permettre aux grands modèles de comprendre quel modèle ils doivent appeler.

De cette façon, vous n'avez besoin que d'un simple code + mot d'invite, et le grand modèle peut vous aider à exécuter directement le modèle d'IA et à vous renvoyer les résultats de sortie en temps réel. en trois étapes :

Tout d'abord, configurez le grand modèle que vous souhaitez utiliser. Vous pouvez utiliser le grand modèle d'OpenAI ici (bien sûr, l'API est payante) :

<code>from transformers import OpenAiAgentagent = OpenAiAgent(model="text-davinci-003", api_key="<your_api_key>")</your_api_key></code>

Copier après la connexion

Vous pouvez également utiliser des grands modèles gratuits tels que BigCode ou OpenAssistant. :

<code>from huggingface_hub import loginlogin("<your_token>")</your_token></code>

Copier après la connexion

Ensuite, configurez les agents Hugging Transformers. Ici, nous prenons l'agent par défaut comme exemple :

<code>from transformers import HfAgent# Starcoderagent = HfAgent("https://api-inference.huggingface.co/models/bigcode/starcoder")# StarcoderBase# agent = HfAgent("https://api-inference.huggingface.co/models/bigcode/starcoderbase")# OpenAssistant# agent = HfAgent(url_endpoint="https://api-inference.huggingface.co/models/OpenAssistant/oasst-sft-4-pythia-12b-epoch-3.5")</code>

Copier après la connexion

Ensuite, vous pouvez utiliser la commande run() ou chat() pour exécuter les agents Transformers.

run() convient pour appeler plusieurs modèles d'IA en même temps pour effectuer des tâches plus complexes et professionnelles.

Un seul outil d'IA peut être appelé.

Par exemple, si vous exécutez agent.run("Dessine-moi une image de rivières et de lacs."), il appellera l'outil graphique de l'IA pour vous aider à générer une image :

Vous pouvez appelez également plusieurs outils d'IA en même temps.

Par exemple, si vous exécutez agent.run ("Dessine-moi une image de la mer puis transforme l'image pour ajouter une île"), il appellera les outils "Wen Sheng Dia" et "Tu Sheng Dia" pour vous aider générer l'image correspondante :

chat() convient pour "accomplir des tâches en continu" via le chat.

Par exemple, appelez d'abord l'outil Agent Chat AI pour générer une image des rivières et des lacs : agent.chat("Générer une image des rivières et des lacs")

Ensuite, faites un "Togram Draw" basé sur sur cette photo Modification de l'image : agent.chat ("Transformez l'image pour qu'il y ait un rocher là-dedans")

Le modèle d'IA à appeler peut être défini par vous-même, ou vous pouvez utiliser l'ensemble des paramètres par défaut fournis avec Huohuan Face Setup est complet.

Un ensemble de modèles d'IA par défaut a été configuré

Actuellement, les agents Transformers ont intégré un ensemble de modèles d'IA par défaut, qui est complété en appelant les modèles d'IA suivants dans la bibliothèque Transformer :

1. Tant que vous fournissez un fichier au format image (y compris des images converties à partir de PDF), vous pouvez l'utiliser pour répondre à des questions sur le fichier.

Par exemple, si vous demandez « Où se tiendra la réunion du Comité consultatif scientifique du TRRF ? » Donut donnera la réponse :

2. Question-réponse texte modèle Flan-T5. À partir d'un long article et d'une question, il peut répondre à diverses questions textuelles et vous aider à comprendre en lecture.

3. Modèle de langage visuel Zero-shot BLIP. Il peut comprendre directement le contenu de l’image et fournir des descriptions textuelles pour l’image.

4. Modèle multimodal ViLT. Il peut comprendre et répondre aux questions dans une image donnée,

5. Modèle de segmentation d'image multimodale CLIPseg. Fournissez simplement un modèle et des mots d'invite, et le système peut segmenter le contenu spécifié (masque) dans l'image en fonction des mots d'invite.

6. Modèle de reconnaissance vocale automatique Whisper. Il peut reconnaître automatiquement le texte d'un enregistrement et compléter la transcription.

7. Modèle de synthèse vocale SpeechT5. pour la synthèse vocale.

8. Modèle de langage auto-codant BART. En plus de classer automatiquement un élément de contenu textuel, il peut également créer des résumés de texte.

9. Modèle de traduction en 200 langues NLLB. En plus des langues courantes, il peut également traduire certaines langues moins courantes, notamment le laotien et le kamba.

En appelant les modèles d'IA ci-dessus, des tâches telles que les questions et réponses sur les images, la compréhension des documents, la segmentation des images, l'enregistrement en texte, la traduction, le sous-titrage, la synthèse vocale et la classification de texte peuvent être effectuées.

De plus, Huo Hua Lian contient également des « biens privés », y compris certains modèles en dehors de la bibliothèque Transformer, notamment le téléchargement de texte, d'images de Vincent, d'images et de vidéos de Vincent à partir du Web :

Ces modèles peuvent non seulement être appelé individuellement, mais peut également être mélangé. Par exemple, si l'on demande au grand modèle de "générer et décrire une belle photo d'un castor", il appellera "Vincent Picture" et "Picture Understanding". Modèles d'IA respectivement.

Bien sûr, si nous ne souhaitons pas utiliser ces modèles d'IA par défaut et souhaitons mettre en place un « package d'intégration d'outils » plus utile, nous pouvons également le configurer nous-mêmes selon les étapes.

Pour les Agents Transformers, certains internautes ont également souligné que c'est un peu le "remplacement" des agents LangChain :

Avez-vous essayé ces deux outils ? Selon vous, lequel est le plus utile ?

Liens de référence : [1]https://twitter.com/huggingface/status/1656334778407297027[2]https://huggingface.co/docs/transformers/transformers_agents

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

<🎜>: Dead Rails - Comment relever chaque défi

4 Il y a quelques semaines By DDD

Guide de l'atomfall: emplacements des articles, guides de quête et conseils

1 Il y a quelques mois By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7678

Tutoriel CakePHP

1393

Tutoriel C#

1209

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

Afficher plus

Related knowledge

OUYI OUYI OUYI OUIX OUYI GLOBAL GOGNAL Station Page d'accueil Apr 21, 2025 pm 11:57 PM

OUYI OKX est la principale plateforme de trading d'actifs numériques au monde. 1) Son historique de développement comprend: il sera lancé en 2017, le nom chinois "Ouyi" sera lancé en 2021, et il sera rebaptisé OUYI OKX en 2022. 2) Les services de base comprennent: les services de trading (Coin, Ledefet, Mining, Dex, Fiat Currency Trading) et les services financiers (Yubibao, Mining, Lending). 3) Les fonctions spéciales de la plate-forme comprennent: les services de données du marché et le système de contrôle des risques. 4) Les avantages de base comprennent: la force technique, le système de sécurité, le support de service et la couverture du marché.

Classement des échanges à effet de levier dans le cercle des devises Les dernières recommandations des dix premiers échanges à effet de levier dans le cercle des devises Apr 21, 2025 pm 11:24 PM

Les plates-formes qui ont des performances exceptionnelles dans le commerce, la sécurité et l'expérience utilisateur en effet de levier en 2025 sont: 1. OKX, adaptés aux traders à haute fréquence, fournissant jusqu'à 100 fois l'effet de levier; 2. Binance, adaptée aux commerçants multi-monnaies du monde entier, offrant un effet de levier 125 fois élevé; 3. Gate.io, adapté aux joueurs de dérivés professionnels, fournissant 100 fois l'effet de levier; 4. Bitget, adapté aux novices et aux commerçants sociaux, fournissant jusqu'à 100 fois l'effet de levier; 5. Kraken, adapté aux investisseurs stables, fournissant 5 fois l'effet de levier; 6. BUTBIT, adapté aux explorateurs Altcoin, fournissant 20 fois l'effet de levier; 7. Kucoin, adapté aux commerçants à faible coût, fournissant 10 fois l'effet de levier; 8. Bitfinex, adapté au jeu senior

Logiciel essentiel recommandé pour les parties contractuelles en devises Apr 21, 2025 pm 11:21 PM

Les dix principales plates-formes d'échange de contrats de crypto-monnaie en 2025 sont: 1. Binance Futures, 2. Okx Futures, 3. Gate.io, 4. Huobi Futures, 5. Bitmex, 6. Bybit, 7. Deribit, 8. Bitfinex, 9. Coinflex, 10. Phemex, ces plates-formes sont largement reconnues pour leur haute liquidité, diverses fonctions commerciales diversifiées.

Que signifie la transaction transversale? Quelles sont les transactions transversales? Apr 21, 2025 pm 11:39 PM

Échanges qui prennent en charge les transactions transversales: 1. Binance, 2. UniSwap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN Trade, ces plateformes prennent en charge les transactions d'actifs multi-chaînes via diverses technologies.

Classement d'échange de chaîne quantique Top 10 recommandé (mis à jour en 2025) Apr 21, 2025 pm 11:48 PM

Les chaînes quantiques peuvent être échangées sur les bourses suivantes: 1. Binance: L'une des plus grandes bourses du monde, avec un grand volume de trading, une monnaie riche et une haute sécurité. 2. Sesame Open Door (GATE.IO): un grand échange, offrant une variété de transactions en devises numériques, avec une bonne profondeur de trading. 3. OUYI (OKX): exploité par OK Group, avec une forte résistance complète, un volume de transactions important et des mesures de sécurité complètes. 4. Bitget: Développement rapide, fournit des transactions de chaîne quantique et améliore la sécurité. 5. Bithumb: opéré au Japon, prend en charge les transactions de plusieurs devises virtuelles traditionnelles et est sûre et fiable. 6. Matcha Exchange: un échange bien connu avec une interface amicale et prend en charge le trading de la chaîne quantique. 7. Huobi: un grand échange qui fournit un échange de chaîne quantique,

Quelles sont les plateformes de trading de blockchain hybrides? Apr 21, 2025 pm 11:36 PM

Suggestions de choix d'un échange de crypto-monnaie: 1. Pour les exigences de liquidité, la priorité est Binance, Gate.io ou Okx, en raison de sa profondeur de commande et de sa forte résistance à la volatilité. 2. Conformité et sécurité, Coinbase, Kraken et Gemini ont une approbation réglementaire stricte. 3.

Recommander plusieurs applications pour acheter des pièces grand public en 2025 dernière version Apr 21, 2025 pm 11:54 PM

Les logiciels d'application qui peuvent acheter des pièces grand public comprennent: 1. Binance, le premier volume de transaction au monde et la vitesse rapide; 2. OKX, produits innovants, frais faibles, haute sécurité; 3. Gate.io, une variété d'actifs et d'options de trading, en se concentrant sur la sécurité; 4. Huobi (HTX), frais faibles, bonne expérience utilisateur; 5. Coinbase, adapté aux novices, haute sécurité; 6. Kraken, sûr et conforme, fournissant une variété de services; 7. Kucoin, frais faibles, adaptés aux commerçants professionnels; 8. Gemini, met l'accent sur la conformité et fournit des services de garde; 9. Crypto.com, offrant une variété d'offres et de services; 10. Bitstamp, un ancien échange, forte liquidité,

Quels sont les sites Web de logiciels de visualisation du marché libre? Classement des dix meilleurs logiciels de visualisation du marché libre dans le cercle des devises Apr 22, 2025 am 10:57 AM

Les trois meilleurs logiciels de visualisation du marché libre dans le cercle des devises sont OKX, Binance et Gate.io. 1. OKX fournit une interface simple et des données en temps réel, prenant en charge une variété de graphiques et d'analyse de marché. 2. Binance a des fonctions puissantes, des données précises et convient à toutes sortes de commerçants. 3. Gate.io est connu pour sa stabilité et son exhaustivité, et convient aux investisseurs à long terme et à court terme.

See all articles