Ces dernières années, Hugging Face [https://huggingface.co/] est devenue l'une des plateformes les plus influentes de la communauté de l'apprentissage automatique, offrant une large gamme d'outils et de ressources aux développeurs et aux chercheurs. L'une de ses offres les plus remarquables est la bibliothèque Transformers, qui facilite l'exploitation de modèles, d'ensembles de données et d'applications de pointe. Cette bibliothèque permet aux utilisateurs d'intégrer de manière transparente des modèles pré-entraînés dans leurs projets et d'accélérer les flux de travail d'apprentissage automatique.
Dans cet article, nous explorerons la bibliothèque Transformers, comment l'installer et présenterons quelques cas d'utilisation pratiques utilisant des pipelines pour des tâches telles que l'analyse des sentiments, la génération de texte et la classification zéro-shot.
La Bibliothèque Transformers fournit des API et des outils permettant de télécharger et d'entraîner des modèles pré-entraînés de pointe, optimisés pour diverses tâches, notamment le traitement du langage naturel (NLP), la vision par ordinateur. et les applications multimodales. En utilisant des modèles pré-entraînés, vous pouvez réduire considérablement vos coûts de calcul, votre empreinte carbone et le temps nécessaire pour entraîner un modèle à partir de zéro. C'est un excellent moyen d'accélérer le cycle de développement et de tirer parti des dernières avancées en matière d'apprentissage automatique.
La bibliothèque prend en charge Python 3.6 et fonctionne de manière transparente avec des frameworks d'apprentissage en profondeur tels que PyTorch, TensorFlow et Flax. Il vous permet de télécharger des modèles directement depuis le hub de modèles Hugging Face et de les utiliser pour l'inférence avec seulement quelques lignes de code.
Avant de commencer à utiliser la bibliothèque Transformers, il est essentiel de configurer votre environnement de développement. Voici comment l'installer :
Commencez par créer un environnement virtuel dans le répertoire de votre projet :
python -m venv .myenv
Activer l'environnement virtuel :
source .myenv/bin/activate
Vérifiez que vous utilisez la bonne version de Python :
python -V
Assurez-vous que vous utilisez Python 3.6 (par exemple, Python 3.10.10).
Mettez à niveau pip vers la dernière version :
pip install --upgrade pip
Vous êtes maintenant prêt à installer les Transformers. Si vous utilisez PyTorch, installez-le avec la bibliothèque à l'aide de la commande suivante :
pip install 'transformers[torch]'
Pour TensorFlow 2.0 :
pip install 'transformers[tf-cpu]'
Pour le Lin (utilisé dans les milieux de recherche) :
python -m venv .myenv
Si vous utilisez un M Mac ou une architecture basée sur ARM, vous aurez peut-être besoin de dépendances supplémentaires :
source .myenv/bin/activate
Une fois que tout est configuré, vérifiez si l'installation a réussi en exécutant cette commande Python :
python -V
En cas de succès, vous devriez voir un résultat similaire à :
pip install --upgrade pip
L'API pipeline de la bibliothèque Transformers de Hugging Face facilite l'exécution de tâches complexes d'apprentissage automatique sans approfondir le code sous-jacent ou les détails du modèle. Le pipeline gère automatiquement le prétraitement, l'inférence de modèle et le post-traitement pour vous.
Voyons comment vous pouvez utiliser quelques tâches courantes avec l'API de pipeline.
L'analyse des sentiments consiste à déterminer le ton émotionnel derrière un morceau de texte, par exemple s'il est positif ou négatif. Voici comment utiliser l'API du pipeline pour effectuer une analyse des sentiments :
pip install 'transformers[torch]'
Sortie :
pip install 'transformers[tf-cpu]'
Le pipeline prétraite d'abord le texte (tokénisation), le transmet à travers le modèle et enfin post-traite les résultats. Dans ce cas, le modèle classe l'entrée comme POSITIVE avec un score élevé de 0,999.
Transformers fournit également un moyen simple de générer du texte avec un modèle de langage pré-entraîné comme GPT-2. Vous trouverez ci-dessous un exemple utilisant le pipeline de génération de texte :
pip install 'transformers[flax]'
Sortie :
brew install cmake brew install pkg-config
Le modèle génère trois variantes différentes de texte basées sur l'invite "Je t'aime". Ceci est utile pour générer du contenu créatif ou compléter une phrase donnée.
Classification Zero-shot est une fonctionnalité puissante qui vous permet de classer le texte en catégories sans entraîner explicitement le modèle sur ces catégories. Par exemple, vous pouvez classer un texte dans des étiquettes prédéfinies même si vous n'avez pas entraîné le modèle sur cet ensemble de données spécifique.
Voici un exemple :
python -c "from transformers import pipeline; print(pipeline('sentiment-analysis')('we love you'))"
Sortie :
[{'label': 'POSITIVE', 'score': 0.9998704791069031}]
Le modèle suggère que le texte est très probablement classé comme actualités avec un score de confiance de 0,51.
Vous pouvez également visualiser les résultats avec un camembert pour avoir une meilleure idée de la répartition :
from transformers import pipeline classifier = pipeline("sentiment-analysis", model="distilbert/distilbert-base-uncased-finetuned-sst-2-english") res = classifier("I love you! I love you! I love you!") print(res)
Cela affichera un diagramme circulaire représentant les probabilités pour chaque étiquette, vous aidant à visualiser comment le modèle interprète le texte.
Transformers de Hugging Face offre un moyen pratique et puissant d'accéder à des modèles de pointe et de les utiliser pour une variété de tâches d'apprentissage automatique. Que vous travailliez sur l'analyse des sentiments, la génération de texte ou la classification zéro-shot, l'API de pipeline simplifie le processus d'intégration de ces modèles avancés dans vos projets.
Avec des instructions d'installation faciles à suivre et des exemples pratiques, vous pouvez commencer à tirer parti de Transformers en quelques étapes seulement. Le hub de modèles Hugging Face fournit également une vaste collection de modèles pré-entraînés, vous permettant de mettre en œuvre rapidement les dernières avancées en matière d'apprentissage automatique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!