Comment utiliser Python pour identifier des catégories d'images
Dans la société d'aujourd'hui, les images font partie intégrante de notre vie quotidienne. Avec la prolifération des smartphones et des réseaux sociaux, nous prenons et partageons chaque jour des tonnes d’images. La manière de classer et d'identifier efficacement ces images joue un rôle crucial dans l'amélioration de notre qualité de vie et de notre efficacité au travail. Cet article explique comment utiliser le langage de programmation Python pour identifier les catégories d'images et joindre des exemples de code.
L'utilisation de Python pour la reconnaissance de catégories d'images nécessite l'aide de certaines bibliothèques couramment utilisées, notamment PIL (Python Imaging Library), tensorflow et keras. Nous utilisons d'abord la bibliothèque PIL pour charger et traiter les images, puis utilisons les modèles d'apprentissage en profondeur fournis par tensorflow et keras pour la classification.
Tout d’abord, nous devons installer les bibliothèques requises. PIL, tensorflow et keras peuvent être installés à l'aide de la commande pip :
pip install pillow tensorflow keras
Après avoir préparé les bibliothèques requises, nous pouvons commencer à écrire du code. Tout d’abord, nous devons charger le modèle d’apprentissage profond formé. Dans cet article, nous utiliserons comme exemple le modèle ResNet50 pré-entraîné, qui est formé sur l'ensemble de données ImageNet.
from tensorflow.keras.applications.resnet50 import ResNet50 from tensorflow.keras.preprocessing import image from tensorflow.keras.applications.resnet50 import preprocess_input, decode_predictions import numpy as np model = ResNet50(weights='imagenet')
Ensuite, nous pouvons utiliser la bibliothèque PIL pour charger l'image à reconnaître et ajuster la taille pour répondre aux exigences d'entrée du modèle.
img_path = 'test.jpg' img = image.load_img(img_path, target_size=(224, 224)) x = image.img_to_array(img) x = np.expand_dims(x, axis=0) x = preprocess_input(x)
Maintenant, nous pouvons effectuer une reconnaissance de catégorie sur les images en appelant la méthode de prédiction du modèle d'apprentissage en profondeur et afficher les résultats de la reconnaissance.
preds = model.predict(x) pred_classes = decode_predictions(preds, top=3)[0] for pred_class in pred_classes: print(pred_class[1], pred_class[2])
Dans l'exemple de code, nous décodons les prédictions en étiquettes lisibles par l'homme via la fonction decode_predictions et affichons uniquement les trois principales prédictions avec la plus grande confiance. De cette façon, nous pouvons obtenir les résultats de reconnaissance de catégorie de l’image.
Il convient de noter que afin d'obtenir des résultats de prédiction plus précis, nous pouvons remplacer le modèle ResNet50 en entraînant notre propre modèle d'apprentissage profond ou en utilisant un modèle plus complexe. De plus, nous pouvons encore améliorer la précision des prédictions en augmentant la quantité et le type de données d’entraînement et en ajustant les hyperparamètres du modèle.
Pour résumer, cet article explique comment utiliser Python pour identifier les catégories d'images et fournit des exemples de code correspondants. En apprenant et en appliquant ces méthodes, nous pouvons facilement classer et identifier un grand nombre d'images, améliorant ainsi l'efficacité de la vie et du travail.
Exemple de code :
from tensorflow.keras.applications.resnet50 import ResNet50 from tensorflow.keras.preprocessing import image from tensorflow.keras.applications.resnet50 import preprocess_input, decode_predictions import numpy as np model = ResNet50(weights='imagenet') img_path = 'test.jpg' img = image.load_img(img_path, target_size=(224, 224)) x = image.img_to_array(img) x = np.expand_dims(x, axis=0) x = preprocess_input(x) preds = model.predict(x) pred_classes = decode_predictions(preds, top=3)[0] for pred_class in pred_classes: print(pred_class[1], pred_class[2])
La technologie peut être étendue et peut utiliser Python pour la classification des images. L'apprentissage en profondeur peut également être utilisé pour identifier et localiser des objets spécifiques dans les images, ce qui est une tâche fastidieuse pour de nombreux processus manuels, en particulier. lorsqu’il existe une grande quantité de données étiquetées, l’apprentissage profond excelle lorsqu’il est disponible. J'espère que cet article pourra vous aider à comprendre comment utiliser Python pour la classification d'images et jouer un rôle dans des applications pratiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!