La vision par ordinateur est une branche de l'intelligence artificielle qui vise à utiliser des ordinateurs pour simuler le système visuel humain afin d'extraire des informations significatives à partir d'images ou de vidéos. pythonAvec sa bibliothèque scientifique puissante et facile à apprendre, il est devenu un langage de programmation populaire dans le domaine de la vision par ordinateur. Cet article se concentrera sur l'application de Python dans les deux tâches de classification d'images et de détection de cibles, et fournira un code de démonstration clair et facile à comprendre pour vous aider à maîtriser rapidement les compétences de traitement d'images de Python.
Classification des images
La classification d'images est une tâche fondamentale en vision par ordinateur qui consiste à attribuer des images à des catégories prédéfinies. Python fournit de puissantes bibliothèques d'apprentissage automatiqueet de vision par ordinateuroutils pour mettre en œuvre facilement des tâches de classification d'images.
# 导入必要的库 import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.linear_model import LoGISticRegression # 加载和预处理图像数据 data = np.load("data.npy") labels = np.load("labels.npy") data = data.reshape((data.shape[0], -1)) data = data.astype("float32") / 255.0 # 将数据分成训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data, labels, test_size=0.2) # 训练逻辑回归分类器 classifier = LogisticRegression(max_iter=1000) classifier.fit(X_train, y_train) # 评估分类器 score = classifier.score(X_test, y_test) print("准确率:", score) # 预测新图像 image = np.load("new_image.npy") image = image.reshape((1, -1)) image = image.astype("float32") / 255.0 prediction = classifier.predict(image) print("预测标签:", prediction)
Le code ci-dessus démontre le processus complet de classification d'images à l'aide de Python, du chargement des données, du prétraitement, à la formation du modèle, à l'évaluation et enfin à la prédiction de nouvelles images.
Détection d'objet
La détection d'objets est une autre tâche importante en vision par ordinateur qui consiste à identifier et à localiser des objets spécifiques dans les images. Python dispose également de puissants outils de détection d'objets et de bibliothèques qui peuvent facilement accomplir cette tâche.
import numpy as np import cv2 # 加载并预处理图像 image = cv2.imread("image.png") image = cv2.resize(image, (640, 480)) # 创建目标检测器 detector = cv2.dnn.readNetFromCaffe("deploy.prototxt.txt", "res10_300x300_ssd_iter_140000.caffemodel") # 检测图像中的对象 blob = cv2.dnn.blobFromImage(image, 0.007843, (300, 300), 127.5) detector.setInput(blob) detections = detector.forward() # 绘制检测结果 for i in range(0, detections.shape[2]): confidence = detections[0, 0, i, 2] if confidence > 0.5: x1 = int(detections[0, 0, i, 3] * image.shape[1]) y1 = int(detections[0, 0, i, 4] * image.shape[0]) x2 = int(detections[0, 0, i, 5] * image.shape[1]) y2 = int(detections[0, 0, i, 6] * image.shape[0]) cv2.rectangle(image, (x1, y1), (x2, y2), (0, 255, 0), 2) # 显示结果图像 cv2.imshow("检测结果", image) cv2.waiTKEy(0) cv2.destroyAllwindows()
Le code ci-dessus démontre le processus complet de détection de cible à l'aide de Python, du chargement de l'image, du prétraitement, à l'utilisation du détecteur de cible, et enfin à l'élaboration des résultats de détection.
Conclusion :
Avec ses puissantes bibliothèques scientifiques et ses outils de vision par ordinateur, Python est un choix idéal pour les deux tâches de classification d'images et de détection d'objets. Cet article démontre l'application de Python dans le domaine de la vision par ordinateur et sa méthode de mise en œuvre à travers un code de démonstration clair et facile à comprendre. J'espère que vous en profiterez et explorerez davantage la puissance de Python dans le domaine de la vision par ordinateur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!