Dalam bidang teknologi kontemporari, teknologi pengecaman imej menjadi semakin penting. Teknologi pengecaman imej membantu kami mengenal pasti dan mengklasifikasikan entiti yang diekstrak daripada imej digital, yang kemudiannya digunakan dalam analisis dan ramalan data. Python ialah bahasa pengaturcaraan yang sangat popular yang juga sesuai untuk bekerja dengan teknologi pengecaman imej. Dalam artikel ini, kita akan belajar cara menggunakan teknologi pengecaman imej dalam Python dan perkara yang boleh kita lakukan dengannya.
1. Pustaka pemprosesan imej
Sebelum mula menggunakan teknologi pengecaman imej, adalah lebih baik untuk memahami beberapa pengetahuan asas perpustakaan pemprosesan imej. Pustaka pemprosesan imej yang paling biasa digunakan dalam Python termasuk OpenCV, Pillow, dan Scikit-image. Dalam artikel ini, kami akan memberi tumpuan kepada menggunakan dua perpustakaan, OpenCV dan Scikit-image.
2. OpenCV
OpenCV ialah perpustakaan penglihatan komputer sumber terbuka yang boleh digunakan pada platform yang berbeza. OpenCV menyediakan sejumlah besar algoritma dan fungsi yang boleh digunakan untuk melaksanakan pemprosesan imej digital, analisis dan penglihatan komputer. Berikut ialah langkah asas untuk pengecaman imej menggunakan OpenCV:
1 Pasang OpenCV
Sebelum anda mula menggunakan OpenCV, anda perlu memasangnya pada komputer anda. Pustaka OpenCV boleh dipasang melalui arahan pip dan conda. Pada Windows, anda boleh memasangnya dengan arahan berikut:
pip install opencv-python
Sebagai alternatif, anda boleh menggunakan conda untuk memasang OpenCV:
conda install -c conda-forge opencv
2. Muatkan imej
Seterusnya, anda perlu memuatkan imej yang anda ingin menganalisis imej. Dalam Python, anda boleh memuatkan satu imej atau berbilang imej menggunakan fungsi OpenCV cv2.imread().
import cv2 # load an image image = cv2.imread("path/to/image")
3. Praproses imej
Sebelum menggunakan OpenCV, imej perlu dipraproses. Pemprosesan berikut boleh dilakukan pada imej:
# convert the image to grayscale gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # apply a Gaussian blur to remove noise blurred = cv2.GaussianBlur(gray, (5, 5), 0) # apply edge detection to extract edges edges = cv2.Canny(blurred, 50, 200)
4. Kenal pasti objek
Setelah imej telah dipraproses, objek boleh dikenal pasti menggunakan algoritma dan fungsi OpenCV. Objek boleh ditandakan sebagai segi empat tepat atau bulatan, dsb.
# perform an object detection (contours, _) = cv2.findContours(edges.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) for c in contours: # compute the bounding box of the object (x, y, w, h) = cv2.boundingRect(c) # draw the bounding box around the object cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
5. Paparkan hasil
Gunakan OpenCV untuk memaparkan imej yang diproses.
# display the result cv2.imshow("Object Detection", image) cv2.waitKey(0)
3. Scikit-image
Scikit-image ialah perpustakaan pemprosesan imej berdasarkan bahasa Python Ia juga menyediakan banyak algoritma dan fungsi pemprosesan imej. Berikut ialah langkah asas untuk pengecaman imej menggunakan Scikit-image:
1 Pasang Scikit-image
Anda boleh menggunakan arahan berikut untuk memasang pustaka imej Scikit:
rreee.2 .Muat Imej
Begitu juga, sebelum menggunakan Scikit-image, anda perlu memuatkan imej yang ingin anda analisis.
pip install scikit-image
3. Praproses imej
Sebelum menggunakan Scikit-image, anda juga perlu praproses imej. Pemprosesan berikut boleh dilakukan pada imej:
from skimage import io # load the image image = io.imread("path/to/image")
4 Kenal pasti objek
Gunakan algoritma dan fungsi Scikit-image untuk mengenal pasti objek dan menandakan objek sebagai segi empat tepat atau bulatan, dsb.
from skimage.filters import threshold_local from skimage.color import rgb2gray # convert the image to grayscale gray = rgb2gray(image) # apply a threshold to the image thresh = threshold_local(gray, 51, offset=10)
5. Paparkan hasil
Gunakan Scikit-image untuk memaparkan imej yang diproses.
from skimage import measure from skimage.color import label2rgb from skimage.draw import rectangle # find contours in the image contours = measure.find_contours(thresh, 0.8) # draw a rectangle around each object for n, contour in enumerate(contours): row_min, col_min = contour.min(axis=0) row_max, col_max = contour.max(axis=0) rect = rectangle((row_min, col_min), (row_max, col_max), shape=image.shape) image[rect] = 0
Kesimpulan
Melalui artikel ini, kami mempelajari cara menggunakan OpenCV dan Scikit-image dalam Python untuk pengecaman imej. Kedua-dua perpustakaan ini ialah salah satu perpustakaan pemprosesan imej paling popular dalam Python dan boleh membantu kami dengan pemprosesan imej, analisis dan penglihatan komputer. Menggunakan teknologi pengecaman imej, entiti yang tidak kelihatan boleh diekstrak dengan mudah daripada imej digital dan digunakan dalam analisis dan ramalan data, contohnya, ia boleh digunakan untuk perubatan, keselamatan dan kewangan. Walaupun artikel ini menyediakan beberapa kaedah penggunaan asas, teknologi pengecaman imej adalah bidang yang sangat kompleks dan pelbagai, dan terdapat banyak algoritma dan teknik lain yang boleh digunakan. Oleh itu, mempelajari dan meneroka bidang ini adalah satu proses yang sangat menarik dan berbaloi.
Atas ialah kandungan terperinci Bagaimana untuk menggunakan teknologi pengecaman imej dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!