Pengesanan objek telah menjadi salah satu aplikasi kecerdasan buatan yang paling menarik, membolehkan mesin memahami dan mentafsir data visual. Dalam tutorial ini, kami akan melalui langkah-langkah untuk mencipta aplikasi pengesanan objek masa nyata menggunakan algoritma YOLO (Anda Hanya Lihat Sekali). Model berkuasa ini membolehkan pengesanan pantas dan tepat objek dalam imej dan video, menjadikannya sesuai untuk pelbagai aplikasi, daripada pengawasan kepada kenderaan autonomi.
Pengesanan objek ialah tugas penglihatan komputer yang melibatkan mengenal pasti dan mengesan objek dalam strim imej atau video. Tidak seperti klasifikasi imej, yang hanya menentukan objek yang ada, pengesanan objek menyediakan kotak sempadan di sekeliling objek yang dikesan, bersama-sama dengan label kelasnya.
YOLO, yang bermaksud "Anda Hanya Melihat Sekali," ialah algoritma pengesanan objek masa nyata yang terkini. Kelebihan utama YOLO ialah kelajuannya; ia memproses imej dalam masa nyata sambil mengekalkan ketepatan yang tinggi. YOLO membahagikan imej input ke dalam grid dan meramalkan kotak sempadan dan kebarangkalian untuk setiap sel grid, membolehkannya mengesan berbilang objek dalam satu laluan.
Sebelum kita menyelami kod, pastikan anda telah memasang yang berikut:
Mencipta persekitaran maya boleh membantu mengurus kebergantungan dengan berkesan:
python -m venv yolovenv source yolovenv/bin/activate # On Windows use yolovenv\Scripts\activate
Pasang perpustakaan yang diperlukan menggunakan pip:
pip install opencv-python numpy
Untuk YOLO, anda mungkin perlu memuat turun pemberat dan fail konfigurasi yang telah dilatih. Anda boleh mendapatkan pemberat dan konfigurasi YOLOv3 di tapak web rasmi YOLO.
Sekarang, mari buat skrip Python yang akan menggunakan YOLO untuk pengesanan objek masa nyata.
Buat fail Python baharu bernama object_detection.py dan mulakan dengan mengimport perpustakaan yang diperlukan dan memuatkan model YOLO:
python -m venv yolovenv source yolovenv/bin/activate # On Windows use yolovenv\Scripts\activate
Seterusnya, kami akan menangkap video daripada kamera web dan memproses setiap bingkai untuk mengesan objek:
pip install opencv-python numpy
Untuk menjalankan aplikasi, laksanakan skrip:
import cv2 import numpy as np # Load YOLO net = cv2.dnn.readNet("yolov3.weights", "yolov3.cfg") layer_names = net.getLayerNames() output_layers = [layer_names[i[0] - 1] for i in net.getUnconnectedOutLayers()]
Anda seharusnya melihat tetingkap yang memaparkan suapan kamera web dengan objek yang dikesan diserlahkan dalam masa nyata.
Pengesanan objek masa nyata mempunyai pelbagai aplikasi, termasuk:
Tahniah! Anda telah berjaya membina aplikasi pengesanan objek masa nyata menggunakan YOLO. Algoritma berkuasa ini membuka banyak kemungkinan untuk aplikasi merentasi pelbagai bidang. Semasa anda meneroka lebih jauh, pertimbangkan untuk menyelami topik yang lebih lanjutan, seperti memperhalusi YOLO untuk tugas pengesanan objek tertentu atau menyepadukan aplikasi ini dengan sistem lain.
Jika anda berminat untuk meneruskan kerjaya dalam AI dan ingin mempelajari cara menjadi jurutera AI yang berjaya, lihat Pelan Hala Tuju Untuk Menjadi Jurutera AI yang Berjaya untuk mendapatkan peta jalan yang terperinci.
Jangan ragu untuk berkongsi pendapat, soalan atau pengalaman anda dalam ulasan di bawah. Selamat mengekod!
Atas ialah kandungan terperinci Membina Aplikasi Pengesanan Objek Masa Nyata dengan YOLO. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!