Dengan kemunculan teknologi pembelajaran mendalam, pemprosesan imej visual telah menjadi semakin popular sejak beberapa tahun kebelakangan ini dan telah digunakan secara meluas dalam pelbagai bidang Pada masa yang sama, sejumlah besar pengamal telah muncul. Walau bagaimanapun, ramai orang hanya menggunakan pembelajaran mendalam dan berfikir bahawa algoritma pemprosesan imej tradisional sudah lapuk. Saya pernah mendengar seseorang mengatakan bahawa pemprosesan imej telah menjadi sangat biasa sehingga algoritma tradisional sudah lapuk dan ambangnya sangat rendah, dan sesiapa sahaja boleh menggunakannya. Sejujurnya, apabila saya mendengar kenyataan sedemikian, kadang-kadang saya benar-benar terdiam
Saya baru ada masa hari ini dan saya ingin bercakap tentang isu ini. Mula-mula, mari kita analisa, apakah pemprosesan imej terutamanya digunakan? Tidak kira pemprosesan imej industri mana yang digunakan, fungsi utamanya termasuk pengenalpastian, pengelasan, kedudukan, pengesanan, ukuran saiz dan panduan visual Memandangkan sesetengah orang mengatakan bahawa pembelajaran mendalam telah menggantikan teknologi pemprosesan imej tradisional, saya akan memberi anda contoh hari ini. Mari kita lihat beberapa kes khusus untuk melihat aplikasi pembelajaran mendalam. Pada masa yang sama, kami juga ingin melihat sama ada teknologi pemprosesan imej tradisional masih mempunyai tempatnya
Pertama sekali, mari kita perkenalkan secara ringkas apakah fungsi utama penglihatan yang disebutkan di atas. Terdapat hubungan tertentu antara pengenalan dan pengelasan. Pengecaman muka, pengecaman plat lesen, pengecaman aksara, pengecaman kod bar/QR, pengecaman kategori produk, pengecaman buah, dsb. adalah semua teknologi pengecaman imej Selepas pengecaman selesai, keputusan pengecaman kadangkala diberikan secara langsung, dan kadangkala pengelasan diperlukan . Sebagai contoh, produk yang dikenal pasti pada barisan pengeluaran campuran perlu dikelaskan dan dibungkus
Ditulis semula dalam bahasa Cina: Terdapat banyak kaedah penentududukan Kadangkala anda hanya perlu mengetahui secara kasar lokasi sasaran, dan kadangkala anda memerlukan kedudukan yang tepat supaya robot boleh merebutnya secara automatik. Kaedah pengesanan termasuk pengesanan sasaran dan pengesanan kecacatan. Pengesanan sasaran biasanya hanya perlu mengetahui sama ada sasaran wujud di tempat kejadian, manakala pengesanan kecacatan bukan sahaja mengesan sama ada kecacatan itu wujud, tetapi juga perlu menentukan saiz dan kategori kecacatan itu Matlamat pengukuran saiz adalah sangat jelas, iaitu , untuk mengesan secara visual sama ada saiz khusus objek sasaran memenuhi Require. Panduan visual digabungkan dengan genggaman automatik robot Ia perlu mengesan kedudukan sasaran dengan tepat dan juga menentukan lokasi khusus rampasan untuk mengelakkan sasaran daripada jatuh apabila robot bergerak
Saya akan menyenaraikan beberapa kes khusus di bawah, menunjukkan caranya. anda boleh menggunakan pembelajaran mendalam untuk mencapainya. Memandangkan syarikat tidak mahu imej ini didedahkan kepada umum, gambar di bawah hanya menangkap sebahagian kecil daripadanya, dan kandungan khusus tidak dapat ditentukan
Semua contoh berikut adalah keperluan sebenar syarikat, dan imej itu juga diambil di tapak. Mari kita lihat dahulu kes pengecaman aksara yang mudah. Keperluan kes ini adalah untuk menentukan sama ada watak-watak ini adalah betul untuk memproses 20 aksara sesaat. Adakah anda fikir ia perlu dilakukan atau tidak? Walaupun 2 juta yuan sudah banyak wang, setiap sistem penglihatan hanya berharga 20,000 yuan. Jadi adakah ia akan menguntungkan? Selain itu, apabila komputer hos mengecam aksara yang salah, ia perlu dihapuskan secara automatik
Analisis ringkas menunjukkan bahawa 20 produk boleh dikesan sesaat, bermakna setiap produk perlu disiapkan dalam masa 50 milisaat. Pada masa yang sama, komputer hos perlu menghantar isyarat kepada mekanisme penolakan Untuk memastikan kestabilan isyarat, 20 milisaat perlu ditempah. Baki 30 milisaat digunakan untuk mengambil gambar dan pemprosesan imej. Untuk latihan pembelajaran mendalam, konfigurasi komputer industri perlu dipertimbangkan. Di samping itu, kos PLC, peranti penolakan, kamera, sumber cahaya, kanta, kabinet dan aksesori kecil lain perlu dipertimbangkan. Berapakah kos pentauliahan manual di tapak? Berapakah jumlah kos?Mari kita berikan satu lagi contoh. Gambar di bawah menunjukkan pengesanan kecacatan kimpalan. Terdapat banyak jenis kecacatan kimpalan Seseorang pernah menghabiskan masa seminggu menggunakan pembelajaran mendalam untuk melatih dan mengesan. Mereka memberitahu saya keputusan ujian itu hebat, tetapi kemudian mereka kembali kepada saya sebulan kemudian dan berkata mereka tidak mampu membayar kos dan keputusan ujian adalah buruk. Fikir-fikirkan, mengapa ini berlaku?
Kita ambil satu lagi contoh gambar di bawah adalah contoh pengecaman kod bar anda lihat, kod bar ini sangat kabur dan sukar untuk dikenal pasti. Kita boleh menggunakan pembelajaran mendalam untuk mengenal pastinya Sebagai contoh, mari kita lihat gambar di bawah. Kita perlu menyemak sama ada ketebalan pada kedua-dua belah adalah konsisten dan sama ada terdapat kecacatan pada permukaan. Jadi, bagaimana kita boleh menggunakan pembelajaran mendalam untuk menyelesaikan masalah ini? Seseorang pernah menyahpepijatnya di tapak selama setengah tahun, tetapi akhirnya pelanggan tidak berpuas hatiBagaimana cara menggunakan pembelajaran mendalam untuk menggenggam robot secara automatik dan mengesan sudut kecondongan objek yang digenggam untuk melaraskan postur robot?
Bagaimana cara menggunakan pembelajaran mendalam untuk mengukur saiz spring yang telah digunakan untuk satu tempoh masa untuk menentukan sama ada ia layak? Bagaimana untuk mengukur parameter lain yang serupa bagi galas, gear, benang, dll.?
Contoh di atas hanyalah sebahagian kecil daripada banyak kes sebenar kaedah pengesanan serupa muncul tanpa henti, seperti pengetatan bolt automatik, cengkaman tidak teratur dan kedudukan jitu peringkat mikron. Walau bagaimanapun, malangnya, ramai orang hanya menggunakan pembelajaran mendalam, dan sesetengah orang menegaskan bahawa pemprosesan imej sudah lapuk dan pembelajaran mendalam telah menggantikan kaedah pemprosesan imej lain tanpa memahami konsep asas imej. Jika anda terdedah kepada lebih banyak kes sebenar, anda tidak akan berkata sedemikian
Ramai orang tersilap percaya bahawa mereka hanya perlu memasukkan imej ke dalam model pembelajaran mendalam untuk latihan Jika kesannya tidak baik, mereka boleh meningkatkan latihan sampel atau laraskan parameter untuk mencapai kesan yang ideal. Apa yang boleh saya katakan ialah pemahaman imej ini terlalu dangkal. Aplikasi imej yang paling biasa ialah pengecaman muka dan pengecaman plat lesen Untuk tugasan pengecaman ini, tiada masalah besar dalam menggunakan pembelajaran mendalam kerana keperluan untuk pengecaman tidak tinggi. Walaupun pengecaman mengambil masa yang lama atau ralat pengecaman berlaku, ia tidak akan menyebabkan masalah yang terlalu besar. Sebagai contoh, dengan pembayaran pengecaman muka, jika muka tidak dapat dikenali, anda juga boleh memilih untuk membayar secara manual dengan pengecaman plat lesen dan sistem kawalan akses, jika plat atau muka tidak dapat dikenali, anda juga boleh memilih untuk membuka pintu; secara manual. Tetapi dalam senario aplikasi automatik sepenuhnya, keadaan ini tidak dibenarkan Untuk pengesanan, pengelasan dan pengenalpastian kecacatan produk, pembelajaran mendalam adalah kaedah yang biasa digunakan, tetapi ia juga perlu diputuskan mengikut situasi tertentu. Di samping itu, sebelum latihan, biasanya perlu menggunakan algoritma pemprosesan imej yang lain
Sesetengah orang hanya menggunakan set data awam untuk melatih model pembelajaran mendalam dan menulis artikel, yang tidak menjadi masalah. Walau bagaimanapun, masih jauh untuk pergi jika model ini digunakan dalam aplikasi praktikal. Sebuah syarikat yang saya kenali telah merekrut beberapa Ph.D. untuk menjalankan pemeriksaan visual Namun, enam bulan kemudian, tidak ada keputusan Hasilnya, mereka dikritik hebat oleh pemimpin. Adakah anda tahu mengapa?
Pembelajaran mendalam mendapat tempatnya dalam bidang aplikasi, ini adalah fakta yang tidak dapat dinafikan. Walau bagaimanapun, ia hanya sebahagian daripada pemeriksaan visual dan tidak boleh dilaksanakan dalam banyak aspek lain. Teknologi pengesanan visual semasa hanya boleh digunakan pada beberapa adegan mudah Bagi kebanyakan adegan yang kompleks, tidak kira apa algoritma yang digunakan, pengesanan berkesan tidak boleh dicapai. Oleh itu, algoritma pemprosesan imej visual masih jauh lagi Apabila pembelajaran mendalam melatih imej, ia biasanya memerlukan beberapa pemprosesan imej asal, seperti penapisan, peningkatan, pembahagian ambang, pengesanan tepi dan operasi morfologi. Kadangkala, ia juga perlu untuk memproses imej dan kemudian mengekstrak terus ciri imej untuk latihan pembelajaran mendalam. Ramai orang yang terlibat dalam kerja visual memahami prinsip ini
Telah disebut sebelum ini bahawa jika anda hanya ingin menulis makalah, maka cukup untuk mengkaji satu arah secara mendalam. Penyelidikan teori yang mendalam juga menjanjikan, tetapi ia memerlukan kebolehan teori peribadi yang lebih tinggi. Jika anda belum didedahkan kepada aplikasi penglihatan sebenar, sebaiknya jangan sesuka hati mendakwa bahawa pemprosesan imej sudah lapuk, algoritma pemprosesan imej lain tidak lagi digunakan, dan pembelajaran mendalam telah menggantikan algoritma pemprosesan imej yang lain
Jadi, adakah kita masih memerlukan pemprosesan imej tradisional bagaimana dengan algoritma pemprosesan? Saya rasa jawapan kepada soalan ini adalah jelas. Jika masih terdapat sesuatu yang tidak jelas, sila fikirkan dengan teliti tentang berapa banyak projek berkaitan penglihatan yang anda telah didedahkan, dan apa lagi yang anda tidak tahu Adakah anda benar-benar memahami apa yang boleh dilakukan oleh pemeriksaan visual dan cara melakukannya? Sangat sedikit pemeriksaan visual dicapai semata-mata dengan bergantung pada algoritma pemprosesan imej tunggal. Oleh itu, pada peringkat aplikasi, kita perlu mahir dalam penggunaan pelbagai algoritma pemprosesan imej dan aplikasi gabungan pelbagai algoritma agar dapat beroperasi dengan mudah dalam industri visual. Percutian musim panas akan datang tidak lama lagi
Atas ialah kandungan terperinci Bolehkah pembelajaran mendalam digunakan untuk menggantikan algoritma pemprosesan imej lain?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!