


Bolehkah pembelajaran mendalam digunakan untuk menggantikan algoritma pemprosesan imej lain?
Dengan kemunculan teknologi pembelajaran mendalam, pemprosesan imej visual telah menjadi semakin popular sejak beberapa tahun kebelakangan ini dan telah digunakan secara meluas dalam pelbagai bidang Pada masa yang sama, sejumlah besar pengamal telah muncul. Walau bagaimanapun, ramai orang hanya menggunakan pembelajaran mendalam dan berfikir bahawa algoritma pemprosesan imej tradisional sudah lapuk. Saya pernah mendengar seseorang mengatakan bahawa pemprosesan imej telah menjadi sangat biasa sehingga algoritma tradisional sudah lapuk dan ambangnya sangat rendah, dan sesiapa sahaja boleh menggunakannya. Sejujurnya, apabila saya mendengar kenyataan sedemikian, kadang-kadang saya benar-benar terdiam
Saya baru ada masa hari ini dan saya ingin bercakap tentang isu ini. Mula-mula, mari kita analisa, apakah pemprosesan imej terutamanya digunakan? Tidak kira pemprosesan imej industri mana yang digunakan, fungsi utamanya termasuk pengenalpastian, pengelasan, kedudukan, pengesanan, ukuran saiz dan panduan visual Memandangkan sesetengah orang mengatakan bahawa pembelajaran mendalam telah menggantikan teknologi pemprosesan imej tradisional, saya akan memberi anda contoh hari ini. Mari kita lihat beberapa kes khusus untuk melihat aplikasi pembelajaran mendalam. Pada masa yang sama, kami juga ingin melihat sama ada teknologi pemprosesan imej tradisional masih mempunyai tempatnya
Pertama sekali, mari kita perkenalkan secara ringkas apakah fungsi utama penglihatan yang disebutkan di atas. Terdapat hubungan tertentu antara pengenalan dan pengelasan. Pengecaman muka, pengecaman plat lesen, pengecaman aksara, pengecaman kod bar/QR, pengecaman kategori produk, pengecaman buah, dsb. adalah semua teknologi pengecaman imej Selepas pengecaman selesai, keputusan pengecaman kadangkala diberikan secara langsung, dan kadangkala pengelasan diperlukan . Sebagai contoh, produk yang dikenal pasti pada barisan pengeluaran campuran perlu dikelaskan dan dibungkus
Ditulis semula dalam bahasa Cina: Terdapat banyak kaedah penentududukan Kadangkala anda hanya perlu mengetahui secara kasar lokasi sasaran, dan kadangkala anda memerlukan kedudukan yang tepat supaya robot boleh merebutnya secara automatik. Kaedah pengesanan termasuk pengesanan sasaran dan pengesanan kecacatan. Pengesanan sasaran biasanya hanya perlu mengetahui sama ada sasaran wujud di tempat kejadian, manakala pengesanan kecacatan bukan sahaja mengesan sama ada kecacatan itu wujud, tetapi juga perlu menentukan saiz dan kategori kecacatan itu Matlamat pengukuran saiz adalah sangat jelas, iaitu , untuk mengesan secara visual sama ada saiz khusus objek sasaran memenuhi Require. Panduan visual digabungkan dengan genggaman automatik robot Ia perlu mengesan kedudukan sasaran dengan tepat dan juga menentukan lokasi khusus rampasan untuk mengelakkan sasaran daripada jatuh apabila robot bergerak
Saya akan menyenaraikan beberapa kes khusus di bawah, menunjukkan caranya. anda boleh menggunakan pembelajaran mendalam untuk mencapainya. Memandangkan syarikat tidak mahu imej ini didedahkan kepada umum, gambar di bawah hanya menangkap sebahagian kecil daripadanya, dan kandungan khusus tidak dapat ditentukan
Semua contoh berikut adalah keperluan sebenar syarikat, dan imej itu juga diambil di tapak. Mari kita lihat dahulu kes pengecaman aksara yang mudah. Keperluan kes ini adalah untuk menentukan sama ada watak-watak ini adalah betul untuk memproses 20 aksara sesaat. Adakah anda fikir ia perlu dilakukan atau tidak? Walaupun 2 juta yuan sudah banyak wang, setiap sistem penglihatan hanya berharga 20,000 yuan. Jadi adakah ia akan menguntungkan? Selain itu, apabila komputer hos mengecam aksara yang salah, ia perlu dihapuskan secara automatik
Analisis ringkas menunjukkan bahawa 20 produk boleh dikesan sesaat, bermakna setiap produk perlu disiapkan dalam masa 50 milisaat. Pada masa yang sama, komputer hos perlu menghantar isyarat kepada mekanisme penolakan Untuk memastikan kestabilan isyarat, 20 milisaat perlu ditempah. Baki 30 milisaat digunakan untuk mengambil gambar dan pemprosesan imej. Untuk latihan pembelajaran mendalam, konfigurasi komputer industri perlu dipertimbangkan. Di samping itu, kos PLC, peranti penolakan, kamera, sumber cahaya, kanta, kabinet dan aksesori kecil lain perlu dipertimbangkan. Berapakah kos pentauliahan manual di tapak? Berapakah jumlah kos?Mari kita berikan satu lagi contoh. Gambar di bawah menunjukkan pengesanan kecacatan kimpalan. Terdapat banyak jenis kecacatan kimpalan Seseorang pernah menghabiskan masa seminggu menggunakan pembelajaran mendalam untuk melatih dan mengesan. Mereka memberitahu saya keputusan ujian itu hebat, tetapi kemudian mereka kembali kepada saya sebulan kemudian dan berkata mereka tidak mampu membayar kos dan keputusan ujian adalah buruk. Fikir-fikirkan, mengapa ini berlaku?
Bagaimana cara menggunakan pembelajaran mendalam untuk menggenggam robot secara automatik dan mengesan sudut kecondongan objek yang digenggam untuk melaraskan postur robot?
Bagaimana cara menggunakan pembelajaran mendalam untuk mengukur saiz spring yang telah digunakan untuk satu tempoh masa untuk menentukan sama ada ia layak? Bagaimana untuk mengukur parameter lain yang serupa bagi galas, gear, benang, dll.?
Contoh di atas hanyalah sebahagian kecil daripada banyak kes sebenar kaedah pengesanan serupa muncul tanpa henti, seperti pengetatan bolt automatik, cengkaman tidak teratur dan kedudukan jitu peringkat mikron. Walau bagaimanapun, malangnya, ramai orang hanya menggunakan pembelajaran mendalam, dan sesetengah orang menegaskan bahawa pemprosesan imej sudah lapuk dan pembelajaran mendalam telah menggantikan kaedah pemprosesan imej lain tanpa memahami konsep asas imej. Jika anda terdedah kepada lebih banyak kes sebenar, anda tidak akan berkata sedemikian
Ramai orang tersilap percaya bahawa mereka hanya perlu memasukkan imej ke dalam model pembelajaran mendalam untuk latihan Jika kesannya tidak baik, mereka boleh meningkatkan latihan sampel atau laraskan parameter untuk mencapai kesan yang ideal. Apa yang boleh saya katakan ialah pemahaman imej ini terlalu dangkal. Aplikasi imej yang paling biasa ialah pengecaman muka dan pengecaman plat lesen Untuk tugasan pengecaman ini, tiada masalah besar dalam menggunakan pembelajaran mendalam kerana keperluan untuk pengecaman tidak tinggi. Walaupun pengecaman mengambil masa yang lama atau ralat pengecaman berlaku, ia tidak akan menyebabkan masalah yang terlalu besar. Sebagai contoh, dengan pembayaran pengecaman muka, jika muka tidak dapat dikenali, anda juga boleh memilih untuk membayar secara manual dengan pengecaman plat lesen dan sistem kawalan akses, jika plat atau muka tidak dapat dikenali, anda juga boleh memilih untuk membuka pintu; secara manual. Tetapi dalam senario aplikasi automatik sepenuhnya, keadaan ini tidak dibenarkan Untuk pengesanan, pengelasan dan pengenalpastian kecacatan produk, pembelajaran mendalam adalah kaedah yang biasa digunakan, tetapi ia juga perlu diputuskan mengikut situasi tertentu. Di samping itu, sebelum latihan, biasanya perlu menggunakan algoritma pemprosesan imej yang lain
Sesetengah orang hanya menggunakan set data awam untuk melatih model pembelajaran mendalam dan menulis artikel, yang tidak menjadi masalah. Walau bagaimanapun, masih jauh untuk pergi jika model ini digunakan dalam aplikasi praktikal. Sebuah syarikat yang saya kenali telah merekrut beberapa Ph.D. untuk menjalankan pemeriksaan visual Namun, enam bulan kemudian, tidak ada keputusan Hasilnya, mereka dikritik hebat oleh pemimpin. Adakah anda tahu mengapa?
Pembelajaran mendalam mendapat tempatnya dalam bidang aplikasi, ini adalah fakta yang tidak dapat dinafikan. Walau bagaimanapun, ia hanya sebahagian daripada pemeriksaan visual dan tidak boleh dilaksanakan dalam banyak aspek lain. Teknologi pengesanan visual semasa hanya boleh digunakan pada beberapa adegan mudah Bagi kebanyakan adegan yang kompleks, tidak kira apa algoritma yang digunakan, pengesanan berkesan tidak boleh dicapai. Oleh itu, algoritma pemprosesan imej visual masih jauh lagi Apabila pembelajaran mendalam melatih imej, ia biasanya memerlukan beberapa pemprosesan imej asal, seperti penapisan, peningkatan, pembahagian ambang, pengesanan tepi dan operasi morfologi. Kadangkala, ia juga perlu untuk memproses imej dan kemudian mengekstrak terus ciri imej untuk latihan pembelajaran mendalam. Ramai orang yang terlibat dalam kerja visual memahami prinsip ini
Telah disebut sebelum ini bahawa jika anda hanya ingin menulis makalah, maka cukup untuk mengkaji satu arah secara mendalam. Penyelidikan teori yang mendalam juga menjanjikan, tetapi ia memerlukan kebolehan teori peribadi yang lebih tinggi. Jika anda belum didedahkan kepada aplikasi penglihatan sebenar, sebaiknya jangan sesuka hati mendakwa bahawa pemprosesan imej sudah lapuk, algoritma pemprosesan imej lain tidak lagi digunakan, dan pembelajaran mendalam telah menggantikan algoritma pemprosesan imej yang lain
Jadi, adakah kita masih memerlukan pemprosesan imej tradisional bagaimana dengan algoritma pemprosesan? Saya rasa jawapan kepada soalan ini adalah jelas. Jika masih terdapat sesuatu yang tidak jelas, sila fikirkan dengan teliti tentang berapa banyak projek berkaitan penglihatan yang anda telah didedahkan, dan apa lagi yang anda tidak tahu Adakah anda benar-benar memahami apa yang boleh dilakukan oleh pemeriksaan visual dan cara melakukannya? Sangat sedikit pemeriksaan visual dicapai semata-mata dengan bergantung pada algoritma pemprosesan imej tunggal. Oleh itu, pada peringkat aplikasi, kita perlu mahir dalam penggunaan pelbagai algoritma pemprosesan imej dan aplikasi gabungan pelbagai algoritma agar dapat beroperasi dengan mudah dalam industri visual. Percutian musim panas akan datang tidak lama lagi
Atas ialah kandungan terperinci Bolehkah pembelajaran mendalam digunakan untuk menggantikan algoritma pemprosesan imej lain?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Tingkatkan produktiviti, kecekapan dan ketepatan pembangun dengan menggabungkan penjanaan dipertingkatkan semula dan memori semantik ke dalam pembantu pengekodan AI. Diterjemah daripada EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, pengarang JanakiramMSV. Walaupun pembantu pengaturcaraan AI asas secara semulajadi membantu, mereka sering gagal memberikan cadangan kod yang paling relevan dan betul kerana mereka bergantung pada pemahaman umum bahasa perisian dan corak penulisan perisian yang paling biasa. Kod yang dijana oleh pembantu pengekodan ini sesuai untuk menyelesaikan masalah yang mereka bertanggungjawab untuk menyelesaikannya, tetapi selalunya tidak mematuhi piawaian pengekodan, konvensyen dan gaya pasukan individu. Ini selalunya menghasilkan cadangan yang perlu diubah suai atau diperhalusi agar kod itu diterima ke dalam aplikasi

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Untuk mengetahui lebih lanjut tentang AIGC, sila layari: 51CTOAI.x Komuniti https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou berbeza daripada bank soalan tradisional yang boleh dilihat di mana-mana sahaja di Internet memerlukan pemikiran di luar kotak. Model Bahasa Besar (LLM) semakin penting dalam bidang sains data, kecerdasan buatan generatif (GenAI) dan kecerdasan buatan. Algoritma kompleks ini meningkatkan kemahiran manusia dan memacu kecekapan dan inovasi dalam banyak industri, menjadi kunci kepada syarikat untuk kekal berdaya saing. LLM mempunyai pelbagai aplikasi Ia boleh digunakan dalam bidang seperti pemprosesan bahasa semula jadi, penjanaan teks, pengecaman pertuturan dan sistem pengesyoran. Dengan belajar daripada sejumlah besar data, LLM dapat menjana teks

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

Editor |. Kulit Lobak Sejak pengeluaran AlphaFold2 yang berkuasa pada tahun 2021, saintis telah menggunakan model ramalan struktur protein untuk memetakan pelbagai struktur protein dalam sel, menemui ubat dan melukis "peta kosmik" setiap interaksi protein yang diketahui. Baru-baru ini, Google DeepMind mengeluarkan model AlphaFold3, yang boleh melakukan ramalan struktur bersama untuk kompleks termasuk protein, asid nukleik, molekul kecil, ion dan sisa yang diubah suai. Ketepatan AlphaFold3 telah dipertingkatkan dengan ketara berbanding dengan banyak alat khusus pada masa lalu (interaksi protein-ligan, interaksi asid protein-nukleik, ramalan antibodi-antigen). Ini menunjukkan bahawa dalam satu rangka kerja pembelajaran mendalam yang bersatu, adalah mungkin untuk dicapai

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S
