Baru-baru ini, keputusan pertandingan CVPR 2023 telah diumumkan. NetEase Fuxi Lab mencapai tempat pertama dalam Cabaran Pengiktirafan Sasaran UG2+ CVPR 2023 dan Cabaran Pengiktirafan Sasaran Sedikit Sampel VizWiz. Kertas kerja berkaitan mereka juga telah diterima oleh TIP, jurnal antarabangsa terkemuka. Ini menunjukkan bahawa keupayaan inovasi teknologi teratas NetEase Fuxi dalam bidang penglihatan komputer telah diiktiraf tinggi di peringkat antarabangsa.
Dari Februari hingga Jun 2023, IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR), sebagai persidangan teratas dalam bidang penglihatan komputer antarabangsa dan pengecaman corak, telah bekerjasama dengan institusi akademik berwibawa global dan perusahaan terkenal untuk mengadakan beberapa perlumbaan cabaran. Cabaran ini telah menarik penyertaan meluas daripada banyak pasukan penyelidikan AI. Baru-baru ini, CVPR telah berturut-turut mengumumkan keputusan anugerah dan mengeluarkan sijil anugerah. Sebagai persidangan akademik AI terkemuka yang dihoskan oleh IEEE, CVPR mempunyai pengaruh akademik dan pengiktirafan sosial yang sangat tinggi.
Dalam Cabaran Pengesanan Objek CVPR 2023 UG2+ dalam Jerebu dan Cabaran Pengecaman Objek Sedikit Tembakan VizWiz CVPR 2023, NetEase Fuxi dan Guru Sains dan Teknologi China Yu Jun dari universiti bekerja sebagai satu pasukan dan mencapai tempat pertama. Kerjasama ini tertumpu terutamanya kepada dua aspek: pengesanan sasaran dan pengecaman sasaran beberapa sampel dalam bidang penglihatan komputer. Teknologi ini boleh digunakan secara meluas dalam tugas penglihatan dalam pelbagai bidang. Terutamanya dalam aplikasi perindustrian, pengesanan sasaran beberapa sampel mempunyai nilai dan kepentingan yang besar dalam senario di mana pemerolehan data dan anotasi adalah sukar. Melalui kejayaan pertandingan ini, kami telah menunjukkan kekuatan penyelidikan dan keupayaan inovasi NetEase Fuxi dalam bidang penglihatan komputer. Kami akan terus komited untuk mempromosikan pembangunan teknologi penglihatan komputer dan menyediakan penyelesaian yang lebih tepat dan cekap untuk aplikasi praktikal.
UG2+ bertujuan untuk memajukan analisis imej "sukar" dengan menggunakan algoritma pemulihan dan peningkatan imej untuk meningkatkan prestasi analisis. Peserta ditugaskan untuk membangunkan algoritma baharu untuk menambah baik analisis imej yang ditangkap dalam keadaan bermasalah. Matlamat VizWiz adalah untuk menyedarkan lebih ramai orang tentang keperluan teknologi dan minat mereka yang cacat penglihatan dan untuk menggalakkan penyelidik kecerdasan buatan membangunkan algoritma baharu untuk menghapuskan halangan kebolehaksesan. Pertandingan biasanya termasuk tugas seperti mengenal pasti objek dalam imej, mengenal pasti teks dalam imej dan menjawab soalan tentang imej. Berikut ialah ikhtisar ringkas kertas pemenang anugerah NetEase Fuxi:
Perwakilan pemilihan Saluran frekuensi-Omni untuk Pengesanan Anomali Tidak Diawasi
Perwakilan Pemilihan Saluran frekuensi-Omni untuk Pengesanan Anomaly Tanpa Pengawasan
Kata Kunci Tanpa Pengawasan: Pengesanan anomali memainkan peranan penting dalam pemahaman imej visual dan digunakan untuk menentukan sama ada imej yang diberikan menyimpang daripada keadaan normal yang dipratetap. Ia digunakan secara meluas dalam pengesanan kebaharuan, pemantauan kualiti produk berasaskan imej industri, pembaikan kecacatan automatik, pemantauan kesihatan manusia dan pengawasan video. Pada masa ini, terdapat tiga jenis utama kaedah pengesanan anomali tanpa pengawasan arus perdana, termasuk kaedah berasaskan kepadatan, kaedah berasaskan klasifikasi dan kaedah berasaskan pembinaan semula. Kaedah ini mencapai pengesanan anomali dengan menganalisis ciri statistik imej, mempelajari sampel biasa dan membina semula imej, menyediakan alat yang boleh dipercayai dan sokongan teknikal untuk pelbagai aplikasi. Antaranya, kaedah berdasarkan pembinaan semula jarang disebut kerana keupayaan pembinaan semula yang lemah dan prestasi yang rendah Namun, ia tidak memerlukan sampel latihan tambahan yang banyak untuk latihan tanpa pengawasan dan lebih praktikal dalam aplikasi industri. Untuk tujuan ini, kajian ini memfokuskan pada penambahbaikan kaedah berasaskan pembinaan semula dan mencadangkan rangkaian pembinaan semula terpilih saluran frekuensi penuh (OCR-GAN), yang merupakan yang pertama mengendalikan tugas pengesanan anomali deria dari perspektif kekerapan. Sebilangan besar eksperimen telah membuktikan keberkesanan dan keunggulan kaedah ini berbanding kaedah lain. Sebagai contoh, tanpa data latihan tambahan, prestasi SOTA baharu dicapai pada set data MVTec AD, dengan AUC 98.3, dengan ketara melebihi garis dasar kaedah berasaskan pembinaan semula 38.1 dan kaedah SOTA semasa sebanyak 0.3. Makalah ini mencadangkan penyelesaian inovatif untuk menyelesaikan masalah anomali UI dalam ujian keserasian permainan pintar. Penyelesaian ini menggunakan teknologi kecerdasan buatan untuk mengesan secara automatik anomali UI yang berlaku semasa permainan dijalankan, dan merealisasikan automasi ujian keserasian permainan. Dengan menggunakan teknologi pengesanan anomali imej, kami secara automatik mengesan sejumlah besar tangkapan skrin antara muka permainan yang dijana daripada perspektif penglihatan komputer, mendapatkan gambar luar biasa UI daripadanya dan membantu pembangun permainan untuk mengesan punca masalah dengan cepat dan tepat, dengan itu menjimatkan dengan berkesan ujian permainan.
Kertas kerja ini, dengan kerjasama pasukan Profesor Liu Yong dari Universiti Zhejiang, telah dipilih untuk diterbitkan dalam jurnal IEEE Transactions on Image Processing (TIP). TIP ialah jurnal teratas dalam bidang penyelidikan pemprosesan imej di bawah IEEE Ia adalah jurnal dalam bidang SCI Akademi Sains China, dan jurnal Kategori A dalam bidang grafik komputer dan multimedia (CCF A) disyorkan. oleh Persatuan Komputer China. Faktor impak jurnal pada 2022-2023 mencapai 11.041.
Atas ialah kandungan terperinci NetEase Fuxi memenangi pertandingan CVPR 2023 UG2+ dan VizWiz, dan kertas kerjanya dipilih sebagai TIP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!