Jadual Kandungan
Pengetahuan awal
Pengenalan kaedah
Hasil eksperimen
Rumah Peranti teknologi AI ICLR 2024 Spotlight |. Perlombongan label negatif memudahkan tugas pengesanan luar pengedaran berasaskan CLIP

ICLR 2024 Spotlight |. Perlombongan label negatif memudahkan tugas pengesanan luar pengedaran berasaskan CLIP

May 06, 2024 pm 06:04 PM
git teori

Memandangkan model pembelajaran mesin semakin digunakan dalam senario dunia terbuka, cara mengenal pasti dan memproses data luar pengedaran (OOD) dengan berkesan telah menjadi bidang penyelidikan yang penting. Kehadiran data luar pengedaran boleh menyebabkan model terlalu yakin dan ramalan yang salah, yang amat berbahaya dalam aplikasi kritikal keselamatan seperti pemanduan autonomi dan diagnostik perubatan. Oleh itu, membangunkan mekanisme pengesanan OOD yang berkesan adalah penting untuk meningkatkan keselamatan dan kebolehpercayaan model dalam aplikasi praktikal.

Kaedah pengesanan OOD tradisional tertumpu terutamanya pada satu corak, terutamanya data imej, sambil mengabaikan sumber maklumat lain yang berpotensi berguna, seperti data teks. Dengan peningkatan model bahasa visual (VLM), mereka telah menunjukkan prestasi yang kukuh dalam senario pembelajaran pelbagai mod, terutamanya dalam tugasan yang memerlukan pemahaman serentak tentang imej dan huraian teks yang berkaitan. Kaedah pengesanan OOD sedia ada berdasarkan VLM [3, 4, 5] hanya menggunakan maklumat semantik teg ID, mengabaikan keupayaan sampel sifar yang berkuasa bagi model VLM dan ruang semantik yang sangat luas yang boleh ditafsirkan oleh VLM. Berdasarkan ini, kami percaya bahawa VLM mempunyai potensi besar yang belum diterokai dalam pengesanan OOD, terutamanya bahawa mereka boleh menggunakan maklumat imej dan teks secara menyeluruh untuk meningkatkan hasil pengesanan.

Artikel ini berkisar tentang tiga soalan:

1 Adakah maklumat tag bukan ID berguna untuk pengesanan OOD sifar?

2. Bagaimana untuk melombong maklumat yang bermanfaat untuk pengesanan OOD sampel sifar?

3. Bagaimana untuk menggunakan maklumat yang dilombong untuk pengesanan OOD sampel sifar?

Dalam projek ini, kami mencadangkan pendekatan inovatif yang dipanggil NegLabel yang menggunakan VLM untuk pengesanan OOD. Kaedah NegLabel secara khusus memperkenalkan mekanisme "label negatif" ini mempunyai perbezaan semantik yang ketara dengan label kategori ID yang diketahui Dengan menganalisis dan membandingkan pertalian dan sifat imej dan label ID dan label negatif, NegLabel boleh membezakan pengedaran kepunyaan dengan berkesan. sampel di luar model, dengan itu meningkatkan keupayaan model untuk mengenal pasti sampel OOD dengan ketara.

NegLabel telah mencapai prestasi unggul dalam berbilang tanda aras pengesanan OOD tangkapan sifar. Ia boleh mencapai 94.21% AUROC dan 25.40% FPR95 pada set data berskala besar seperti ImageNet-1k. Berbanding dengan kaedah pengesanan OOD berdasarkan VLM, NegLabel bukan sahaja tidak memerlukan proses latihan tambahan, tetapi juga menunjukkan prestasi unggul. Di samping itu, NegLabel menunjukkan fleksibiliti dan keteguhan yang sangat baik pada seni bina VLM yang berbeza.

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ØPautan kertas: https://arxiv.org/pdf/2403.20078.pdf

ØPautan kod: https://github.com/tmlr-group/NegLabel

Saya akan perkenalkan secara ringkas kepada anda seterusnya Kongsi hasil penyelidikan kami yang diterbitkan baru-baru ini mengenai pengesanan luar pengedaran di ICLR 2024.

Pengetahuan awal

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

Pengenalan kaedah

Inti NegLabel ialah pengenalan mekanisme "label negatif" ini mempunyai perbezaan semantik yang ketara dengan label kategori ID yang diketahui dengan menganalisis dan membandingkan ID label dan label negatif Dengan pertaliannya, NegLabel boleh membezakan sampel yang tergolong di luar pengedaran, dengan itu meningkatkan keupayaan model untuk mengenal pasti sampel OOD dengan ketara.

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

Rajah 1. Gambaran keseluruhan NegLabel

1.

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

2. Bagaimana cara menggunakan label negatif untuk pengesanan OOD?

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

3. Bagaimana untuk memahami bahawa sampel negatif boleh menggalakkan pengesanan OOD sampel sifar?

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

Hasil eksperimen

Kerja penyelidikan kami menyediakan hasil percubaan berbilang dimensi untuk memahami prestasi dan mekanisme asas kaedah yang dicadangkan kami.

Seperti yang ditunjukkan dalam jadual di bawah, berbanding dengan banyak kaedah penanda aras dan kaedah lanjutan dengan prestasi cemerlang, kaedah yang dicadangkan dalam artikel ini boleh mencapai hasil pengesanan luar pengedaran yang lebih baik pada set data berskala besar (seperti ImageNet).

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

Selain itu, seperti yang ditunjukkan dalam jadual di bawah, kaedah dalam artikel ini mempunyai keteguhan yang lebih baik apabila data ID mengalami pemindahan domain.

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

Dalam dua jadual berikut, kami menjalankan eksperimen ablasi pada setiap modul NegLabel dan struktur VLM. Seperti yang dapat dilihat daripada jadual di sebelah kiri, kedua-dua algoritma NegMining dan strategi Pengumpulan boleh meningkatkan prestasi pengesanan OOD dengan berkesan. Jadual di sebelah kanan menunjukkan bahawa algoritma NegLabel yang kami cadangkan mempunyai kebolehsuaian yang baik kepada VLM struktur yang berbeza.

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

Kami juga melakukan analisis visual tentang perkaitan imej input yang berbeza untuk teg ID dan teg negatif Untuk percubaan dan keputusan yang lebih terperinci, sila rujuk artikel asal.

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务

references

[1] Hendrycks, D. dan Gimpel, K. Satu garis dasar untuk mengesan contoh-contoh yang tidak disengajakan dan keluar-of-distribusi dalam rangkaian saraf. Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal,Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, et al. Mempelajari model visual yang boleh dipindahkan daripada penyeliaan bahasa semula jadi.

[. 3] Sepideh Esmaeilpour, Bing Liu, Eric Robertson, dan Lei Shu Pengesanan di luar pengedaran Zero-shot berdasarkan klip model pra-latihan Dalam AAAI, 2022.

[4] Yifei Ming, Ziyang Cai, Jiuxiang. Gu, Yiyou Sun, Wei Li dan Yixuan Li Menyelidiki pengesanan luar pengedaran dengan perwakilan bahasa penglihatan Dalam NeurIPS, 2022a.

[5] Hualiang Wang, Yi Li, Huifeng Yao dan Xiaomeng Li untuk sifar -shot ood detection: Mengajar klip untuk mengatakan tidak ICCV, 2023.

[6] Christiane Fellbaum: Sebuah Pangkalan Data Leksikal Elektronik, 1998.

Atas ialah kandungan terperinci ICLR 2024 Spotlight |. Perlombongan label negatif memudahkan tugas pengesanan luar pengedaran berasaskan CLIP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Apr 02, 2025 pm 02:06 PM

Perpustakaan yang digunakan untuk operasi nombor terapung dalam bahasa Go memperkenalkan cara memastikan ketepatannya ...

Perpustakaan mana yang dibangunkan oleh syarikat besar atau disediakan oleh projek sumber terbuka yang terkenal? Perpustakaan mana yang dibangunkan oleh syarikat besar atau disediakan oleh projek sumber terbuka yang terkenal? Apr 02, 2025 pm 04:12 PM

Perpustakaan mana yang dibangunkan oleh syarikat besar atau projek sumber terbuka yang terkenal? Semasa pengaturcaraan di GO, pemaju sering menghadapi beberapa keperluan biasa, ...

GITEE PAGES PENYEDIAAN LAMAN WEB STATIC Gagal: Bagaimana menyelesaikan masalah dan menyelesaikan kesilapan fail tunggal 404? GITEE PAGES PENYEDIAAN LAMAN WEB STATIC Gagal: Bagaimana menyelesaikan masalah dan menyelesaikan kesilapan fail tunggal 404? Apr 04, 2025 pm 11:54 PM

Giteepages Statik Laman Web Penggunaan Gagal: 404 Penyelesaian Masalah dan Resolusi Ralat Semasa Menggunakan Gitee ...

Cara Menjalankan Projek H5 Cara Menjalankan Projek H5 Apr 06, 2025 pm 12:21 PM

Menjalankan projek H5 memerlukan langkah -langkah berikut: memasang alat yang diperlukan seperti pelayan web, node.js, alat pembangunan, dan lain -lain. Membina persekitaran pembangunan, membuat folder projek, memulakan projek, dan menulis kod. Mulakan pelayan pembangunan dan jalankan arahan menggunakan baris arahan. Pratonton projek dalam penyemak imbas anda dan masukkan URL Server Pembangunan. Menerbitkan projek, mengoptimumkan kod, menggunakan projek, dan menyediakan konfigurasi pelayan web.

Bagaimana untuk mendapatkan data kawasan perkapalan versi luar negara? Apakah beberapa sumber siap sedia ada? Bagaimana untuk mendapatkan data kawasan perkapalan versi luar negara? Apakah beberapa sumber siap sedia ada? Apr 01, 2025 am 08:15 AM

Penerangan Soalan: Bagaimana untuk mendapatkan data kawasan perkapalan versi luar negara? Adakah sumber sedia ada yang ada? Dapatkan tepat dalam e-dagang rentas sempadan atau perniagaan global ...

Bagaimana menyelesaikan masalah penukaran jenis user_id semasa menggunakan aliran redis untuk melaksanakan beratur mesej dalam bahasa Go? Bagaimana menyelesaikan masalah penukaran jenis user_id semasa menggunakan aliran redis untuk melaksanakan beratur mesej dalam bahasa Go? Apr 02, 2025 pm 04:54 PM

Masalah menggunakan redisstream untuk melaksanakan beratur mesej dalam bahasa Go menggunakan bahasa Go dan redis ...

Bagaimana cara menentukan pangkalan data yang berkaitan dengan model dalam beego orm? Bagaimana cara menentukan pangkalan data yang berkaitan dengan model dalam beego orm? Apr 02, 2025 pm 03:54 PM

Di bawah rangka kerja beegoorm, bagaimana untuk menentukan pangkalan data yang berkaitan dengan model? Banyak projek beego memerlukan pelbagai pangkalan data untuk dikendalikan secara serentak. Semasa menggunakan beego ...

Adakah pengeluaran halaman H5 memerlukan penyelenggaraan berterusan? Adakah pengeluaran halaman H5 memerlukan penyelenggaraan berterusan? Apr 05, 2025 pm 11:27 PM

Halaman H5 perlu dikekalkan secara berterusan, kerana faktor -faktor seperti kelemahan kod, keserasian pelayar, pengoptimuman prestasi, kemas kini keselamatan dan peningkatan pengalaman pengguna. Kaedah penyelenggaraan yang berkesan termasuk mewujudkan sistem ujian lengkap, menggunakan alat kawalan versi, kerap memantau prestasi halaman, mengumpul maklum balas pengguna dan merumuskan pelan penyelenggaraan.

See all articles