Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara-AI-php.cn

Jadual Kandungan

Keputusan

Rumah

Peranti teknologi

Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 05:46 PM

ai Model

Sebelum ini, ImageNet menjadi topik hangat kerana masalah ralat label Anda mungkin terkejut mendengar nombor ini sekurang-kurangnya 100,000 label bermasalah. Kajian berdasarkan label yang salah mungkin perlu dibatalkan dan diulang.

Dari sudut pandangan ini, mengurus kualiti set data masih sangat penting.

Ramai orang akan menggunakan set data ImageNet sebagai penanda aras, tetapi berdasarkan model pra-latihan ImageNet, keputusan akhir mungkin berbeza-beza disebabkan kualiti data.

Dalam artikel ini, Kenichi Higuchi, seorang jurutera dari Syarikat Adansons, mengkaji semula set data ImageNet dalam artikel "Are we done with ImageNet?" Selepas mengalih keluar data label yang salah dinilai semula dan diterbitkan pada model torchvision.

Alih keluar data yang salah daripada ImageNet dan nilai semula model

Kertas ini membahagikan ralat pelabelan dalam ImageNet kepada tiga kategori, seperti yang ditunjukkan di bawah.

(1) Data dengan pelabelan yang salah

(2) Data yang sepadan dengan berbilang teg

(3) Data yang bukan milik mana-mana teg

Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara

Ringkasnya, terdapat lebih kurang 14,000 data yang tersilap memandangkan bilangan data penilaian ialah 50,000, dapat dilihat bahawa nisbah data yang salah adalah sangat tinggi. . Rajah di bawah menunjukkan beberapa data ralat yang mewakili.

Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara

Kaedah

Tanpa melatih semula model, kajian ini hanya mengecualikan data yang dilabelkan secara salah, iaitu di atas- jenis (1) data yang salah, dan tidak termasuk semua data yang salah daripada data penilaian, iaitu, (1)-(3) data yang salah, untuk menyemak semula ketepatan model.

Untuk mengalih keluar data yang salah, fail metadata yang menerangkan maklumat ralat teg diperlukan. Dalam fail metadata ini, jika ia mengandungi ralat jenis (1)-(3), maklumat akan diterangkan dalam atribut "pembetulan".

Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara

Kajian ini menggunakan alat yang dipanggil Adansons Base, yang menapis data dengan memautkan set data kepada metadata. 10 model telah diuji di sini seperti yang ditunjukkan di bawah.

Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara

10 model klasifikasi imej untuk ujian

Keputusan

Keputusan ditunjukkan dalam jadual di bawah (angka nilai ialah ketepatan dalam %, nombor dalam kurungan ialah kedudukan)

Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara

Hasil 10 model klasifikasi

Dengan Semua Data eval ialah garis asas. Tidak termasuk jenis data yang salah (1), ketepatan meningkat sebanyak purata 3.122 mata. Tidak termasuk semua data yang salah (1) hingga (3), ketepatan meningkat sebanyak purata 11.743 mata.

Seperti yang dijangka, tidak termasuk data yang salah, kadar ketepatan dipertingkatkan secara menyeluruh. Tidak dinafikan bahawa berbanding dengan data bersih, data yang salah terdedah kepada ralat.

Kedudukan ketepatan model berubah apabila penilaian dilakukan tanpa mengecualikan data yang salah dan apabila data yang salah (1)~(3) semuanya dikecualikan.

Dalam artikel ini, terdapat 3,670 data yang salah (1), menyumbang 7.34% daripada jumlah 50,000 keping data Selepas dialih keluar, kadar ketepatan meningkat kira-kira 3.22 mata secara purata. Apabila data yang salah dialih keluar, skala data berubah dan perbandingan mudah kadar ketepatan mungkin berat sebelah.

Kesimpulan

Walaupun tidak begitu ditekankan, adalah penting untuk menggunakan data yang dilabel dengan tepat semasa melakukan latihan penilaian.

Kajian terdahulu mungkin telah membuat kesimpulan yang salah apabila membandingkan ketepatan antara model. Jadi data harus dinilai terlebih dahulu, tetapi bolehkah ini benar-benar digunakan untuk menilai prestasi model?

Banyak model yang menggunakan pembelajaran mendalam sering meremehkan data, tetapi tidak sabar-sabar untuk meningkatkan ketepatan dan metrik penilaian lain melalui prestasi model, walaupun data penilaian mengandungi data yang salah dengan tepat.

Apabila mencipta set data anda sendiri, seperti semasa menggunakan AI dalam perniagaan, mencipta set data berkualiti tinggi secara langsung berkaitan dengan meningkatkan ketepatan dan kebolehpercayaan AI. Keputusan eksperimen kertas ini menunjukkan bahawa hanya meningkatkan kualiti data boleh meningkatkan ketepatan kira-kira 10 mata peratusan, yang menunjukkan kepentingan untuk menambah baik bukan sahaja model tetapi juga set data semasa membangunkan sistem AI.

Walau bagaimanapun, memastikan kualiti set data bukanlah mudah. Walaupun meningkatkan jumlah metadata adalah penting untuk menilai kualiti model dan data AI dengan betul, ia boleh menyusahkan untuk diurus, terutamanya dengan data tidak berstruktur.

Atas ialah kandungan terperinci Ralat label ImageNet dialih keluar, kedudukan model berubah dengan ketara. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Arahan sembang dan cara menggunakannya

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7529

Tutorial CakePHP

1378

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Cara Melaksanakan Penyortiran Fail oleh Debian Readdir Apr 13, 2025 am 09:06 AM

Dalam sistem Debian, fungsi Readdir digunakan untuk membaca kandungan direktori, tetapi urutan yang dikembalikannya tidak ditentukan sebelumnya. Untuk menyusun fail dalam direktori, anda perlu membaca semua fail terlebih dahulu, dan kemudian menyusunnya menggunakan fungsi QSORT. Kod berikut menunjukkan cara menyusun fail direktori menggunakan ReadDir dan QSORT dalam sistem Debian:#termasuk#termasuk#termasuk#termasuk // fungsi perbandingan adat, yang digunakan untuk qSortintCompare (Constvoid*A, Constvoid*b) {Returnstrcmp (*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(

Cara Menetapkan Tahap Log Debian Apache Apr 13, 2025 am 08:33 AM

Artikel ini menerangkan cara menyesuaikan tahap pembalakan pelayan Apacheweb dalam sistem Debian. Dengan mengubah suai fail konfigurasi, anda boleh mengawal tahap maklumat log yang direkodkan oleh Apache. Kaedah 1: Ubah suai fail konfigurasi utama untuk mencari fail konfigurasi: Fail konfigurasi apache2.x biasanya terletak di direktori/etc/apache2/direktori. Nama fail mungkin apache2.conf atau httpd.conf, bergantung pada kaedah pemasangan anda. Edit Fail Konfigurasi: Buka Fail Konfigurasi dengan Kebenaran Root Menggunakan Editor Teks (seperti Nano): Sudonano/ETC/APACHE2/APACHE2.CONF

Cara Mengoptimumkan Prestasi Debian Readdir Apr 13, 2025 am 08:48 AM

Dalam sistem Debian, panggilan sistem Readdir digunakan untuk membaca kandungan direktori. Jika prestasinya tidak baik, cuba strategi pengoptimuman berikut: Memudahkan bilangan fail direktori: Split direktori besar ke dalam pelbagai direktori kecil sebanyak mungkin, mengurangkan bilangan item yang diproses setiap panggilan readdir. Dayakan Caching Kandungan Direktori: Bina mekanisme cache, kemas kini cache secara teratur atau apabila kandungan direktori berubah, dan mengurangkan panggilan kerap ke Readdir. Cafh memori (seperti memcached atau redis) atau cache tempatan (seperti fail atau pangkalan data) boleh dipertimbangkan. Mengamalkan struktur data yang cekap: Sekiranya anda melaksanakan traversal direktori sendiri, pilih struktur data yang lebih cekap (seperti jadual hash dan bukannya carian linear) untuk menyimpan dan mengakses maklumat direktori

Petua Konfigurasi Firewall Pelayan Mel Debian Apr 13, 2025 am 11:42 AM

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Kaedah pemasangan sijil SSL Server Server Debian Apr 13, 2025 am 11:39 AM

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Apr 13, 2025 am 09:42 AM

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Bagaimana Debian OpenSSL Menghalang Serangan Man-dalam-Middle Apr 13, 2025 am 10:30 AM

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession

Cara Melakukan Pengurusan Log Debian Hadoop Apr 13, 2025 am 10:45 AM

Menguruskan Log Hadoop pada Debian, anda boleh mengikuti langkah-langkah berikut dan amalan terbaik: Agregasi log membolehkan pengagregatan log: tetapkan benang.log-agregasi-enable untuk benar dalam fail benang-site.xml untuk membolehkan pengagregatan log. Konfigurasikan dasar pengekalan log: tetapkan yarn.log-aggregasi.Retain-seconds Untuk menentukan masa pengekalan log, seperti 172800 saat (2 hari). Nyatakan Laluan Penyimpanan Log: Melalui Benang

See all articles