Rumah Peranti teknologi AI CVPR 2024 |. Byte mencadangkan set data COCONut generasi baharu, yang lebih padat daripada segmentasi berbutir COCO

CVPR 2024 |. Byte mencadangkan set data COCONut generasi baharu, yang lebih padat daripada segmentasi berbutir COCO

Apr 22, 2024 pm 04:20 PM
git projek penyuntingan video cvpr2024 coconut

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com.

Dengan perkembangan kecerdasan buatan, model bahasa dan model generatif telah mencapai banyak kejayaan, dan dalam proses mereka bentuk model, bilangan parameter model juga semakin meningkat. Untuk tugas pemahaman yang terperinci, bilangan parameter model juga semakin meningkat. Walau bagaimanapun, terdapat percanggahan antara skala dan ketepatan dalam set data sedia ada, contohnya, 99.1% daripada topeng dalam set data SA-1B adalah dijana oleh mesin, tetapi tiada label semantik yang lain juga mempunyai ketepatan masalah, dan ini Saiz set data secara amnya agak kecil.

Baru-baru ini, ByteDance mencadangkan set data pemahaman terperinci generasi baharu Sebagai tindak balas kepada keperluan reka bentuk model pembelajaran mendalam kontemporari, sejumlah 383K imej telah diberi anotasi secara manual untuk pembahagian panorama, dan akhirnya mencapai 5.18M. Topeng Zhang ialah set data pemahaman segmentasi panorama terbesar dengan label buatan setakat ini, dinamakan COCONut. Keputusan ini telah dipilih untuk CVPR2024.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

  • Pautan kertas: https://arxiv.org/abs/2404.08639
  • Pautan kod dan set data: https://xdeng7.github.io/coconut.github.io/coconut.github.
    /
Video menunjukkan kepadatan topeng dan statistik kategori semantik bagi imej tunggal COCONut Dapat dilihat bahawa semantik set data adalah kaya dan butiran pembahagian topeng adalah baik. Set data juga menyokong pelbagai tugas pemahaman, seperti pembahagian panoramik, pembahagian contoh, pembahagian semantik, pengesanan objek, penjanaan dikawal secara semantik dan pembahagian kosa kata terbuka, mencapai peningkatan prestasi yang ketara pada berbilang tugas hanya dengan menggantikan set data.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集Kaedah anotasi

Biasanya hanya menggunakan anotasi manual adalah sangat mahal, yang juga merupakan sebab penting mengapa kebanyakan set data awam sedia ada tidak boleh meningkat dalam skala. Terdapat juga beberapa set data yang secara langsung menggunakan label yang dijana oleh model, tetapi selalunya label yang dijana sedemikian tidak akan meningkatkan latihan model dengan ketara. Artikel ini juga mengesahkan perkara ini. Oleh itu, kertas kerja ini mencadangkan kaedah anotasi baru, digabungkan dengan penjanaan label separa automatik manual. Ia bukan sahaja dapat memastikan ketepatan anotasi data, tetapi juga menjimatkan kos buruh manual, di samping mempercepatkan proses anotasi.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集Perbandingan ketepatan anotasi

Para penyelidik membandingkan anotasi COCONut dan COCO pada gambar yang sama. Daripada perbandingan dalam rajah di bawah, kita dapat melihat bahawa kaedah anotasi yang dicadangkan dalam artikel ini mencapai ketepatan yang hampir sama dengan anotasi manual semata-mata menggunakan Photoshop, tetapi kelajuan anotasi meningkat lebih daripada 10 kali ganda.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集Butiran set data COCONut

Berbanding set data COCO sedia ada, taburan setiap kategori set data adalah agak serupa, tetapi jumlah keseluruhan topeng CO dalam setiap gambar set data, terutamanya apabila terdapat sejumlah besar imej tunggal dengan lebih daripada 100 topeng, yang menunjukkan bahawa anotasi COCONut lebih halus dan pembahagian berbutir lebih padat.
Pengesahan eksperimen

Selain mencadangkan set latihan yang lebih baik, penyelidik juga mendapati set pengesahan sedia ada tidak dapat mencerminkan peningkatan prestasi model, jadi artikel ini juga mencadangkan set ujian yang lebih mencabar. boleh mencerminkan penambahbaikan model dinamakan COCONut-val Seperti yang dapat dilihat daripada jadual di bawah, hanya menggantikan set data dan set latihan ketepatan yang lebih tinggi boleh membawa peningkatan yang hebat dalam model, seperti mencapai lebih daripada 4 in. pembahagian panoramik A titik PQ. Walau bagaimanapun, apabila saiz set latihan meningkat, boleh didapati bahawa ujian dengan set ujian sedia ada tidak mencerminkan peningkatan model, manakala COCONut-val boleh mencerminkan bahawa model masih mempunyai peningkatan yang jelas selepas meningkatkan jumlah latihan menetapkan data.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

Rajah berikut menunjukkan perbandingan kategori semantik dan ketumpatan topeng set pengesahan Ia dapat dilihat bahawa set pengesahan yang baru dicadangkan adalah lebih mencabar dan boleh mencerminkan penambahbaikan model.

CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集

Untuk lebih banyak hasil percubaan, sila rujuk kertas asal Pasukan akan menyediakan set data dan model yang sepadan untuk muat turun awam di halaman utama GitHub.

ByteDance Intelligent Creation Team

Pasukan Penciptaan Pintar ialah ByteDance AI & pasukan teknologi multimedia, meliputi penglihatan komputer, pemprosesan audio dan video khas serta penyuntingan teknikal yang lain Senario perniagaan yang kaya, sumber infrastruktur dan suasana kerjasama teknikal merealisasikan gelung tertutup algoritma canggih - sistem kejuruteraan - produk, bertujuan untuk menyediakan pemahaman kandungan terkemuka industri, penciptaan kandungan dan interaksi untuk pelbagai perniagaan dalam syarikat dalam pelbagai bentuk . Keupayaan pengalaman dan penggunaan serta penyelesaian industri.

Pada masa ini, pasukan penciptaan pintar telah membuka keupayaan teknikal dan perkhidmatannya kepada perusahaan melalui Volcano Engine, platform perkhidmatan awan yang dimiliki oleh ByteDance. Lebih banyak kedudukan yang berkaitan dengan algoritma model besar sedang dibuka.

Atas ialah kandungan terperinci CVPR 2024 |. Byte mencadangkan set data COCONut generasi baharu, yang lebih padat daripada segmentasi berbutir COCO. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Apr 02, 2025 pm 02:06 PM

Perpustakaan yang digunakan untuk operasi nombor terapung dalam bahasa Go memperkenalkan cara memastikan ketepatannya ...

Cara Menjalankan Projek H5 Cara Menjalankan Projek H5 Apr 06, 2025 pm 12:21 PM

Menjalankan projek H5 memerlukan langkah -langkah berikut: memasang alat yang diperlukan seperti pelayan web, node.js, alat pembangunan, dan lain -lain. Membina persekitaran pembangunan, membuat folder projek, memulakan projek, dan menulis kod. Mulakan pelayan pembangunan dan jalankan arahan menggunakan baris arahan. Pratonton projek dalam penyemak imbas anda dan masukkan URL Server Pembangunan. Menerbitkan projek, mengoptimumkan kod, menggunakan projek, dan menyediakan konfigurasi pelayan web.

GITEE PAGES PENYEDIAAN LAMAN WEB STATIC Gagal: Bagaimana menyelesaikan masalah dan menyelesaikan kesilapan fail tunggal 404? GITEE PAGES PENYEDIAAN LAMAN WEB STATIC Gagal: Bagaimana menyelesaikan masalah dan menyelesaikan kesilapan fail tunggal 404? Apr 04, 2025 pm 11:54 PM

Giteepages Statik Laman Web Penggunaan Gagal: 404 Penyelesaian Masalah dan Resolusi Ralat Semasa Menggunakan Gitee ...

Bagaimana cara menentukan pangkalan data yang berkaitan dengan model dalam beego orm? Bagaimana cara menentukan pangkalan data yang berkaitan dengan model dalam beego orm? Apr 02, 2025 pm 03:54 PM

Di bawah rangka kerja beegoorm, bagaimana untuk menentukan pangkalan data yang berkaitan dengan model? Banyak projek beego memerlukan pelbagai pangkalan data untuk dikendalikan secara serentak. Semasa menggunakan beego ...

Perpustakaan mana yang dibangunkan oleh syarikat besar atau disediakan oleh projek sumber terbuka yang terkenal? Perpustakaan mana yang dibangunkan oleh syarikat besar atau disediakan oleh projek sumber terbuka yang terkenal? Apr 02, 2025 pm 04:12 PM

Perpustakaan mana yang dibangunkan oleh syarikat besar atau projek sumber terbuka yang terkenal? Semasa pengaturcaraan di GO, pemaju sering menghadapi beberapa keperluan biasa, ...

Bagaimana menyelesaikan masalah penukaran jenis user_id semasa menggunakan aliran redis untuk melaksanakan beratur mesej dalam bahasa Go? Bagaimana menyelesaikan masalah penukaran jenis user_id semasa menggunakan aliran redis untuk melaksanakan beratur mesej dalam bahasa Go? Apr 02, 2025 pm 04:54 PM

Masalah menggunakan redisstream untuk melaksanakan beratur mesej dalam bahasa Go menggunakan bahasa Go dan redis ...

Adakah pengeluaran halaman H5 memerlukan penyelenggaraan berterusan? Adakah pengeluaran halaman H5 memerlukan penyelenggaraan berterusan? Apr 05, 2025 pm 11:27 PM

Halaman H5 perlu dikekalkan secara berterusan, kerana faktor -faktor seperti kelemahan kod, keserasian pelayar, pengoptimuman prestasi, kemas kini keselamatan dan peningkatan pengalaman pengguna. Kaedah penyelenggaraan yang berkesan termasuk mewujudkan sistem ujian lengkap, menggunakan alat kawalan versi, kerap memantau prestasi halaman, mengumpul maklum balas pengguna dan merumuskan pelan penyelenggaraan.

Apabila menggunakan sql.open, mengapa tidak melaporkan ralat apabila DSN berlalu kosong? Apabila menggunakan sql.open, mengapa tidak melaporkan ralat apabila DSN berlalu kosong? Apr 02, 2025 pm 12:54 PM

Apabila menggunakan SQL.Open, mengapa DSN tidak melaporkan ralat? Dalam bahasa Go, sql.open ...

See all articles