Rumah Peranti teknologi AI Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Jun 06, 2024 pm 12:20 PM
ai Model

Siri penanda aras YOLO sistem pengesanan sasaran sekali lagi menerima peningkatan besar.

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Sejak pengeluaran YOLOv9 pada Februari tahun ini, baton siri YOLO (You Only Look Once) telah diserahkan kepada para penyelidik di Universiti Tsinghua.

Hujung minggu lalu, berita pelancaran YOLOv10 menarik perhatian komuniti AI. Ia dianggap sebagai rangka kerja terobosan dalam bidang penglihatan komputer dan terkenal dengan keupayaan pengesanan objek hujung ke hujung masa nyata, meneruskan legasi siri YOLO dengan menyediakan penyelesaian berkuasa yang menggabungkan kecekapan dan ketepatan.

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Alamat kertas: https://arxiv.org/pdf/2405.14458

Alamat projek: https://github.com/THU-MIG/yolov10 adalah versi baharu

dikeluarkan, Ramai orang telah menjalankan ujian penempatan dengan keputusan yang baik:

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub


Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

YOLO sentiasa menjadi paradigma utama dalam bidang pengesanan sasaran masa nyata kerana prestasi yang berkuasa dan penggunaan yang rendah kuasa pengkomputeran. Rangka kerja ini digunakan secara meluas dalam pelbagai aplikasi praktikal, termasuk pemanduan autonomi, pengawasan dan logistik. Keupayaan pengesanan objeknya yang cekap dan tepat menjadikannya sesuai untuk tugas seperti mengenal pasti pejalan kaki dan kenderaan dalam masa nyata dalam logistik, ia membantu pengurusan inventori dan penjejakan pakej, dan keupayaan AInya membantu orang ramai meningkatkan kecekapan dalam banyak tugas.

Sejak beberapa tahun kebelakangan ini, penyelidik telah meneroka reka bentuk seni bina YOLO, matlamat pengoptimuman, strategi peningkatan data, dsb., dan telah mencapai kemajuan yang ketara. Walau bagaimanapun, pergantungan pasca pemprosesan pada penindasan bukan maksimum (NMS) menghalang penggunaan YOLO dari hujung ke hujung dan memberi kesan buruk kepada kependaman inferens. Tambahan pula, reka bentuk komponen individu dalam YOLO tidak mempunyai pemeriksaan yang komprehensif dan teliti, mengakibatkan lebihan pengiraan yang ketara dan mengehadkan keupayaan model.

Kejayaan YOLOv10 adalah untuk meningkatkan lagi sempadan kecekapan prestasi YOLO dari segi pasca pemprosesan dan seni bina model.

Untuk tujuan ini, pasukan penyelidik mencadangkan buat kali pertama tugasan dwi konsisten (tugasan dwi konsisten) untuk latihan NMS tanpa YOLO

, yang menjadikan YOLO bertambah baik dari segi prestasi dan kependaman inferens.

Pasukan penyelidik mencadangkan strategi reka bentuk model terdorong ketepatan kecekapan keseluruhan untuk YOLO, mengoptimumkan secara menyeluruh setiap komponen YOLO dari perspektif kecekapan dan ketepatan, mengurangkan overhed pengiraan dan meningkatkan keupayaan model.

Eksperimen yang meluas menunjukkan bahawa YOLOv10 mencapai prestasi dan kecekapan SOTA pada pelbagai skala model. Sebagai contoh, YOLOv10-S adalah 1.8x lebih pantas daripada RT-DETR-R18 pada AP serupa pada COCO, sambil mengurangkan bilangan parameter dan FLOP dengan ketara. Berbanding dengan YOLOv9-C, YOLOv10-B mempunyai pengurangan 46% dalam kependaman dan pengurangan 25% dalam parameter dengan prestasi yang sama.

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Pengenalan kaedah

Untuk mencapai keseluruhan reka bentuk model yang dipacu oleh kecekapan, pasukan penyelidik mencadangkan kaedah penambahbaikan dari dua aspek: kecekapan dan ketepatan.

Untuk meningkatkan kecekapan, kajian ini mencadangkan kepala pengelasan ringan, saluran spatial (saluran ruang) dipisahkan persampelan bawah dan reka bentuk blok berpandukan ranking untuk mengurangkan lebihan pengiraan yang jelas dan mencapai seni bina yang lebih cekap.

Untuk meningkatkan ketepatan, pasukan penyelidik meneroka konvolusi kernel yang besar dan mencadangkan modul perhatian kendiri separa (PSA) yang berkesan untuk meningkatkan keupayaan model dan memanfaatkan potensi peningkatan prestasi pada kos rendah. Berdasarkan kaedah ini, pasukan berjaya melaksanakan satu siri pengesan hujung-ke-hujung masa nyata skala berbeza, iaitu YOLOv10-N/S/M/B/L/X.

Tugasan berganda yang konsisten untuk latihan bebas NMS

Semasa latihan, YOLO biasanya menggunakan TAL untuk memberikan berbilang sampel positif kepada setiap kejadian. Pendekatan peruntukan satu kepada banyak menjana isyarat penyeliaan yang kaya yang memudahkan pengoptimuman dan membolehkan model mencapai prestasi unggul. 🎜🎜

Walau bagaimanapun, ini memerlukan YOLO untuk bergantung pada pemprosesan pasca NMS, yang menghasilkan kecekapan inferens yang tidak optimum apabila digunakan. Walaupun kerja-kerja penyelidikan terdahulu telah meneroka padanan satu dengan satu untuk menyekat ramalan yang berlebihan, mereka sering memperkenalkan overhed inferens tambahan.

Tidak seperti tugasan satu dengan banyak, padanan satu dengan satu hanya memberikan satu ramalan kepada setiap kebenaran asas, mengelakkan pemprosesan pasca NMS. Walau bagaimanapun, ini membawa kepada penyeliaan yang lemah, supaya ketepatan dan kelajuan penumpuan tidak ideal. Nasib baik, kekurangan ini boleh diperbaiki dengan peruntukan satu-ke-banyak.

"peruntukan dua label" yang dicadangkan dalam kajian ini menggabungkan kelebihan dua strategi di atas. Seperti yang ditunjukkan dalam rajah di bawah, penyelidikan ini memperkenalkan satu lagi kepala satu dengan satu untuk YOLO. Ia mengekalkan struktur yang sama dan menggunakan matlamat pengoptimuman yang sama seperti cawangan satu-ke-banyak yang asal, tetapi menggunakan padanan satu dengan satu untuk mendapatkan tugasan label. Semasa latihan, kedua-dua kepala dioptimumkan secara bersama untuk menyediakan pengawasan yang kaya semasa inferens, YOLOv10 membuang kepala satu-ke-banyak dan menggunakan kepala satu-satu untuk membuat ramalan. Ini membolehkan YOLO digunakan dari hujung ke hujung tanpa menanggung sebarang kos inferens tambahan.

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Keseluruhan reka bentuk model yang didorong oleh ketepatan kecekapan

Selain pasca pemprosesan, seni bina model YOLO juga menimbulkan cabaran besar kepada ketepatan perdagangan. Walaupun usaha penyelidikan terdahulu telah meneroka pelbagai strategi reka bentuk, pemeriksaan menyeluruh terhadap pelbagai komponen dalam YOLO masih kurang. Oleh itu, seni bina model mempamerkan redundansi pengiraan yang tidak boleh diabaikan dan keupayaan terhad.

Komponen dalam YOLO termasuk batang, lapisan pensampelan turun, peringkat dengan blok binaan asas dan kepala. Pengarang terutamanya melaksanakan reka bentuk model dipacu kecekapan untuk tiga bahagian berikut. Klasifikasi Cahaya Klasifikasi Head

  1. spatial Saluran Decoupled Downsampling
  2. ordering-Panduan Modul Design urutan untuk mencapai reka bentuk model yang didorong oleh ketepatan, pasukan penyelidikan selanjutnya meneroka ia mengamalkannya lilitan kernel besar dan mekanisme perhatian diri untuk meningkatkan prestasi model dengan kos yang minimum.
  3. Eksperimen
Seperti yang ditunjukkan dalam Jadual 1, YOLOv10 yang dibangunkan oleh pasukan Tsinghua mencapai prestasi SOTA dan kependaman hujung ke hujung pada pelbagai skala model.

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Kajian ini juga menjalankan eksperimen ablasi untuk YOLOv10-S dan YOLOv10-M Keputusan eksperimen ditunjukkan dalam jadual berikut:

capai dalam jadual dwi lokasi yang ditunjukkan dalam jadual berikut. AP terbaik - Tukar ganti Latensi, prestasi optimum dicapai dengan metrik padanan yang konsisten.

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Seperti yang ditunjukkan dalam jadual di bawah, setiap komponen reka bentuk, termasuk kepala pengelasan ringan, saluran spatial decoupled downsampling dan reka bentuk modul berpandukan pesanan, menyumbang kepada mengurangkan bilangan parameter dan Kelewatan.FL. Yang penting, penambahbaikan ini dicapai sambil mengekalkan prestasi cemerlang. Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Analisis untuk reka bentuk model dipacu ketepatan. Para penyelidik membentangkan hasil daripada penyepaduan langkah demi langkah elemen reka bentuk yang dipacu ketepatan berdasarkan YOLOv10-S/M.

Seperti yang ditunjukkan dalam Jadual 10, penggunaan modul konvolusi teras besar dan PSA telah meningkatkan prestasi YOLOv10-S dengan ketara sebanyak 0.4% AP dan 1.4% AP dengan peningkatan kelewatan minimum masing-masing 0.03ms dan 0.15ms.

Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub

Atas ialah kandungan terperinci Universiti Tsinghua mengambil alih dan YOLOv10 keluar: prestasi telah bertambah baik dan ia berada dalam senarai panas GitHub. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1668
14
Tutorial PHP
1273
29
Tutorial C#
1256
24
Bagaimana cara menggunakan Perpustakaan Chrono di C? Bagaimana cara menggunakan Perpustakaan Chrono di C? Apr 28, 2025 pm 10:18 PM

Menggunakan perpustakaan Chrono di C membolehkan anda mengawal selang masa dan masa dengan lebih tepat. Mari kita meneroka pesona perpustakaan ini. Perpustakaan Chrono C adalah sebahagian daripada Perpustakaan Standard, yang menyediakan cara moden untuk menangani selang waktu dan masa. Bagi pengaturcara yang telah menderita dari masa. H dan CTime, Chrono tidak diragukan lagi. Ia bukan sahaja meningkatkan kebolehbacaan dan mengekalkan kod, tetapi juga memberikan ketepatan dan fleksibiliti yang lebih tinggi. Mari kita mulakan dengan asas -asas. Perpustakaan Chrono terutamanya termasuk komponen utama berikut: STD :: Chrono :: System_Clock: Mewakili jam sistem, yang digunakan untuk mendapatkan masa semasa. Std :: Chron

Bagaimana untuk memahami operasi DMA di C? Bagaimana untuk memahami operasi DMA di C? Apr 28, 2025 pm 10:09 PM

DMA di C merujuk kepada DirectMemoryAccess, teknologi akses memori langsung, yang membolehkan peranti perkakasan secara langsung menghantar data ke memori tanpa campur tangan CPU. 1) Operasi DMA sangat bergantung kepada peranti perkakasan dan pemacu, dan kaedah pelaksanaan berbeza dari sistem ke sistem. 2) Akses langsung ke memori boleh membawa risiko keselamatan, dan ketepatan dan keselamatan kod mesti dipastikan. 3) DMA boleh meningkatkan prestasi, tetapi penggunaan yang tidak wajar boleh menyebabkan kemerosotan prestasi sistem. Melalui amalan dan pembelajaran, kita dapat menguasai kemahiran menggunakan DMA dan memaksimumkan keberkesanannya dalam senario seperti penghantaran data berkelajuan tinggi dan pemprosesan isyarat masa nyata.

Apakah pengaturcaraan sistem operasi masa nyata di C? Apakah pengaturcaraan sistem operasi masa nyata di C? Apr 28, 2025 pm 10:15 PM

C berfungsi dengan baik dalam pengaturcaraan sistem operasi masa nyata (RTOS), menyediakan kecekapan pelaksanaan yang cekap dan pengurusan masa yang tepat. 1) C memenuhi keperluan RTO melalui operasi langsung sumber perkakasan dan pengurusan memori yang cekap. 2) Menggunakan ciri berorientasikan objek, C boleh merancang sistem penjadualan tugas yang fleksibel. 3) C menyokong pemprosesan gangguan yang cekap, tetapi peruntukan memori dinamik dan pemprosesan pengecualian mesti dielakkan untuk memastikan masa nyata. 4) Pemrograman templat dan fungsi sebaris membantu dalam pengoptimuman prestasi. 5) Dalam aplikasi praktikal, C boleh digunakan untuk melaksanakan sistem pembalakan yang cekap.

Langkah -langkah untuk menambah dan memadam medan ke jadual mysql Langkah -langkah untuk menambah dan memadam medan ke jadual mysql Apr 29, 2025 pm 04:15 PM

Di MySQL, tambah medan menggunakan alterTabletable_nameaddcolumnnew_columnvarchar (255) afterexisting_column, memadam medan menggunakan altertabletable_namedropcolumncolumn_to_drop. Apabila menambah medan, anda perlu menentukan lokasi untuk mengoptimumkan prestasi pertanyaan dan struktur data; Sebelum memadam medan, anda perlu mengesahkan bahawa operasi itu tidak dapat dipulihkan; Mengubah struktur jadual menggunakan DDL dalam talian, data sandaran, persekitaran ujian, dan tempoh masa beban rendah adalah pengoptimuman prestasi dan amalan terbaik.

Bagaimana untuk mengukur prestasi benang di C? Bagaimana untuk mengukur prestasi benang di C? Apr 28, 2025 pm 10:21 PM

Mengukur prestasi thread di C boleh menggunakan alat masa, alat analisis prestasi, dan pemasa tersuai di perpustakaan standard. 1. Gunakan perpustakaan untuk mengukur masa pelaksanaan. 2. Gunakan GPROF untuk analisis prestasi. Langkah -langkah termasuk menambah pilihan -pg semasa penyusunan, menjalankan program untuk menghasilkan fail gmon.out, dan menghasilkan laporan prestasi. 3. Gunakan modul Callgrind Valgrind untuk melakukan analisis yang lebih terperinci. Langkah -langkah termasuk menjalankan program untuk menghasilkan fail callgrind.out dan melihat hasil menggunakan kcachegrind. 4. Pemasa tersuai secara fleksibel dapat mengukur masa pelaksanaan segmen kod tertentu. Kaedah ini membantu memahami sepenuhnya prestasi benang dan mengoptimumkan kod.

Kedudukan Pertukaran Kuantitatif 2025 Cadangan Top 10 untuk Aplikasi Perdagangan Kuantitatif Mata Wang Digital Kedudukan Pertukaran Kuantitatif 2025 Cadangan Top 10 untuk Aplikasi Perdagangan Kuantitatif Mata Wang Digital Apr 30, 2025 pm 07:24 PM

Alat kuantisasi terbina dalam pertukaran termasuk: 1. Binance: Menyediakan modul kuantitatif niaga hadapan Binance, yuran pengendalian yang rendah, dan menyokong urus niaga AI-dibantu. 2. OKX (OUYI): Menyokong Pengurusan Multi Akaun dan Routing Pesanan Pintar, dan menyediakan kawalan risiko peringkat institusi. Platform strategi kuantitatif bebas termasuk: 3. 4. Kuadensi: Perpustakaan Strategi Algoritma Tahap Profesional, menyokong ambang risiko yang disesuaikan. 5. PionEx: Strategi Preset 16 terbina dalam, yuran transaksi yang rendah. Alat domain menegak termasuk: 6. Cryptohopper: platform kuantitatif berasaskan awan, menyokong 150 petunjuk teknikal. 7. Bitsgap:

10 platform dagangan mata wang digital teratas: 10 pertukaran mata wang digital yang selamat dan boleh dipercayai 10 platform dagangan mata wang digital teratas: 10 pertukaran mata wang digital yang selamat dan boleh dipercayai Apr 30, 2025 pm 04:30 PM

Platform perdagangan mata wang maya digital 10 digital adalah: 1. Binance, 2 Okx, 3. Coinbase, 4. Kraken, 5. Huobi Global, 6. Bitfinex, 7. Kucoin, 8 Gemini, 9. Platform ini semua menyediakan keselamatan yang tinggi dan pelbagai pilihan perdagangan, sesuai untuk keperluan pengguna yang berbeza.

Cara yang cekap untuk memasukkan data memasukkan data dalam mysql Cara yang cekap untuk memasukkan data memasukkan data dalam mysql Apr 29, 2025 pm 04:18 PM

Kaedah yang cekap untuk memasukkan data dalam MySQL termasuk: 1. Menggunakan sintaks Insertinto ... Sintaks, 2. Menggunakan perintah LoadDatainFile, 3. Menggunakan pemprosesan transaksi, 4. Laraskan saiz batch, 5. Lumpuhkan pengindeks

See all articles