CVPR\'24 |. LightDiff: Model resapan dalam pemandangan cahaya malap, menerangi malam secara langsung!-AI-php.cn

Jadual Kandungan

Idea tesis:

Sumbangan Utama:

Reka Bentuk Web:

Hasil eksperimen:

Ringkasan:

Petikan:

Rumah

Peranti teknologi

CVPR\'24 |. LightDiff: Model resapan dalam pemandangan cahaya malap, menerangi malam secara langsung!

王林

Apr 15, 2024 pm 12:40 PM

bingkai Pemanduan autonomi

Tajuk asal: Terangi Malam: Rangka Kerja Resapan Pelbagai Keadaan untuk Peningkatan Cahaya Rendah Tidak Berpasangan dalam Pemanduan Autonomi

Pautan kertas: https://arxiv.org/pdf/2404.04804.pdf

Afiliasi Pengarang: Cleveland State University Universiti Texas di Austin A*STAR Universiti New York, Universiti California, Los Angeles

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Idea tesis:

LightDiff ialah teknologi yang meningkatkan kecekapan dan skalabiliti sistem persepsi pusat visual pemanduan autonomi. Sistem LiDAR telah mendapat perhatian yang besar baru-baru ini. Walau bagaimanapun, sistem ini sering mengalami kesukaran dalam keadaan cahaya malap, yang berpotensi menjejaskan prestasi dan keselamatannya. Untuk menyelesaikan masalah ini, artikel ini memperkenalkan LightDiff, rangka kerja automatik yang direka untuk meningkatkan kualiti imej cahaya malap dalam aplikasi pemanduan autonomi. Khususnya, kertas kerja ini menggunakan model penyebaran terkawal berbilang keadaan. LightDiff menghapuskan keperluan untuk data berpasangan yang dikumpul secara manual dan sebaliknya mengeksploitasi proses degradasi data dinamik. Ia menggabungkan penyesuai berbilang keadaan baharu yang mampu menyesuaikan berat input daripada modaliti yang berbeza, termasuk peta kedalaman, imej RGB dan kapsyen teks, untuk mengekalkan konsistensi kandungan secara serentak dalam keadaan cahaya malap dan cahaya malap. Tambahan pula, untuk memadankan imej yang ditambah dengan pengetahuan model pengesanan, LightDiff menggunakan skor khusus perceptron sebagai ganjaran untuk membimbing proses latihan resapan melalui pembelajaran pengukuhan. Eksperimen meluas pada set data nuScenes menunjukkan bahawa LightDiff boleh meningkatkan prestasi berbilang pengesan 3D tercanggih dalam keadaan waktu malam sambil mencapai skor kualiti visual yang tinggi, menyerlahkan potensinya untuk memastikan keselamatan pemanduan autonomi.

Sumbangan Utama:

Kertas kerja ini mencadangkan model Lighting Diffusion (LightDiff) untuk meningkatkan imej kamera cahaya malap dalam pemanduan autonomi, mengurangkan keperluan untuk pengumpulan data waktu malam yang meluas dan mengekalkan keupayaan prestasi siang hari.

Makalah ini menyepadukan berbilang mod input termasuk peta kedalaman dan kapsyen imej, dan mencadangkan penyesuai berbilang keadaan untuk memastikan integriti semantik dalam penukaran imej sambil mengekalkan kualiti visual yang tinggi. Kertas kerja ini menggunakan proses praktikal untuk menjana pasangan imej siang dan malam daripada data siang hari untuk mencapai latihan model yang cekap.

Kertas kerja ini memperkenalkan mekanisme penalaan halus menggunakan pembelajaran pengukuhan, digabungkan dengan pengetahuan domain tersuai persepsi (lidar yang boleh dipercayai dan ketekalan pengedaran statistik) untuk memastikan proses resapan mempunyai kekuatan yang kondusif kepada persepsi visual manusia, dan memanfaatkan prestasi Model persepsi pemodelan persepsi. Kaedah ini mempunyai kelebihan yang ketara dalam persepsi visual manusia dan juga mempunyai kelebihan model persepsi.

Percubaan meluas pada set data nuScenes menunjukkan bahawa LightDiff meningkatkan prestasi pengesanan kenderaan 3D dengan ketara pada waktu malam dan mengatasi prestasi model generatif lain pada berbilang metrik sudut tontonan.

Reka Bentuk Web:

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 1. Senario pemanduan pada waktu malam lebih membawa maut berbanding pada waktu siang. Kadar kematian adalah lebih tinggi pada waktu malam [4]. Artikel ini bertujuan untuk meningkatkan imej waktu malam untuk meningkatkan keselamatan keseluruhan pemanduan waktu malam.

Seperti yang ditunjukkan dalam Rajah 1, pemanduan malam adalah mencabar bagi manusia, terutamanya untuk kereta pandu sendiri. Cabaran ini diserlahkan oleh insiden malapetaka pada 18 Mac 2018, apabila sebuah kereta pandu sendiri dari Uber Advanced Technologies Group melanggar dan membunuh seorang pejalan kaki di Arizona [37]. Insiden itu, yang disebabkan oleh kegagalan kenderaan mengesan pejalan kaki dalam keadaan cahaya malap dengan tepat, telah membawa isu keselamatan untuk kenderaan autonomi ke hadapan, terutamanya dalam persekitaran yang mencabar. Memandangkan sistem pemanduan autonomi bertumpu penglihatan semakin bergantung pada penderia kamera, menangani kebimbangan keselamatan dalam keadaan cahaya malap menjadi semakin kritikal untuk memastikan keselamatan keseluruhan kenderaan ini.

Penyelesaian intuitif adalah untuk mengumpul sejumlah besar data pemanduan malam. Walau bagaimanapun, kaedah ini bukan sahaja memerlukan tenaga kerja dan kos yang tinggi, tetapi juga boleh menjejaskan prestasi model siang hari disebabkan oleh perbezaan taburan imej antara waktu malam dan siang hari. Untuk menangani cabaran ini, kertas kerja ini mencadangkan model Lighting Diffusion (LightDiff), pendekatan baru yang menghapuskan keperluan untuk pengumpulan data manual dan mengekalkan prestasi model siang hari.

LightDiff bertujuan untuk meningkatkan imej kamera cahaya rendah dan meningkatkan prestasi model persepsi. Dengan menggunakan proses pengecilan cahaya malap dinamik, LightDiff menjana pasangan imej siang-malam sintetik untuk latihan daripada data siang hari sedia ada. Seterusnya, kertas kerja ini mengguna pakai teknologi Stable Diffusion [44] kerana keupayaannya untuk menghasilkan kesan visual berkualiti tinggi yang secara berkesan mengubah pemandangan waktu malam kepada setara siang hari. Walau bagaimanapun, mengekalkan konsistensi semantik adalah penting dalam pemanduan autonomi, yang merupakan cabaran yang dihadapi oleh model Stable Diffusion yang asal. Untuk mengatasinya, LightDiff menggabungkan berbilang modaliti input, seperti anggaran peta kedalaman dan kapsyen imej kamera, dengan penyesuai berbilang keadaan. Penyesuai ini secara bijak menentukan berat setiap modaliti input, memastikan integriti semantik imej yang ditukar sambil mengekalkan kualiti visual yang tinggi. Untuk membimbing proses resapan bukan sahaja ke arah menjadi lebih cerah untuk penglihatan manusia, tetapi juga untuk model persepsi, kertas kerja ini selanjutnya menggunakan pembelajaran pengukuhan untuk memperhalusi LightDiff kertas ini, menambah pengetahuan domain yang disesuaikan untuk persepsi ke dalam gelung. Makalah ini menjalankan eksperimen yang meluas pada set data pemanduan autonomi nuScenes [7] dan menunjukkan bahawa LightDiff kami boleh meningkatkan ketepatan purata (AP) pengesanan kenderaan 3D waktu malam dengan ketara untuk dua model terkini, BEVDepth [32] dan BEVStereo [31] meningkat sebanyak 4.2% dan 4.6%.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 2. Seni bina model Resapan Pencahayaan (LightDiff) dalam artikel ini. Semasa fasa latihan, proses penjanaan data latihan membolehkan pemerolehan data trimodal tanpa sebarang pengumpulan manual data berpasangan. LightDiff kami menggunakan penyesuai berbilang keadaan untuk menimbang berbilang keadaan secara dinamik, digabungkan dengan pemodelan ganjaran lidar dan teragih (LDRM), membenarkan kawalan berorientasikan persepsi.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 3. Proses penjanaan data latihan artikel ini. Transformasi degradasi cahaya rendah [9] hanya dilaksanakan semasa fasa latihan. Rangkaian anggaran kedalaman terlatih akan dibekukan dan digunakan untuk fasa latihan dan ujian model Resapan Pencahayaan dalam artikel ini.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 4. Gambarajah skematik Inferens Pencahayaan Berulang. Ia direka bentuk untuk meningkatkan ketepatan menjana pembayang teks dan peta kedalaman, dengan itu mengurangkan kesan buruk imej gelap.

Hasil eksperimen:

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 5. Perbandingan visual pada sampel imej waktu malam dalam set pengesahan nuScenes.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 6. Visualisasi hasil pengesanan 3D pada sampel imej waktu malam dalam set pengesahan nuScenes. Kertas ini menggunakan BEVDepth [32] sebagai pengesan tiga dimensi dan menggambarkan pandangan hadapan dan Bird’s-Eye-View kamera.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 7. Menunjukkan kesan visual LightDiff artikel ini dengan atau tanpa Penyesuai MultiCondition. Input kepada ControlNet [55] kekal konsisten, termasuk isyarat teks dan peta kedalaman yang sama. Penyesuai berbilang keadaan membolehkan kontras warna yang lebih baik dan butiran yang lebih kaya semasa peningkatan.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 8. Contoh peta perhatian untuk input modal yang berbeza.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Rajah 9. Gambar rajah skema penjanaan pelbagai mod yang dipertingkatkan melalui Inferens Pencahayaan Berulang (ReLI). Dengan memanggil ReLI sekali, ketepatan pembayang teks dan ramalan peta kedalaman dipertingkatkan.

CVPR'24 | LightDiff：低光照场景下的扩散模型，直接照亮夜晚！

Ringkasan:

Artikel ini memperkenalkan LightDiff, rangka kerja khusus domain yang direka untuk aplikasi pemanduan autonomi, bertujuan untuk meningkatkan kualiti imej dalam persekitaran cahaya malap dan mengurangkan cabaran penglihatan yang dihadapi sistem. Dengan memanfaatkan proses degradasi data dinamik, penyesuai berbilang keadaan untuk modaliti input yang berbeza, dan pemodelan ganjaran berpandukan skor secara persepsi khusus menggunakan pembelajaran pengukuhan, LightDiff meningkatkan kualiti imej waktu malam dan prestasi 3D dengan ketara pada set data nuScenes prestasi pengesanan kenderaan. Inovasi ini bukan sahaja menghapuskan keperluan untuk sejumlah besar data waktu malam, tetapi juga memastikan integriti semantik dalam transformasi imej, menunjukkan potensinya untuk meningkatkan keselamatan dan kebolehpercayaan dalam senario pemanduan autonomi. Dengan ketiadaan imej siang-malam berpasangan realistik, agak sukar untuk mensintesis imej pemanduan malap dengan lampu kereta, yang mengehadkan penyelidikan dalam bidang ini. Penyelidikan masa depan boleh menumpukan pada pengumpulan atau penjanaan data latihan berkualiti tinggi yang lebih baik.

Petikan:

@ARTICLE{2024arXiv240404804L,
author = {{Li}, Jinlong and {Li}, Baolu and {Tu}, Zhengzhong and {Liu}, Xinyu and {GuoJue} Xu}, Felix dan {Xu}, Runsheng dan {Yu}, Hongkai},
title = "{Terangi Malam: Rangka Kerja Resapan Pelbagai Keadaan untuk Peningkatan Cahaya Rendah Tidak Berpasangan dalam Pemanduan Autonomi}",
jurnal = {arXiv e-cetakan},
kata kunci = {Sains Komputer - Visi Komputer dan Pengecaman Corak},
tahun = 2024,
bulan = apr,
eid = {arXiv:2404.04804},
halaman = {arXiv:2404},
doi {10.48550/arXiv.2404.04804},
archivePrefix = {arXiv},
eprint = {2404.04804},
primaryClass = {cs.CV},
adsurl =2sbharui.sb/2bharui. 4804L },
adsnote = {Disediakan oleh Sistem Data Astrofizik SAO/NASA}
}

Atas ialah kandungan terperinci CVPR\'24 |. LightDiff: Model resapan dalam pemandangan cahaya malap, menerangi malam secara langsung!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

1 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Di mana untuk mencari kad kunci kawalan kren di atomfall

1 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7444

Tutorial CakePHP

1371

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Ke arah 'Gelung Tertutup' |. PlanAgent: SOTA baharu untuk perancangan gelung tertutup pemanduan autonomi berdasarkan MLLM! Jun 08, 2024 pm 09:30 PM

Pasukan pembelajaran pengukuhan mendalam Institut Automasi, Akademi Sains China, bersama-sama dengan Li Auto dan lain-lain, mencadangkan rangka kerja perancangan gelung tertutup baharu untuk pemanduan autonomi berdasarkan model bahasa besar berbilang mod MLLM - PlanAgent. Kaedah ini mengambil pandangan mata dari tempat kejadian dan gesaan teks berasaskan graf sebagai input, dan menggunakan pemahaman pelbagai modal dan keupayaan penaakulan akal bagi model bahasa besar berbilang mod untuk melaksanakan penaakulan hierarki daripada pemahaman adegan kepada generasi. arahan pergerakan mendatar dan menegak, dan Selanjutnya menjana arahan yang diperlukan oleh perancang. Kaedah ini diuji pada penanda aras nuPlan berskala besar dan mencabar, dan eksperimen menunjukkan bahawa PlanAgent mencapai prestasi terkini (SOTA) pada kedua-dua senario biasa dan panjang. Berbanding dengan kaedah model bahasa besar (LLM) konvensional, PlanAgent

Bagaimana untuk menilai keberkesanan kos sokongan komersial untuk rangka kerja Java Jun 05, 2024 pm 05:25 PM

Menilai kos/prestasi sokongan komersial untuk rangka kerja Java melibatkan langkah-langkah berikut: Tentukan tahap jaminan yang diperlukan dan jaminan perjanjian tahap perkhidmatan (SLA). Pengalaman dan kepakaran pasukan sokongan penyelidikan. Pertimbangkan perkhidmatan tambahan seperti peningkatan, penyelesaian masalah dan pengoptimuman prestasi. Timbang kos sokongan perniagaan terhadap pengurangan risiko dan peningkatan kecekapan.

Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi Jun 11, 2024 pm 05:29 PM

Ditulis di atas & pemahaman peribadi pengarang: Baru-baru ini, dengan perkembangan dan penemuan teknologi pembelajaran mendalam, model asas berskala besar (Model Asas) telah mencapai hasil yang ketara dalam bidang pemprosesan bahasa semula jadi dan penglihatan komputer. Aplikasi model asas dalam pemanduan autonomi juga mempunyai prospek pembangunan yang hebat, yang boleh meningkatkan pemahaman dan penaakulan senario. Melalui pra-latihan tentang bahasa yang kaya dan data visual, model asas boleh memahami dan mentafsir pelbagai elemen dalam senario pemanduan autonomi dan melakukan penaakulan, menyediakan arahan bahasa dan tindakan untuk memacu membuat keputusan dan perancangan. Model asas boleh ditambah data dengan pemahaman senario pemanduan untuk menyediakan ciri-ciri yang jarang berlaku dalam pengedaran ekor panjang yang tidak mungkin ditemui semasa pemanduan rutin dan pengumpulan data.

Bagaimanakah pilihan rangka kerja PHP yang ringan mempengaruhi prestasi aplikasi? Jun 06, 2024 am 10:53 AM

Rangka kerja PHP yang ringan meningkatkan prestasi aplikasi melalui saiz kecil dan penggunaan sumber yang rendah. Ciri-cirinya termasuk: saiz kecil, permulaan pantas, penggunaan memori yang rendah, kelajuan dan daya tindak balas yang dipertingkatkan, dan penggunaan sumber yang dikurangkan: SlimFramework mencipta API REST, hanya 500KB, responsif yang tinggi dan daya pemprosesan yang tinggi.

Bagaimanakah keluk pembelajaran rangka kerja PHP berbanding rangka kerja bahasa lain? Jun 06, 2024 pm 12:41 PM

Keluk pembelajaran rangka kerja PHP bergantung pada kecekapan bahasa, kerumitan rangka kerja, kualiti dokumentasi dan sokongan komuniti. Keluk pembelajaran rangka kerja PHP adalah lebih tinggi jika dibandingkan dengan rangka kerja Python dan lebih rendah jika dibandingkan dengan rangka kerja Ruby. Berbanding dengan rangka kerja Java, rangka kerja PHP mempunyai keluk pembelajaran yang sederhana tetapi masa yang lebih singkat untuk bermula.

Amalan terbaik dokumentasi rangka kerja Golang Jun 04, 2024 pm 05:00 PM

Menulis dokumentasi yang jelas dan komprehensif adalah penting untuk rangka kerja Golang. Amalan terbaik termasuk mengikut gaya dokumentasi yang ditetapkan, seperti Panduan Gaya Pengekodan Google. Gunakan struktur organisasi yang jelas, termasuk tajuk, subtajuk dan senarai, serta sediakan navigasi. Menyediakan maklumat yang komprehensif dan tepat, termasuk panduan permulaan, rujukan API dan konsep. Gunakan contoh kod untuk menggambarkan konsep dan penggunaan. Pastikan dokumentasi dikemas kini, jejak perubahan dan dokumen ciri baharu. Sediakan sokongan dan sumber komuniti seperti isu dan forum GitHub. Buat contoh praktikal, seperti dokumentasi API.

Bagaimana untuk memilih rangka kerja golang terbaik untuk senario aplikasi yang berbeza Jun 05, 2024 pm 04:05 PM

Pilih rangka kerja Go terbaik berdasarkan senario aplikasi: pertimbangkan jenis aplikasi, ciri bahasa, keperluan prestasi dan ekosistem. Rangka kerja Common Go: Gin (aplikasi Web), Echo (Perkhidmatan Web), Fiber (daya pemprosesan tinggi), gorm (ORM), fasthttp (kelajuan). Kes praktikal: membina REST API (Fiber) dan berinteraksi dengan pangkalan data (gorm). Pilih rangka kerja: pilih fasthttp untuk prestasi utama, Gin/Echo untuk aplikasi web yang fleksibel, dan gorm untuk interaksi pangkalan data.

Penjelasan praktikal terperinci pembangunan rangka kerja golang: Soalan dan Jawapan Jun 06, 2024 am 10:57 AM

Dalam pembangunan rangka kerja Go, cabaran biasa dan penyelesaiannya ialah: Pengendalian ralat: Gunakan pakej ralat untuk pengurusan dan gunakan perisian tengah untuk mengendalikan ralat secara berpusat. Pengesahan dan kebenaran: Sepadukan perpustakaan pihak ketiga dan cipta perisian tengah tersuai untuk menyemak bukti kelayakan. Pemprosesan serentak: Gunakan goroutine, mutex dan saluran untuk mengawal akses sumber. Ujian unit: Gunakan pakej, olok-olok dan stub untuk pengasingan dan alat liputan kod untuk memastikan kecukupan. Penerapan dan pemantauan: Gunakan bekas Docker untuk membungkus penggunaan, menyediakan sandaran data dan menjejak prestasi dan ralat dengan alat pengelogan dan pemantauan.

See all articles