Tajuk asal: GraphAlign: Meningkatkan Penjajaran Ciri Tepat melalui pemadanan Graf untuk Pengesanan Objek 3D Berbilang Modal
Kandungan yang perlu ditulis semula ialah: Pautan kertas: https://arxiv.org/pdf/2310.08261.pdf
gabungan: Beijing Jiaotong University Universiti Sains dan Teknologi Hebei Universiti Tsinghua
LiDAR dan kamera ialah penderia pelengkap untuk pengesanan sasaran 3D dalam pemanduan autonomi. Walau bagaimanapun, mengkaji interaksi luar tabii antara awan titik dan imej adalah mencabar, dan kuncinya terletak pada cara melakukan penjajaran ciri bagi modaliti heterogen. Pada masa ini, banyak kaedah hanya mencapai penjajaran ciri melalui penentukuran unjuran dan mengabaikan isu ralat ketepatan penukaran koordinat antara penderia, yang mengakibatkan prestasi suboptimum. Makalah ini mencadangkan strategi penjajaran ciri yang lebih tepat dipanggil GraphAlign untuk pengesanan objek 3D melalui pemadanan graf. Secara khusus, kertas ini menggabungkan ciri imej pengekod segmentasi semantik dalam cawangan imej dengan ciri awan titik CNN jarang 3D dalam cawangan LiDAR. Untuk mengurangkan jumlah pengiraan, kertas ini menggunakan pengiraan jarak Euclidean untuk membina hubungan jiran terdekat dalam subruang ciri awan titik. Melalui penentukuran unjuran antara imej dan awan titik, jiran terdekat ciri awan titik ditayangkan ke ciri imej. Kami kemudian mencari penjajaran ciri yang lebih sesuai dengan memadankan jiran terdekat awan titik tunggal kepada berbilang imej. Di samping itu, kertas kerja ini juga menyediakan modul perhatian kendiri untuk meningkatkan berat perhubungan penting untuk memperhalusi penjajaran ciri antara modaliti heterogen. Sebilangan besar eksperimen telah dijalankan dalam penanda aras nuScenes untuk membuktikan keberkesanan dan kecekapan GraphAlign yang dicadangkan dalam artikel ini
Artikel ini mencadangkan GraphAlign, rangka kerja penjajaran ciri berdasarkan padanan graf (pemadanan graf), untuk menyelesaikan masalah salah jajaran dalam pengesanan objek 3D multimodal.
Artikel ini mencadangkan modul Penjajaran Ciri Graf (GFA) dan Penjajaran Ciri Perhatian Kendiri (SAFA) untuk mencapai penjajaran tepat ciri imej dan ciri awan titik, yang boleh meningkatkan lagi awan titik dan penjajaran ciri antara modaliti imej, dengan itu meningkatkan ketepatan pengesanan .
Dengan menjalankan eksperimen menggunakan dua penanda aras, KITTI dan nuScenes, kami membuktikan bahawa GraphAlign boleh meningkatkan ketepatan pengesanan awan titik dengan berkesan, terutamanya dalam pengesanan sasaran jarak jauh
Figure
#🎜#
#🎜##🎜🎜 #
#🎜 . 🎜🎜#
ArXiv. weixin.qq.com/s/eN6THT2azHvoleT1F6MoSw
Atas ialah kandungan terperinci Penjajaran ciri yang tepat untuk meningkatkan pengesanan objek 3D multimodal: Aplikasi GraphAlign. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!