Rumah Peranti teknologi AI Kertas pemarkahan tinggi CVPR 2024: Rangka kerja penyuntingan generatif baharu GenN2N, menyatukan tugas penukaran NeRF

Kertas pemarkahan tinggi CVPR 2024: Rangka kerja penyuntingan generatif baharu GenN2N, menyatukan tugas penukaran NeRF

Apr 19, 2024 pm 09:40 PM
git projek genn2n

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

Lajur AIxiv laman web kami ialah lajur tentang kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv di laman web kami telah menerima lebih daripada 2,000 keping kandungan, meliputi makmal terkemuka daripada universiti dan syarikat utama di seluruh dunia, membantu mempromosikan pertukaran dan penyebaran akademik. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. Alamat e-mel penyerahan ialah liyazhou@jiqizhixin.com zhaoyunfeng@jiqizhixin.com;


Penyelidik dari Universiti Sains dan Teknologi Hong Kong dan Universiti Tsinghua mencadangkan "GenN2N", rangka kerja penukaran NeRF-ke-NeRF generatif bersatu yang sesuai untuk pelbagai tugas penukaran NeRF, seperti penyuntingan NeRF dipacu teks , teduhan , resolusi super, pemulihan, dsb., prestasinya sangat bagus! CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

  • Alamat kertas: https://arxiv.org/abs/2404.02788
  • Laman utama kertas: https://xiangyueli. alamat thub: https://github.com/Lxiangyue/GenN2N
  • Tajuk kertas: GenN2N: Penterjemahan NeRF2NeRF Generatif
Dalam beberapa tahun kebelakangan ini, Medan Sinaran Neural (NeRF) telah menarik perhatian ramai , kualiti tinggi dan serba boleh Bidang pembinaan semula 3D, penjanaan 3D dan sintesis perspektif baharu telah menarik perhatian meluas. Walau bagaimanapun, sebaik sahaja adegan NeRF dicipta, kaedah ini sering tidak mempunyai kawalan lanjut ke atas geometri dan rupa yang terhasil. Oleh itu, Penyuntingan NeRF baru-baru ini telah menjadi tumpuan penyelidikan yang patut diberi perhatian.

Kaedah pengeditan NeRF semasa biasanya khusus tugasan, seperti penyuntingan dipacu teks, resolusi super, pengecatan dan pewarnaan NeRF. Kaedah ini memerlukan sejumlah besar pengetahuan domain khusus tugas. Dalam bidang penyuntingan imej 2D, ia telah menjadi trend untuk membangunkan kaedah penukaran imej-ke-imej sejagat Contohnya, model 2D Stable Difussion digunakan untuk menyokong penyuntingan imej berbilang fungsi. Oleh itu, kami mencadangkan pengeditan NeRF sejagat menggunakan model generatif 2D asas.

Cabaran yang datang bersama ini ialah jurang perwakilan antara imej NeRF dan 2D, terutamanya kerana editor imej sering menjana berbilang suntingan yang tidak konsisten untuk sudut pandangan yang berbeza. Kaedah penyuntingan NeRF berasaskan teks baru-baru ini, Instruct-NeRF2NeRF, meneroka perkara ini. Ia menggunakan proses "penyuntingan-penyuntingan-pengagregatan" untuk mengemas kini adegan NeRF secara beransur-ansur dengan secara beransur-ansur memaparkan imej berbilang paparan, mengedit imej ini dan mengagregatkan imej yang diedit ke dalam NeRF. Walau bagaimanapun, kaedah penyuntingan ini, selepas banyak pengoptimuman untuk keperluan penyuntingan tertentu, hanya boleh menjana hasil penyuntingan tertentu Jika pengguna tidak berpuas hati, percubaan berulang perlu diulang.

Oleh itu, kami mencadangkan "GenN2N", rangka kerja umum NeRF-to-NeRF yang sesuai untuk pelbagai tugas penyuntingan NeRF Terasnya ialah menggunakan pendekatan generatif untuk mencirikan sifat pelbagai penyelesaian proses penyuntingan. supaya Ia boleh menggunakan pengeditan generatif dengan mudah menjana sejumlah besar hasil pengeditan yang memenuhi keperluan untuk dipilih oleh pengguna.

Di bahagian teras GenN2N, 1) rangka kerja generatif VAE-GAN 3D diperkenalkan, menggunakan VAE untuk mewakili keseluruhan ruang penyuntingan untuk mempelajari semua kemungkinan pengedaran penyuntingan NeRF 3D sepadan dengan set imej penyuntingan 2D input , dan gunakan GAN untuk menyediakan penyeliaan yang munasabah untuk mengedit pandangan NeRF yang berbeza untuk memastikan keaslian hasil pengeditan 2) Gunakan pembelajaran kontrastif untuk memisahkan kandungan penyuntingan dan perspektif untuk memastikan konsistensi kandungan penyuntingan antara perspektif yang berbeza , pengguna Hanya mengambil sampel berbilang kod pengeditan secara rawak daripada model penjanaan bersyarat boleh menjana pelbagai hasil pengeditan 3D yang sepadan dengan sasaran pengeditan.

Berbanding dengan kaedah SOTA untuk pelbagai tugas penyuntingan NeRF (ICCV2023 Oral, dll.), GenN2N lebih unggul daripada kaedah sedia ada dari segi kualiti penyuntingan, kepelbagaian, kecekapan, dsb.

Pengenalan Kaedah

Kami mula-mula melakukan penyuntingan imej 2D, dan kemudian meningkatkan suntingan 2D ini kepada NeRF 3D untuk mencapai penukaran NeRF-ke-NeRF generatif.

A. Penyulingan Tersirat (Penyulingan Terpendam)

Kami menggunakan Modul Penyulingan Terpendam sebagai pengekod VAE untuk mempelajari kod penyuntingan tersirat bagi setiap imej yang diedit, dan menghantarnya dalam kod Edit penukaran NeRF-ke-NeRF mengawal kandungan yang dihasilkan. Semua kod penyuntingan mematuhi taburan normal yang baik di bawah kekangan kehilangan KL untuk pensampelan yang lebih baik. Untuk memisahkan kandungan penyuntingan dan perspektif, kami telah mereka bentuk pembelajaran perbandingan dengan teliti untuk menggalakkan kod penyuntingan gambar dengan gaya penyuntingan yang sama tetapi perspektif yang berbeza menjadi serupa, dan kod penyuntingan gambar dengan gaya penyuntingan yang berbeza tetapi perspektif yang sama menjadi jauh. berjauhan antara satu sama lain.

Penukaran B.NeRF-ke-NeRF (Terjemahan NeRF)

Kami menggunakan Terjemahan NeRF-to-NeRF sebagai penyahkod VAE, yang mengambil kod pengeditan sebagai input dan mengubah suai asal untuk NeRF yang ditukar. Kami menambah lapisan baki antara lapisan tersembunyi rangkaian NeRF asal ini menggunakan kod penyuntingan sebagai input untuk memodulasi neuron lapisan tersembunyi, supaya NeRF yang ditukar bukan sahaja dapat mengekalkan maklumat NeRF asal, tetapi juga mengawal penukaran 3D. berdasarkan kod penyuntingan. Pada masa yang sama, Terjemahan NeRF-to-NeRF juga berfungsi sebagai penjana untuk mengambil bahagian dalam latihan permusuhan generatif. Dengan menjana dan bukannya mengoptimumkan, kami boleh memperoleh berbilang hasil penukaran sekaligus, meningkatkan kecekapan penukaran NeRF dan kepelbagaian hasil dengan ketara.

c. . Oleh itu kami menyediakan syarat sebagai maklumat tambahan untuk diskriminasi. Khususnya, apabila diskriminator mengenal pasti gambar yang dihasilkan oleh penjana (sampel negatif) atau gambar yang diedit
(sampel positif) dalam data latihan, kami memilih gambar yang diedit
dengan perspektif yang sama daripada data latihan sebagai syarat , yang menghalang diskriminator daripada diganggu oleh faktor perspektif apabila membezakan sampel positif dan negatif.
CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务D. Inferens

Selepas pengoptimuman GenN2N, pengguna boleh mengambil sampel kod penyuntingan secara rawak dan memasukkan NeRF yang ditukar adegan.

Eksperimen

Kami menjalankan eksperimen yang meluas ke atas pelbagai tugas NeRF-ke-NeRF, termasuk penyuntingan dipacu teks NeRF, pewarnaan, resolusi super, lukisan, dsb. Keputusan percubaan menunjukkan kualiti pengeditan unggul GenN2N, konsistensi berbilang paparan, kepelbagaian yang dihasilkan dan kecekapan penyuntingan. Penyuntingan NeRF berasaskan teks kuantitatif berbanding dengan kaedah SOTA untuk pelbagai tugas NeRF tertentu ( termasuk penyuntingan dipacu teks, pewarnaan, resolusi super dan lukisan dalam, dsb.). Keputusan menunjukkan bahawa GenN2N, sebagai rangka kerja umum, berfungsi dengan baik atau lebih baik daripada SOTA khusus tugas, manakala hasil pengeditan mempunyai kepelbagaian yang lebih besar (berikut ialah perbandingan antara GenN2N dan Instruct-NeRF2NeRF pada tugas penyuntingan NeRF berasaskan teks ).

A. Penyuntingan NeRF berasaskan teksCVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务
Untuk lebih banyak percubaan dan kaedah, sila rujuk halaman utama kertas.

Team PENGENALAN Kertas ini datang dari pasukan Tan Ping University of Science and Technology, Tsinghua University 3Dvici Lab, Shanghai Buatan Perisikan Buatan dan Shanghai Qizhi Research Institute. kertas ialah Liu, pelajar Universiti Sains dan Teknologi Hong Kong, Xue Han, pelajar Universiti Tsinghua, Luo Kunming, pelajar Universiti Sains dan Teknologi Hong Kong, dan pengajarnya ialah Guru Yi Li dari Tsinghua. Universiti dan Guru Tan Ping dari Universiti Sains dan Teknologi Hong Kong.

Atas ialah kandungan terperinci Kertas pemarkahan tinggi CVPR 2024: Rangka kerja penyuntingan generatif baharu GenN2N, menyatukan tugas penukaran NeRF. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara menggunakan komitmen git Cara menggunakan komitmen git Apr 17, 2025 pm 03:57 PM

Git Commit adalah arahan yang merekodkan fail perubahan kepada repositori git untuk menyelamatkan gambar keadaan semasa projek. Cara menggunakannya adalah seperti berikut: Tambahkan perubahan ke kawasan penyimpanan sementara Tulis mesej penyerahan ringkas dan bermaklumat untuk menyimpan dan keluar dari mesej penyerahan untuk melengkapkan penyerahan secara opsyen: Tambahkan tandatangan untuk log penyerahan Git Log untuk melihat kandungan penyerahan

Cara memadam repositori dengan git Cara memadam repositori dengan git Apr 17, 2025 pm 04:03 PM

Untuk memadam repositori Git, ikuti langkah -langkah ini: Sahkan repositori yang anda mahu padamkan. Penghapusan repositori tempatan: Gunakan perintah RM -RF untuk memadam foldernya. Jauh memadam gudang: Navigasi ke tetapan gudang, cari pilihan "Padam Gudang", dan sahkan operasi.

Cara kembali selepas penyerahan Git Cara kembali selepas penyerahan Git Apr 17, 2025 pm 01:06 PM

Untuk melepaskan komitmen git, anda boleh menggunakan perintah Reset Git -Hard ~ n, di mana n mewakili bilangan komitmen untuk jatuh balik. Langkah -langkah terperinci termasuk: Tentukan bilangan komitmen untuk dilancarkan kembali. Gunakan pilihan -sukar untuk memaksa sandaran. Jalankan perintah itu kembali kepada komit yang ditentukan.

Cara menyambung ke rangkaian awam pelayan git Cara menyambung ke rangkaian awam pelayan git Apr 17, 2025 pm 02:27 PM

Menyambungkan pelayan Git ke rangkaian awam termasuk lima langkah: 1. Sediakan alamat IP awam; 2. Buka port firewall (22, 9418, 80/443); 3. Konfigurasi akses SSH (menghasilkan pasangan utama, buat pengguna); 4. Konfigurasi akses HTTP/HTTPS (pasang pelayan, konfigurasikan keizinan); 5. Uji sambungan (menggunakan klien SSH atau arahan git).

Cara Menambah Kekunci Awam ke Akaun Git Cara Menambah Kekunci Awam ke Akaun Git Apr 17, 2025 pm 02:42 PM

Bagaimana untuk menambah kunci awam ke akaun Git? Langkah: Menjana pasangan kunci SSH. Salin kunci awam. Tambah kunci awam di Gitlab atau GitHub. Uji sambungan SSH.

Cara Menangani Konflik Kod Git Cara Menangani Konflik Kod Git Apr 17, 2025 pm 02:51 PM

Konflik kod merujuk kepada konflik yang berlaku apabila pelbagai pemaju mengubah suai kod yang sama dan menyebabkan Git bergabung tanpa memilih perubahan secara automatik. Langkah -langkah resolusi termasuk: Buka fail yang bercanggah dan cari kod yang bercanggah. Gabungkan kod secara manual dan salin perubahan yang anda mahu masuk ke dalam penanda konflik. Padam tanda konflik. Simpan dan serahkan perubahan.

Cara menjana kunci ssh dalam git Cara menjana kunci ssh dalam git Apr 17, 2025 pm 01:36 PM

Untuk selamat menyambung ke pelayan Git Jauh, kunci SSH yang mengandungi kekunci awam dan swasta perlu dijana. Langkah -langkah untuk menghasilkan kunci SSH adalah seperti berikut: Buka terminal dan masukkan perintah SSH -Keygen -T RSA -B 4096. Pilih lokasi penjimatan utama. Masukkan frasa kata laluan untuk melindungi kunci peribadi. Salin kunci awam ke pelayan jauh. Simpan kunci peribadi dengan betul kerana ia adalah kelayakan untuk mengakses akaun.

Cara mengesan ssh dengan git Cara mengesan ssh dengan git Apr 17, 2025 pm 02:33 PM

Untuk mengesan SSH melalui Git, anda perlu melakukan langkah -langkah berikut: menghasilkan pasangan kunci SSH. Tambah kunci awam ke pelayan Git. Konfigurasikan Git untuk menggunakan SSH. Uji sambungan SSH. Menyelesaikan masalah yang mungkin mengikut keadaan sebenar.

See all articles