Jadual Kandungan
NeRF + InstructPix2Pix = Instruct-NeRF2NeRF
Kaedah pelaksanaan" >Kaedah pelaksanaan
Masih ada had, tetapi kelemahannya tidak disembunyikan
Mengedit adegan 3D dalam satu ayat
Rumah Peranti teknologi AI Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan 'Chat-NeRF' untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan 'Chat-NeRF' untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Apr 12, 2023 pm 02:37 PM
3d Muka berubah uc

Terima kasih kepada pembangunan teknologi pembinaan semula 3D saraf, menangkap perwakilan ciri pemandangan 3D dunia sebenar tidak pernah semudah ini.

Walau bagaimanapun, tidak pernah ada penyelesaian yang mudah dan berkesan untuk pengeditan pemandangan 3D di atas ini.

Baru-baru ini, penyelidik dari UC Berkeley mencadangkan kaedah menyunting adegan NeRF menggunakan arahan teks - Instruct-NeRF2NeRF, berdasarkan kerja sebelumnya InstructPix2Pix.

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Alamat kertas: https://arxiv.org/abs/2303.12789

Menggunakan Instruct-NeRF2NeRF, kami boleh mengedit adegan dunia sebenar berskala besar dengan hanya satu ayat, dan menjadikannya lebih realistik dan disasarkan daripada kerja sebelumnya.

Contohnya, jika anda mahu dia berjanggut, seberkas janggut akan muncul di mukanya!

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Atau tukar kepala anda dan jadi Einstein dalam beberapa saat.

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Selain itu, memandangkan model boleh mengemas kini set data secara berterusan dengan imej baharu yang diedit, kesan pembinaan semula pemandangan akan bertambah baik secara beransur-ansur.

NeRF + InstructPix2Pix = Instruct-NeRF2NeRF

Secara khusus, manusia diberikan imej input, dan arahan bertulis yang memberitahu model apa yang perlu dilakukan, dan model kemudian Ikut arahan ini untuk mengedit imej.

Langkah pelaksanaan adalah seperti berikut:

  1. Memberikan imej dari tempat kejadian dalam perspektif latihan.
  2. Gunakan model InstructPix2Pix untuk mengedit imej ini berdasarkan arahan teks global.
  3. Gantikan imej asal dalam set data latihan dengan imej yang diedit.
  4. Model NeRF terus berlatih seperti biasa.

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat


Kaedah pelaksanaan

Berbanding dengan pengeditan 3D tradisional, NeRF2NeRF ialah kaedah pengeditan pemandangan 3D baharu Sorotan terbesarnya ialah penggunaan teknologi "kemas kini set data berulang".

Walaupun pengeditan dilakukan pada pemandangan 3D, model resapan 2D dan bukannya 3D digunakan untuk mengekstrak bentuk dan penampilan prior dalam kertas kerana data yang digunakan untuk melatih model generatif 3D adalah sangat terhad.

Model penyebaran 2D ini ialah InstructPix2Pix yang dibangunkan oleh pasukan penyelidik tidak lama dahulu - model penyuntingan imej 2D berdasarkan teks arahan Apabila anda memasukkan arahan imej dan teks, ia boleh menghasilkan pengeditan imej selepas.

Walau bagaimanapun, model 2D ini akan menyebabkan perubahan tidak sekata pada sudut pemandangan yang berbeza Oleh itu, "kemas kini set data berulang" wujud secara bergilir-gilir. . Set" dan kemas kini perwakilan 3D yang mendasari.

Ini bermakna model resapan berpandukan teks (InstructPix2Pix) akan menjana variasi imej baharu mengikut arahan dan menggunakan imej baharu ini sebagai input untuk latihan model NeRF. Oleh itu, adegan 3D yang dibina semula akan berdasarkan pengeditan berpandukan teks baharu.

Dalam lelaran awal, InstructPix2Pix selalunya gagal melakukan pengeditan yang konsisten merentas sudut tontonan yang berbeza, namun, semasa proses pemaparan semula dan pengemaskinian NeRF, mereka akan menumpu kepada pemandangan yang konsisten di peringkat global.

Ringkasnya, kaedah NeRF2NeRF meningkatkan kecekapan pengeditan adegan 3D dengan mengemas kini kandungan imej secara berulang dan menyepadukan kandungan yang dikemas kini ini ke dalam pemandangan 3D, sambil mengekalkan koheren dan realisme Pemandangan.

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Boleh dikatakan bahawa kerja pasukan penyelidik UC Berkeley ini ialah versi lanjutan daripada InstructPix2Pix sebelumnya Dengan menggabungkan NeRF dengan InstructPix2Pix dan bekerja dengan "kemas kini set data berulang ", pengeditan Utama masih boleh dimainkan dengan adegan 3D!

Masih ada had, tetapi kelemahannya tidak disembunyikan

Namun, memandangkan Instruct-NeRF2NeRF adalah berdasarkan InstructPix2Pix sebelumnya, ia mewarisi banyak batasan yang terakhir, seperti ketidakupayaan untuk menjalankan operasi ruang berskala besar.

Selain itu, seperti DreamFusion, Instruct-NeRF2NeRF hanya boleh menggunakan model resapan pada satu paparan pada satu masa, jadi anda mungkin menghadapi masalah artifak yang serupa.

Rajah berikut menunjukkan dua jenis kes kegagalan:

(1) Pix2Pix tidak boleh melakukan penyuntingan dalam 2D, jadi NeRF2NeRF dalam 3D Ia juga gagal;

(2) Pix2Pix boleh menyelesaikan penyuntingan dalam 2D, tetapi terdapat ketidakkonsistenan yang besar dalam 3D, jadi NeRF2NeRF juga gagal.

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Contoh lain ialah "panda" di bawah, yang bukan sahaja kelihatan sangat garang (patung prototaip itu sangat garang) , dan warna bulunya agak pelik, dan mata jelas "tidak berbentuk" apabila bergerak dalam skrin.

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Memandangkan ChatGPT, Diffusion, dan NeRF telah ditarik ke dalam perhatian, artikel ini boleh dikatakan memberikan permainan penuh kepada kelebihan ketiga-tiga , daripada "Ayat AI "Lukisan perkataan" telah maju kepada "AI pengeditan satu ayat adegan 3D".

Walaupun kaedah ini mempunyai beberapa batasan, ia masih mempunyai kelemahannya dan menyediakan penyelesaian yang mudah dan boleh dilaksanakan untuk penyuntingan ciri 3D, yang dijangka menjadi peristiwa penting dalam pembangunan NeRF.

Mengedit adegan 3D dalam satu ayat

Akhir sekali, mari kita lihat kesan yang dikeluarkan oleh pengarang.

Tidak sukar untuk melihat artifak pengeditan adegan 3D PS satu klik ini lebih sesuai dengan jangkaan dari segi keupayaan memahami perintah dan realisme imej Pada masa hadapan, ia mungkin menjadi pilihan popular di kalangan ahli akademik dan "kegemaran baru" di kalangan netizen telah mencipta Chat-NeRF selepas ChatGPT.

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Walaupun anda menukar latar belakang, ciri bermusim dan cuaca gambar sesuka hati, Imej baru yang diberikan juga benar-benar konsisten dengan logik realiti.

Imej asal:

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Musim luruh:

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat


Salji:

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Guru pasir:

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Ribut:

Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan Chat-NeRF untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat

Rujukan: https://www . php.cn/link/ebeb300882677f350ea818c8f333f5b9

Atas ialah kandungan terperinci Satu baris teks untuk mencapai perubahan wajah 3D! UC Berkeley mencadangkan 'Chat-NeRF' untuk melengkapkan rendering peringkat blockbuster hanya dalam satu ayat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Mengapakah Gaussian Splatting begitu popular dalam pemanduan autonomi sehingga NeRF mula ditinggalkan? Mengapakah Gaussian Splatting begitu popular dalam pemanduan autonomi sehingga NeRF mula ditinggalkan? Jan 17, 2024 pm 02:57 PM

Ditulis di atas & pemahaman peribadi pengarang Gaussiansplatting tiga dimensi (3DGS) ialah teknologi transformatif yang telah muncul dalam bidang medan sinaran eksplisit dan grafik komputer dalam beberapa tahun kebelakangan ini. Kaedah inovatif ini dicirikan oleh penggunaan berjuta-juta Gaussians 3D, yang sangat berbeza daripada kaedah medan sinaran saraf (NeRF), yang terutamanya menggunakan model berasaskan koordinat tersirat untuk memetakan koordinat spatial kepada nilai piksel. Dengan perwakilan adegan yang eksplisit dan algoritma pemaparan yang boleh dibezakan, 3DGS bukan sahaja menjamin keupayaan pemaparan masa nyata, tetapi juga memperkenalkan tahap kawalan dan pengeditan adegan yang tidak pernah berlaku sebelum ini. Ini meletakkan 3DGS sebagai penukar permainan yang berpotensi untuk pembinaan semula dan perwakilan 3D generasi akan datang. Untuk tujuan ini, kami menyediakan gambaran keseluruhan sistematik tentang perkembangan dan kebimbangan terkini dalam bidang 3DGS buat kali pertama.

Apakah yang dimaksudkan dengan ikon UC 5G dan 5G UW pada telefon pintar mudah alih T anda? Apakah yang dimaksudkan dengan ikon UC 5G dan 5G UW pada telefon pintar mudah alih T anda? Feb 24, 2024 pm 06:10 PM

Pengguna T-Mobile telah mula menyedari bahawa ikon rangkaian pada skrin telefon mereka kadangkala membaca 5GUC, manakala pembawa lain membaca 5GUW. Ini bukan kesilapan menaip, tetapi mewakili jenis rangkaian 5G yang berbeza. Malah, pengendali sentiasa mengembangkan liputan rangkaian 5G mereka. Dalam topik ini, kita akan melihat maksud ikon 5GUC dan 5GUW yang dipaparkan pada telefon pintar T-Mobile. Kedua-dua logo mewakili teknologi 5G yang berbeza, masing-masing mempunyai ciri dan kelebihan tersendiri. Dengan memahami maksud tanda ini, pengguna boleh memahami dengan lebih baik jenis rangkaian 5G yang mereka sambungkan supaya mereka boleh memilih perkhidmatan rangkaian yang paling sesuai dengan keperluan mereka. Ikon 5GUCVS5GUW dalam T

Ketahui tentang emoji Fasih 3D dalam Microsoft Teams Ketahui tentang emoji Fasih 3D dalam Microsoft Teams Apr 24, 2023 pm 10:28 PM

Anda mesti ingat, terutamanya jika anda adalah pengguna Teams, bahawa Microsoft telah menambah kumpulan baharu emoji 3DFluent pada apl persidangan video tertumpu kerjanya. Selepas Microsoft mengumumkan emoji 3D untuk Pasukan dan Windows tahun lepas, proses itu sebenarnya telah melihat lebih daripada 1,800 emoji sedia ada dikemas kini untuk platform. Idea besar ini dan pelancaran kemas kini emoji 3DFluent untuk Pasukan pertama kali dipromosikan melalui catatan blog rasmi. Kemas kini Pasukan Terkini membawa FluentEmojis ke aplikasi Microsoft mengatakan 1,800 emoji yang dikemas kini akan tersedia kepada kami setiap hari

Pilih kamera atau lidar? Kajian terbaru tentang mencapai pengesanan objek 3D yang mantap Pilih kamera atau lidar? Kajian terbaru tentang mencapai pengesanan objek 3D yang mantap Jan 26, 2024 am 11:18 AM

0. Ditulis di hadapan&& Pemahaman peribadi bahawa sistem pemanduan autonomi bergantung pada persepsi lanjutan, membuat keputusan dan teknologi kawalan, dengan menggunakan pelbagai penderia (seperti kamera, lidar, radar, dll.) untuk melihat persekitaran sekeliling dan menggunakan algoritma dan model untuk analisis masa nyata dan membuat keputusan. Ini membolehkan kenderaan mengenali papan tanda jalan, mengesan dan menjejaki kenderaan lain, meramalkan tingkah laku pejalan kaki, dsb., dengan itu selamat beroperasi dan menyesuaikan diri dengan persekitaran trafik yang kompleks. Teknologi ini kini menarik perhatian meluas dan dianggap sebagai kawasan pembangunan penting dalam pengangkutan masa depan satu. Tetapi apa yang menyukarkan pemanduan autonomi ialah memikirkan cara membuat kereta itu memahami perkara yang berlaku di sekelilingnya. Ini memerlukan algoritma pengesanan objek tiga dimensi dalam sistem pemanduan autonomi boleh melihat dan menerangkan dengan tepat objek dalam persekitaran sekeliling, termasuk lokasinya,

CLIP-BEVFormer: Selia secara eksplisit struktur BEVFormer untuk meningkatkan prestasi pengesanan ekor panjang CLIP-BEVFormer: Selia secara eksplisit struktur BEVFormer untuk meningkatkan prestasi pengesanan ekor panjang Mar 26, 2024 pm 12:41 PM

Ditulis di atas & pemahaman peribadi penulis: Pada masa ini, dalam keseluruhan sistem pemanduan autonomi, modul persepsi memainkan peranan penting Hanya selepas kenderaan pemanduan autonomi yang memandu di jalan raya memperoleh keputusan persepsi yang tepat melalui modul persepsi boleh Peraturan hiliran dan. modul kawalan dalam sistem pemanduan autonomi membuat pertimbangan dan keputusan tingkah laku yang tepat pada masanya dan betul. Pada masa ini, kereta dengan fungsi pemanduan autonomi biasanya dilengkapi dengan pelbagai penderia maklumat data termasuk penderia kamera pandangan sekeliling, penderia lidar dan penderia radar gelombang milimeter untuk mengumpul maklumat dalam modaliti yang berbeza untuk mencapai tugas persepsi yang tepat. Algoritma persepsi BEV berdasarkan penglihatan tulen digemari oleh industri kerana kos perkakasannya yang rendah dan penggunaan mudah, dan hasil keluarannya boleh digunakan dengan mudah untuk pelbagai tugas hiliran.

Cat 3D dalam Windows 11: Muat Turun, Pemasangan dan Panduan Penggunaan Cat 3D dalam Windows 11: Muat Turun, Pemasangan dan Panduan Penggunaan Apr 26, 2023 am 11:28 AM

Apabila gosip mula tersebar bahawa Windows 11 baharu sedang dibangunkan, setiap pengguna Microsoft ingin tahu bagaimana rupa sistem pengendalian baharu itu dan apa yang akan dibawanya. Selepas spekulasi, Windows 11 ada di sini. Sistem pengendalian datang dengan reka bentuk baharu dan perubahan fungsi. Selain beberapa tambahan, ia disertakan dengan penamatan dan pengalihan keluar ciri. Salah satu ciri yang tidak wujud dalam Windows 11 ialah Paint3D. Walaupun ia masih menawarkan Paint klasik, yang bagus untuk laci, doodle dan doodle, ia meninggalkan Paint3D, yang menawarkan ciri tambahan yang sesuai untuk pencipta 3D. Jika anda mencari beberapa ciri tambahan, kami mengesyorkan Autodesk Maya sebagai perisian reka bentuk 3D terbaik. suka

Dapatkan isteri 3D maya dalam masa 30 saat dengan satu kad! Teks kepada 3D menjana manusia digital berketepatan tinggi dengan butiran liang yang jelas, menyambung dengan lancar dengan Maya, Unity dan alat pengeluaran lain Dapatkan isteri 3D maya dalam masa 30 saat dengan satu kad! Teks kepada 3D menjana manusia digital berketepatan tinggi dengan butiran liang yang jelas, menyambung dengan lancar dengan Maya, Unity dan alat pengeluaran lain May 23, 2023 pm 02:34 PM

ChatGPT telah menyuntik satu dos darah ayam ke dalam industri AI, dan segala-galanya yang dahulunya tidak dapat dibayangkan telah menjadi amalan asas hari ini. Text-to-3D, yang terus maju, dianggap sebagai tempat liputan seterusnya dalam medan AIGC selepas Difusi (imej) dan GPT (teks), dan telah mendapat perhatian yang tidak pernah berlaku sebelum ini. Tidak, produk yang dipanggil ChatAvatar telah dimasukkan ke dalam beta awam sederhana, dengan cepat memperoleh lebih 700,000 tontonan dan perhatian, dan telah dipaparkan di Spacesoftheweek. △ChatAvatar juga akan menyokong teknologi Imageto3D yang menjana aksara bergaya 3D daripada lukisan asal perspektif tunggal/berbilang perspektif Model 3D yang dihasilkan oleh versi beta semasa telah mendapat perhatian meluas.

Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24) Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24) Apr 23, 2024 pm 01:20 PM

Pautan projek ditulis di hadapan: https://nianticlabs.github.io/mickey/ Memandangkan dua gambar, pose kamera di antara mereka boleh dianggarkan dengan mewujudkan kesesuaian antara gambar. Biasanya, surat-menyurat ini adalah 2D hingga 2D, dan anggaran pose kami adalah skala-tak tentu. Sesetengah aplikasi, seperti realiti tambahan segera pada bila-bila masa, di mana-mana sahaja, memerlukan anggaran pose metrik skala, jadi mereka bergantung pada penganggar kedalaman luaran untuk memulihkan skala. Makalah ini mencadangkan MicKey, proses pemadanan titik utama yang mampu meramalkan korespondensi metrik dalam ruang kamera 3D. Dengan mempelajari padanan koordinat 3D merentas imej, kami dapat membuat kesimpulan relatif metrik

See all articles