


Dihasilkan oleh Universiti Peking: SOTA terkini dengan kualiti tekstur dan konsistensi berbilang paparan, mencapai penukaran 3D satu imej dalam masa 2 minit
Hanya mengambil masa dua minit untuk menukar gambar kepada 3D!
Ia juga jenis dengan kualiti tekstur yang tinggi, pelbagai tontonan dan konsistensi yang tinggi. .
); Seterusnya, Repaint123 (GS)
Kaedah baharu dipanggil
Repaint123 Idea teras adalah untuk menggabungkan keupayaan penjanaan imej yang berkuasa bagi model penyebaran 2D dengan keupayaan penjajaran tekstur untuk menjana semula yang tinggi. imej berbilang paparan yang berkualiti dan konsisten.
Pada masa ini, kod projek belum dikeluarkan pada GitHub, tetapi 100+ orang telah datang untuk menandakannya:
Apakah rupa Repaint123? Sebelum ini, kaedah menukar imej kepada 3D biasanya menggunakan Score Distillation Sampling (SDS). Walaupun hasil kaedah ini mengagumkan, terdapat beberapa isu seperti ketidakkonsistenan berbilang paparan, terlalu tepu, tekstur terlalu licin dan penjanaan perlahan.
△Dari atas ke bawah: input, Zero123-XL, Magic123, Dream gaussianUntuk menyelesaikan masalah ini, penyelidik dari Universiti Peking, Makmal Pengcheng, Universiti Nasional Singapura dan Universiti Wuhan mencadangkan Cat Semula123.
Secara amnya, Repaint123 mempunyai sumbangan berikut:
(1) Repaint123 boleh menjana jujukan imej berkualiti tinggi dengan mempertimbangkan secara menyeluruh proses lukisan semula yang boleh dikawal daripada imej kepada penjanaan 3D, dan memastikan imej ini konsisten merentas berbilang perspektif.
(2)Repaint123 mencadangkan kaedah garis dasar yang mudah untuk penjanaan 3D paparan tunggal.
Dalam peringkat model kasar, ia menggunakan Zero123 sebagai 3D sebelumnya, digabungkan dengan fungsi kehilangan SDS, untuk menjana model 3D kasar (hanya 1 minit) dengan cepat dengan mengoptimumkan geometri Gaussian Splatting.
Dalam peringkat model halus, ia menggunakan Stable Diffusion sebagai 2D sebelumnya, digabungkan dengan fungsi kehilangan min square error (MSE), untuk menjana model 3D berkualiti tinggi dengan menapis tekstur mesh dengan cepat (juga hanya mengambil masa 1 minit) . (3) Sebilangan besar eksperimen telah membuktikan keberkesanan kaedah Repaint123. Ia mampu menjana kandungan 3D berkualiti tinggi yang sepadan dengan kualiti penjanaan 2D daripada satu imej dalam masa 2 minit sahaja.
1. Menjana jujukan imej berkualiti tinggi dengan konsisten berbilang paparan
Menjana jujukan imej berkualiti tinggi dengan konsisten berbilang paparan terbahagi kepada tiga bahagian berikut:Penyongsangan DDIM
Untuk mengekalkan maklumat tekstur frekuensi rendah konsisten 3D yang dijana dalam peringkat model kasar, pengarang menggunakan penyongsangan DDIM untuk menyongsangkan imej ke ruang pendam yang ditentukan, meletakkan asas untuk denoising berikutnya proses, menghasilkan imej Setia dan konsisten.Penyangkalan yang boleh dikawal
Untuk mengawal ketekalan geometri dan ketekalan tekstur jarak jauh dalam peringkat denoising, penulis memperkenalkan ControlNet, menggunakan peta kedalaman yang diberikan oleh model kasar sebagai prior geometri, dan pada masa yang sama menyuntik ciri Perhatian rujukan imej untuk migrasi tekstur.
Selain itu, untuk melaksanakan panduan tanpa pengelas untuk meningkatkan kualiti imej, kertas kerja menggunakan CLIP untuk mengekod imej rujukan kepada isyarat imej untuk membimbing rangkaian denoising.
Lukis Semula
Lukisan semula progresif bahagian oklusi dan bahagian bertindih Untuk memastikan kawasan bertindih imej bersebelahan dalam jujukan imej diselaraskan pada tahap piksel, penulis mengamalkan strategi lukisan semula tempatan progresif.
Jana kawasan bersebelahan yang harmoni sambil mengekalkan kawasan bertindih tidak berubah, dan secara beransur-ansur memanjangkan hingga 360° dari perspektif rujukan.
Namun, seperti yang ditunjukkan dalam rajah di bawah, penulis mendapati bahawa kawasan bertindih juga perlu diperhalusi, kerana resolusi visual kawasan yang sebelum ini strabismus menjadi lebih besar semasa emmetropia, dan lebih banyak maklumat frekuensi tinggi perlu ditambah.
Selain itu, keamatan penipisan adalah sama dengan 1-cosθ*, di mana θ* ialah nilai maksimum sudut θ antara semua sudut kamera sebelumnya dan vektor normal permukaan yang dilihat, dengan itu melukis semula pertindihan secara adaptif kawasan.
△Hubungan antara sudut kamera dan keamatan penipisan
Untuk memilih intensiti penipisan yang sesuai untuk memastikan kesetiaan sambil meningkatkan kualiti, penulis menggunakan teorem unjuran dan idea resolusi super imej dan mencadangkan strategi lukis semula sedar keterlihatan yang ringkas dan mudah untuk memperhalusi kawasan yang bertindih.
2. Pembinaan semula 3D yang pantas dan berkualiti tinggi
Seperti yang ditunjukkan dalam rajah di bawah, penulis menggunakan kaedah dua peringkat dalam proses pembinaan semula 3D yang pantas dan berkualiti tinggi. .
Pada masa yang sama, dengan bantuan jujukan imej berkualiti tinggi berbilang paparan yang dijana sebelum ini, pengarang dapat melakukan pembinaan semula tekstur 3D yang pantas menggunakan ralat min kuasa dua yang mudah
(MSE)
kerugian. Ketekalan optimum, kualiti dan kelajuanPenyelidik membandingkan kaedah pada berbilang tugas penjanaan satu paparan.
△Perbandingan visualisasi generasi 3D paparan tunggal
Pada set data RealFusion15 dan Test-alpha, Repaint123 mencapai keputusan yang paling terkemuka dalam tiga aspek: ketekalan, kualiti dan kelajuan.
Pada masa yang sama, penulis juga menjalankan eksperimen ablasi terhadap keberkesanan setiap modul yang digunakan di dalam kertas dan kenaikan putaran sudut tontonan:
dan mendapati bahawa apabila sudut tontonan ialah 60 darjah, prestasi mencapai kemuncak, Walau bagaimanapun, selang sudut tontonan yang berlebihan akan mengurangkan kawasan bertindih dan meningkatkan kemungkinan masalah pelbagai segi, jadi 40 darjah boleh digunakan sebagai selang sudut tontonan yang optimum.
Alamat kod: https://pku-yuangroup.github.io/repaint123/:Alamat projek
https //pku-yuangroup.github.io/repaint123/
Atas ialah kandungan terperinci Dihasilkan oleh Universiti Peking: SOTA terkini dengan kualiti tekstur dan konsistensi berbilang paparan, mencapai penukaran 3D satu imej dalam masa 2 minit. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



<p>Windows 11 menambah baik pemperibadian dalam sistem, membenarkan pengguna melihat sejarah terkini perubahan latar belakang desktop yang dibuat sebelum ini. Apabila anda memasuki bahagian pemperibadian dalam aplikasi Tetapan Sistem Windows, anda boleh melihat pelbagai pilihan, menukar kertas dinding latar belakang adalah salah satu daripadanya. Tetapi kini anda boleh melihat sejarah terkini kertas dinding latar belakang yang ditetapkan pada sistem anda. Jika anda tidak suka melihat ini dan ingin mengosongkan atau memadamkan sejarah terbaharu ini, teruskan membaca artikel ini, yang akan membantu anda mengetahui lebih lanjut tentang cara melakukannya menggunakan Editor Pendaftaran. </p><h2>Cara menggunakan penyuntingan pendaftaran

Windows tidak pernah mengabaikan estetika. Daripada bidang hijau bucolic XP kepada reka bentuk berputar biru Windows 11, kertas dinding desktop lalai telah menjadi sumber kegembiraan pengguna selama bertahun-tahun. Dengan Windows Spotlight, anda kini mempunyai akses terus kepada imej yang cantik dan mengagumkan untuk skrin kunci dan kertas dinding desktop anda setiap hari. Malangnya, imej ini tidak melepak. Jika anda telah jatuh cinta dengan salah satu imej sorotan Windows, maka anda pasti ingin tahu cara memuat turunnya supaya anda boleh mengekalkannya sebagai latar belakang anda buat seketika. Ini semua yang anda perlu tahu. Apakah WindowsSpotlight? Sorotan Tetingkap ialah pengemas kini kertas dinding automatik yang tersedia daripada Pemperibadian > dalam apl Tetapan

Dengan pembangunan berterusan teknologi kecerdasan buatan, teknologi segmentasi semantik imej telah menjadi hala tuju penyelidikan yang popular dalam bidang analisis imej. Dalam segmentasi semantik imej, kami membahagikan kawasan yang berbeza dalam imej dan mengelaskan setiap kawasan untuk mencapai pemahaman yang menyeluruh tentang imej. Python ialah bahasa pengaturcaraan yang terkenal dengan keupayaan analisis data dan visualisasi datanya yang hebat menjadikannya pilihan pertama dalam bidang penyelidikan teknologi kecerdasan buatan. Artikel ini akan memperkenalkan cara menggunakan teknologi segmentasi semantik imej dalam Python. 1. Pengetahuan prasyarat semakin mendalam

Dengan apl iOS 17 Photos, Apple memudahkan untuk memangkas foto mengikut spesifikasi anda. Baca terus untuk mengetahui caranya. Sebelum ini dalam iOS 16, memangkas imej dalam apl Foto melibatkan beberapa langkah: Ketik antara muka pengeditan, pilih alat pangkas dan kemudian laraskan pemangkasan menggunakan gerak isyarat picit untuk zum atau seret penjuru alat pangkas. Dalam iOS 17, Apple bersyukur telah memudahkan proses ini supaya apabila anda mengezum masuk pada mana-mana foto yang dipilih dalam pustaka Foto anda, butang Pangkas baharu muncul secara automatik di penjuru kanan sebelah atas skrin. Mengklik padanya akan memaparkan antara muka pemangkasan penuh dengan tahap zum pilihan anda, jadi anda boleh memangkas ke bahagian imej yang anda suka, memutar imej, menyongsangkan imej atau menggunakan nisbah skrin atau menggunakan penanda

Mereka yang perlu bekerja dengan fail imej setiap hari selalunya perlu mengubah saiznya agar sesuai dengan keperluan projek dan pekerjaan mereka. Walau bagaimanapun, jika anda mempunyai terlalu banyak imej untuk diproses, saiz semula imej secara individu boleh mengambil banyak masa dan usaha. Dalam kes ini, alat seperti PowerToys boleh berguna untuk, antara lain, mengubah saiz fail kumpulan menggunakan utiliti pengubah semula imejnya. Begini cara untuk menyediakan tetapan Image Resizer anda dan mulakan saiz semula kumpulan imej dengan PowerToys. Cara Mengubah Saiz Imej Secara Berkelompok dengan PowerToys PowerToys ialah program semua-dalam-satu dengan pelbagai utiliti dan ciri untuk membantu anda mempercepatkan tugas harian anda. Salah satu utilitinya ialah imej

Terima kasih kepada pemaparan boleh beza yang disediakan oleh NeRF, model generatif 3D terkini telah mencapai hasil yang menakjubkan pada objek pegun. Walau bagaimanapun, dalam kategori yang lebih kompleks dan boleh berubah bentuk seperti tubuh manusia, generasi 3D masih menimbulkan cabaran yang hebat. Makalah ini mencadangkan perwakilan NeRF gabungan yang cekap bagi tubuh manusia, membolehkan penjanaan badan manusia 3D resolusi tinggi (512x256) tanpa menggunakan model resolusi super. EVA3D telah dengan ketara mengatasi penyelesaian sedia ada pada empat set data badan manusia berskala besar, dan kod tersebut adalah sumber terbuka. Nama kertas: EVA3D: Penjanaan Manusia 3D Komposisi daripada Koleksi imej 2D Alamat kertas: http

Penjanaan imej perspektif baharu (NVS) adalah bidang aplikasi penglihatan komputer Dalam permainan SuperBowl 1998, RI CMU menunjukkan NVS diberikan penglihatan stereo berbilang kamera (MVS) Pada masa itu, teknologi ini dipindahkan ke stesen TV sukan di Amerika Syarikat, tetapi ia tidak dikomersialkan pada akhirnya; British BBC Broadcasting Company melabur dalam penyelidikan dan pembangunan untuk ini, tetapi ia tidak benar-benar dikomersialkan. Dalam bidang rendering berasaskan imej (IBR), terdapat satu cabang aplikasi NVS iaitu depth image-based rendering (DBIR). Di samping itu, TV 3D, yang sangat popular pada tahun 2010, juga perlu mendapatkan kesan stereoskopik binokular daripada video monokular, tetapi disebabkan ketidakmatangan teknologi, ia tidak menjadi popular pada akhirnya. Pada masa itu, kaedah berasaskan pembelajaran mesin telah pun mula dipelajari, seperti

Dengan perkembangan pesat industri budaya digital, teknologi kecerdasan buatan telah mula digunakan secara meluas dalam bidang penyuntingan dan pengindahan imej. Antaranya, mencantikkan kulit potret tidak diragukan lagi merupakan salah satu teknologi yang paling banyak digunakan dan paling dituntut. Algoritma kecantikan tradisional menggunakan teknologi penyuntingan imej berasaskan penapis untuk mencapai kesan penurapan semula kulit dan penyingkiran noda secara automatik, dan telah digunakan secara meluas dalam rangkaian sosial, siaran langsung dan senario lain. Walau bagaimanapun, dalam industri fotografi profesional dengan ambang yang tinggi, disebabkan oleh keperluan yang tinggi untuk resolusi imej dan standard kualiti, retoucher manual masih menjadi kuasa produktif utama dalam ubah suai kecantikan potret, menyelesaikan tugas termasuk melicinkan kulit, menghilangkan cela, pemutihan, dll. Siri kerja. Biasanya, masa pemprosesan purata untuk penyesuai profesional untuk melakukan operasi mencantikkan kulit pada potret definisi tinggi adalah 1-2 minit Dalam bidang seperti pengiklanan, filem dan televisyen, yang memerlukan ketepatan yang lebih tinggi, ini
