


Jadikan penyuntingan 3D semudah PS, algoritma baharu GaussianEditor boleh melengkapkan penambahan, pemadaman dan pengubahsuaian adegan 3D dalam beberapa minit
Suntingan 3D memainkan peranan penting dalam bidang seperti permainan dan realiti maya Walau bagaimanapun, pengeditan 3D sebelumnya mengalami masalah seperti penggunaan masa yang lama dan kebolehkawalan yang lemah, menjadikannya sukar untuk digunakan pada adegan sebenar. Baru-baru ini, Universiti Teknologi Nanyang, Universiti Tsinghua dan SenseTime mencadangkan algoritma pengeditan 3D baharu, GaussianEditor, yang buat pertama kalinya mencapai pengeditan adegan 3D yang boleh dikawal dan dipelbagaikan dalam masa 2-7 minit, mengatasi sepenuhnya kerja penyuntingan 3D sebelumnya.
Dalam beberapa tahun kebelakangan ini, penyelidikan dalam bidang penyuntingan 3D secara amnya tertumpu pada medan sinaran saraf (NeRF). Ini kerana NeRF bukan sahaja boleh melakukan pemodelan pemandangan 3D dengan tahap realisme yang tinggi, tetapi ciri tersiratnya sangat meningkatkan kebolehskalaan, yang mempunyai kelebihan ketara berbanding kaedah awan titik dan mesh tradisional. Walau bagaimanapun, NeRF bergantung pada rangkaian perceptron berbilang lapisan (MLP) berdimensi tinggi untuk mengekod data pemandangan, yang turut membawa had tertentu. Ia menyukarkan untuk mengubah suai bahagian tertentu adegan secara langsung dan meningkatkan kerumitan tugas seperti pemulihan imej dan komposisi pemandangan. Kerumitan ini bukan sahaja menjejaskan proses latihan, tetapi juga mengehadkan penggunaannya dalam aplikasi praktikal
GaussianEditor Untuk menyelesaikan masalah di atas, ia mengambil pendekatan baharu dan memilih Gaussian sputtering sebagai perwakilan 3Dnya. Gaussian Splatting ialah jenis perwakilan 3D baharu yang dicadangkan setengah tahun lalu Perwakilan ini telah mengatasi NeRF dalam banyak tugasan 3D seperti pembinaan semula 3D dan 4D Ia telah menarik perhatian meluas dalam bidang 3D sebaik sahaja ia dilancarkan dan merupakan salah satu daripadanya kejayaan terbesar dalam bidang 3D tahun ini. Gaussian Splatting mempunyai prospek dan potensi yang sangat baik, dan GaussianEditor ialah yang pertama melaksanakan penyuntingan perwakilan 3D ini. Projek ini adalah sumber terbuka dan menyediakan antara muka WebUI untuk pembelajaran dan penggunaan yang mudah.
- Paper Alamat: https://arxiv.org/abs/2311.14521
- home Halaman Alamat: https://buaacyw.github.io/gaussian-editor/
although Gaussian Gaussian Splatting mempunyai algoritma pemaparan yang cekap, tetapi penyuntingannya sebagai perwakilan paparan memberikan cabaran yang besar. Masalah utama ialah kekurangan kaedah yang cekap untuk mengenal pasti sasaran penyuntingan dengan tepat, yang penting untuk penyuntingan yang tepat dan boleh dikawal. Tambahan pula, telah ditunjukkan bahawa terdapat cabaran yang ketara dalam mengoptimumkan penyemburan Gaussian (GS) menggunakan panduan generatif yang sangat stokastik, seperti model resapan generatif seperti Resapan Stabil. Ini mungkin kerana GS dipengaruhi secara langsung oleh rawak dalam kerugian, tidak seperti perwakilan tersirat penimbalan rangkaian saraf. Pendedahan langsung ini membawa kepada kemas kini yang tidak stabil dan sifat mata Gaussian berubah secara langsung semasa latihan. Di samping itu, setiap langkah latihan GS mungkin melibatkan pengemaskinian sejumlah besar mata Gaussian, dan proses ini tidak mempunyai mekanisme penimbalan gaya rangkaian saraf. Masalah ini akan membawa kepada kecairan GS yang berlebihan dan menghalang penumpuannya kepada hasil yang baik seperti perwakilan tersirat dalam latihan
Untuk menyelesaikan masalah di atas, pasukan mula-mula memperkenalkan penjejakan semantik Gaussian untuk melengkapkan Gaussian Splatting (GS ) kawalan yang tepat. Penjejakan semantik Gaussian sentiasa boleh mengenal pasti titik Gaussian yang perlu diedit semasa proses latihan. Ini berbeza daripada kaedah pengeditan 3D tradisional, yang selalunya bergantung pada topeng 2D atau 3D statik. Apabila geometri dan rupa model 3D berubah semasa latihan, topeng ini beransur-ansur menjadi tidak berkesan. Penjejakan semantik Gaussian mencapai penjejakan sepanjang proses latihan dengan menayangkan topeng segmentasi 2D pada titik Gaussian 3D dan memberikan label semantik kepada setiap titik Gaussian. Apabila mata Gaussian berubah semasa latihan, label semantik ini membolehkan penjejakan titik Gaussian sasaran tertentu. Algoritma penjejakan semantik Gaussian memastikan bahawa hanya kawasan sasaran diubah suai, membolehkan pengeditan yang tepat dan terkawal.
Kawasan merah dalam gambar di bawah adalah kawasan sasaran yang dijejaki Kawasan pengesanan semantik akan dikemas kini secara dinamik dengan proses latihan untuk memastikan keberkesanannya.
Selain itu, untuk menangani cabaran utama Gaussian Splatting (GS) yang sukar untuk mencapai hasil yang baik apabila ia dijana secara rawak, GaussinEditor menggunakan perwakilan GS baharu: Hierarchical Gaussian Splatting , HGS). Dalam HGS, mata Gaussian disusun ke dalam generasi yang berbeza berdasarkan susunan ketumpatannya semasa latihan. Titik Gaussian yang terbentuk semasa proses ketumpatan awal dianggap sebagai generasi yang lebih tua, dan ia tertakluk kepada kekangan yang lebih ketat dengan tujuan untuk mengekalkan keadaan asalnya dan mengurangkan mobilitinya. Sebaliknya, mata Gaussian yang terbentuk pada peringkat seterusnya dianggap sebagai generasi muda, tertakluk kepada kurang atau tiada kekangan untuk meningkatkan kecergasan mereka. Reka bentuk HGS mengawal selia mobiliti GS dengan berkesan dengan mengenakan sekatan ke atas generasi lama sambil mengekalkan fleksibiliti generasi baharu. Pendekatan ini memungkinkan untuk terus mengoptimumkan ke arah hasil yang lebih baik, mensimulasikan fungsi penimbalan dalam perwakilan tersirat yang dilaksanakan melalui rangkaian neural
GaussianEditor deraditional yang dicadangkan untuk algoritma GaussianEditor dan Splash ini perwakilan. Dari segi pemadaman sasaran, pasukan membangunkan algoritma pembaikan tempatan khusus yang secara berkesan menghapuskan artifak pada antara muka antara objek dan tempat kejadian. Dari segi menambah sasaran, GaussianEditor boleh menambah sasaran tertentu pada kawasan tertentu berdasarkan gesaan teks dan topeng 2D yang disediakan oleh pengguna. GaussianEditor mula-mula menjana imej paparan tunggal bagi objek yang akan ditambah dengan bantuan algoritma Inpainting imej 2D. Imej ini kemudiannya ditukar kepada GS 3D menggunakan algoritma Imej kepada 3D. Akhirnya, sasaran dimasukkan ke dalam adegan Gaussian.
Dalam eksperimen perbandingan, GaussianEditor mengatasi kerja sebelumnya dengan ketara dari segi kualiti visual, penunjuk kuantitatif, kebolehkawalan dan kelajuan penjanaan
yang disahkan melalui pasukan yang berkesan
daripada mereka penjejakan semantik Gaussian yang dicadangkan dan perwakilan Gaussian hierarki
GaussianEditor, sebagai algoritma penyuntingan 3D lanjutan, memfokuskan pada pengeditan adegan 3D sputter secara fleksibel dan pantas, dan untuk Editor Gaussian sputter kali pertama
Ciri utama algoritma ini termasuk:
- Penjejakan semantik Gaussian: Ia boleh terus mengenal pasti mata Gaussian yang perlu diedit semasa proses latihan, memastikan hanya bahagian sasaran yang diedit.
- Hierarki Gaussian Splatting (HGS): Ini ialah perwakilan GS baharu yang menguruskan kecairan adegan GS dengan berkesan dengan mewujudkan struktur hierarki antara titik Gaussian yang terbentuk dalam peringkat latihan yang berbeza, dan mensimulasikan fungsi penampan saraf rangkaian dalam perwakilan tersirat.
- Algoritma penambahan dan pemadaman pemandangan 3D: GaussianEditor telah membangunkan dan mereka bentuk algoritma penambahan dan pemadaman pemandangan 3D untuk GS dengan cekap, yang boleh mengalih keluar atau menambah objek tertentu dari tempat kejadian dengan cekap.
Atas ialah kandungan terperinci Jadikan penyuntingan 3D semudah PS, algoritma baharu GaussianEditor boleh melengkapkan penambahan, pemadaman dan pengubahsuaian adegan 3D dalam beberapa minit. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



DDREASE ialah alat untuk memulihkan data daripada fail atau peranti sekat seperti cakera keras, SSD, cakera RAM, CD, DVD dan peranti storan USB. Ia menyalin data dari satu peranti blok ke peranti lain, meninggalkan blok data yang rosak dan hanya memindahkan blok data yang baik. ddreasue ialah alat pemulihan yang berkuasa yang automatik sepenuhnya kerana ia tidak memerlukan sebarang gangguan semasa operasi pemulihan. Selain itu, terima kasih kepada fail peta ddasue, ia boleh dihentikan dan disambung semula pada bila-bila masa. Ciri-ciri utama lain DDREASE adalah seperti berikut: Ia tidak menimpa data yang dipulihkan tetapi mengisi jurang sekiranya pemulihan berulang. Walau bagaimanapun, ia boleh dipotong jika alat itu diarahkan untuk melakukannya secara eksplisit. Pulihkan data daripada berbilang fail atau blok kepada satu

0. Apakah fungsi artikel ini? Kami mencadangkan DepthFM: model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens. Mari kita baca karya ini bersama-sama ~ 1. Tajuk maklumat kertas: DepthFM: FastMonocularDepthEstimationwithFlowMatching Pengarang: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Menghadapi ketinggalan, sambungan data mudah alih perlahan pada iPhone? Biasanya, kekuatan internet selular pada telefon anda bergantung pada beberapa faktor seperti rantau, jenis rangkaian selular, jenis perayauan, dsb. Terdapat beberapa perkara yang boleh anda lakukan untuk mendapatkan sambungan Internet selular yang lebih pantas dan boleh dipercayai. Betulkan 1 – Paksa Mulakan Semula iPhone Kadangkala, paksa memulakan semula peranti anda hanya menetapkan semula banyak perkara, termasuk sambungan selular. Langkah 1 – Hanya tekan kekunci naikkan kelantangan sekali dan lepaskan. Seterusnya, tekan kekunci Turun Kelantangan dan lepaskannya semula. Langkah 2 - Bahagian seterusnya proses adalah untuk menahan butang di sebelah kanan. Biarkan iPhone selesai dimulakan semula. Dayakan data selular dan semak kelajuan rangkaian. Semak semula Betulkan 2 – Tukar mod data Walaupun 5G menawarkan kelajuan rangkaian yang lebih baik, ia berfungsi lebih baik apabila isyarat lemah

Saya menangis hingga mati. Dunia sedang membina model besar. Data di Internet tidak mencukupi. Model latihan kelihatan seperti "The Hunger Games", dan penyelidik AI di seluruh dunia bimbang tentang cara memberi makan data ini kepada pemakan yang rakus. Masalah ini amat ketara dalam tugas berbilang modal. Pada masa mereka mengalami kerugian, pasukan pemula dari Jabatan Universiti Renmin China menggunakan model baharu mereka sendiri untuk menjadi yang pertama di China untuk menjadikan "suapan data yang dijana model itu sendiri" menjadi kenyataan. Selain itu, ia merupakan pendekatan serampang dua mata dari segi pemahaman dan sisi penjanaan Kedua-dua pihak boleh menjana data baharu berbilang modal yang berkualiti tinggi dan memberikan maklum balas data kepada model itu sendiri. Apakah model? Awaker 1.0, model berbilang modal besar yang baru sahaja muncul di Forum Zhongguancun. Siapa pasukan itu? Enjin Sophon. Diasaskan oleh Gao Yizhao, pelajar kedoktoran di Sekolah Kecerdasan Buatan Hillhouse Universiti Renmin.

Baru-baru ini, bulatan tentera telah terharu dengan berita: jet pejuang tentera AS kini boleh melengkapkan pertempuran udara automatik sepenuhnya menggunakan AI. Ya, baru-baru ini, jet pejuang AI tentera AS telah didedahkan buat pertama kali, mendedahkan misterinya. Nama penuh pesawat pejuang ini ialah Variable Stability Simulator Test Aircraft (VISTA). Ia diterbangkan sendiri oleh Setiausaha Tentera Udara AS untuk mensimulasikan pertempuran udara satu lawan satu. Pada 2 Mei, Setiausaha Tentera Udara A.S. Frank Kendall berlepas menggunakan X-62AVISTA di Pangkalan Tentera Udara Edwards Ambil perhatian bahawa semasa penerbangan selama satu jam, semua tindakan penerbangan telah diselesaikan secara autonomi oleh AI! Kendall berkata - "Sejak beberapa dekad yang lalu, kami telah memikirkan tentang potensi tanpa had pertempuran udara-ke-udara autonomi, tetapi ia sentiasa kelihatan di luar jangkauan." Namun kini,

Apa? Adakah Zootopia dibawa menjadi realiti oleh AI domestik? Didedahkan bersama-sama dengan video itu ialah model penjanaan video domestik berskala besar baharu yang dipanggil "Keling". Sora menggunakan laluan teknikal yang serupa dan menggabungkan beberapa inovasi teknologi yang dibangunkan sendiri untuk menghasilkan video yang bukan sahaja mempunyai pergerakan yang besar dan munasabah, tetapi juga mensimulasikan ciri-ciri dunia fizikal dan mempunyai keupayaan gabungan konsep dan imaginasi yang kuat. Mengikut data, Keling menyokong penjanaan video ultra panjang sehingga 2 minit pada 30fps, dengan resolusi sehingga 1080p dan menyokong berbilang nisbah aspek. Satu lagi perkara penting ialah Keling bukanlah demo atau demonstrasi hasil video yang dikeluarkan oleh makmal, tetapi aplikasi peringkat produk yang dilancarkan oleh Kuaishou, pemain terkemuka dalam bidang video pendek. Selain itu, tumpuan utama adalah untuk menjadi pragmatik, bukan untuk menulis cek kosong, dan pergi ke dalam talian sebaik sahaja ia dikeluarkan Model besar Ke Ling telah pun dikeluarkan di Kuaiying.
