


Apple membangunkan 'Arkitek AI' GAUDI: menjana pemandangan 3D ultra-realistik berdasarkan teks!
Kini, model imej terhasil teks baharu dikeluarkan sekali-sekala, dan setiap daripadanya mempunyai kesan yang sangat hebat. Medan ini telah memukau semua orang. Walau bagaimanapun, sistem AI seperti OpenAI's DALL-E 2 atau Google's Imagen hanya boleh menghasilkan imej dua dimensi Jika teks juga boleh diubah menjadi pemandangan tiga dimensi, pengalaman visual akan menjadi dua kali ganda. Kini, pasukan AI dari Apple telah melancarkan seni bina saraf terkini untuk penjanaan pemandangan 3D - GAUDI.
Ia boleh menangkap pengedaran pemandangan 3D yang kompleks dan realistik, pemaparan mendalam daripada kamera mudah alih dan juga berdasarkan gesaan teks Cipta pemandangan 3D ! Model ini dinamakan sempena Antoni Gaudi, seorang arkitek terkenal Sepanyol.
Alamat kertas: https://arxiv.org/pdf/2207.13751.pdf
Pada masa ini, NeRF digunakan terutamanya sebagai medium storan saraf untuk model 3D dan pemandangan 3D yang boleh dipaparkan dari perspektif kamera yang berbeza. NeRF juga sudah mula digunakan dalam pengalaman realiti maya.Jadi, bolehkah NeRF, dengan keupayaan hebatnya untuk memaparkan imej secara realistik dari sudut kamera yang berbeza, boleh digunakan dalam AI generatif? Sudah tentu, terdapat pasukan penyelidik yang telah cuba menjana pemandangan 3D Contohnya, Google melancarkan sistem AI Dream Fields untuk kali pertama tahun lepas Ia menggabungkan keupayaan NeRF untuk menjana paparan 3D dengan keupayaan CLIP OpenAI untuk menilai kandungan imej. , dan akhirnya mencapai keupayaan untuk Menjana penerangan teks padanan NeRF.
Kapsyen: Google Dream Fields
Walau bagaimanapun, Google’s Dream Fields boleh hanya menjana paparan 3D bagi satu objek, dan terdapat banyak kesukaran untuk memanjangkannya kepada pemandangan 3D yang tidak dikekang sepenuhnya. Kesukaran terbesar ialah terdapat sekatan besar pada kedudukan kamera Untuk satu objek, setiap kedudukan kamera yang mungkin dan munasabah boleh dipetakan ke kubah, tetapi dalam adegan 3D, kedudukan kamera akan dipengaruhi oleh objek. dan dinding, dsb. Had halangan. Jika faktor ini tidak dipertimbangkan semasa penjanaan pemandangan, sukar untuk menghasilkan pemandangan 3D.
2Pakar rendering 3D GAUDI
Untuk masalah kedudukan kamera terhad yang dinyatakan di atas, model GAUDI Apple telah menghasilkan tiga rangkaian khusus Untuk memudahkannya: GAUDI mempunyaipenyahkod pose kamera, yang memisahkan pose kamera daripada geometri 3D dan rupa pemandangan, boleh meramalkan kemungkinan kedudukan kamera dan memastikan bahawa output adalah sah kedudukan seni bina pemandangan 3D.
Kapsyen: Seni bina model penyahkod
Penyahkod adegan Kemudian anda boleh meramalkan perwakilan satah tiga dimensi, iaitu kanvas 3D. Kemudian, penyahkod medan radiasi akan menggunakan persamaan pemaparan volum pada kanvas ini untuk melukis imej seterusnya.
Generasi 3D GAUDI terdiri daripada dua peringkat: Salah satunya ialah pengoptimuman parameter terpendam dan rangkaian: mempelajari perwakilan terpendam yang mengekod medan sinaran 3D dan pose kamera yang sepadan dengan ribuan trajektori. Tidak seperti untuk objek tunggal, pose kamera yang berkesan berbeza-beza mengikut adegan, jadi perlu untuk mengekodkan pose kamera yang sah untuk setiap adegan. Yang kedua ialah menggunakan model resapan untuk mempelajari model generatif pada perwakilan terpendam, supaya ia boleh dimodelkan dengan baik dalam kedua-dua tugas penaakulan bersyarat dan tanpa syarat. Yang pertama menjana pemandangan 3D berdasarkan teks atau gesaan imej, manakala yang kedua menjana pemandangan 3D berdasarkan trajektori kamera. Dengan pemandangan dalaman 3D, GAUDI boleh menjana pergerakan kamera baharu. Seperti dalam beberapa contoh di bawah, penerangan teks mengandungi maklumat tentang pemandangan dan laluan navigasi. Di sini pasukan penyelidik menggunakan pengekod teks berasaskan RoBERTa yang telah terlatih dan menggunakan perwakilan perantaraannya untuk melaraskan model resapan Kesan yang dihasilkan adalah seperti berikut: Gesaan teks: Masuk ke dapur Gesaan teks: Pergi ke tingkat atas Gesaan teks: Pergi melalui koridor Di samping itu, dengan menggunakan ResNet-18 yang telah terlatih sebagai pengekod imej, GAUDI dapat mencuba medan sinaran imej tertentu yang diperhatikan dari sudut pandangan rawak , dengan itu mengekstrak daripada isyarat imej Cipta pemandangan 3D. Petua Imej: Jana pemandangan 3D: Imej Petua: Jana adegan 3D: Eksperimen Penyelidik pada empat set data berbeza, termasuk set data pengimbasan dalaman ARKitScences, menunjukkan bahawa GAUDI boleh membina semula pandangan yang dipelajari dan memadankan kualiti kaedah sedia ada. Walaupun dalam tugas besar menghasilkan pemandangan 3D dengan ratusan ribu imej untuk beribu-ribu adegan dalaman, GAUDI tidak mengalami keruntuhan mod atau masalah orientasi. Kemunculan GAUDI bukan sahaja akan memberi kesan kepada banyak tugas penglihatan komputer, tetapi keupayaan penjanaan pemandangan 3Dnya juga akan memberi manfaat kepada pembelajaran dan perancangan pengukuhan berasaskan model, SLAM dan 3D kandungan dan bidang penyelidikan lain. Setakat ini, kualiti video yang dihasilkan oleh GAUDI tidaklah tinggi, dan banyak artifak boleh dilihat. Walau bagaimanapun, sistem ini mungkin merupakan permulaan dan asas yang baik untuk sistem AI berterusan Apple untuk memaparkan objek dan pemandangan 3D Dikatakan bahawa GAUDI juga akan digunakan pada set kepala XR Apple untuk menjana kedudukan digital. Anda boleh menantikannya~.
Atas ialah kandungan terperinci Apple membangunkan 'Arkitek AI' GAUDI: menjana pemandangan 3D ultra-realistik berdasarkan teks!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Dasar sandaran dan pemulihan Gitlab di bawah sistem CentOS untuk memastikan keselamatan data dan pemulihan, Gitlab pada CentOS menyediakan pelbagai kaedah sandaran. Artikel ini akan memperkenalkan beberapa kaedah sandaran biasa, parameter konfigurasi dan proses pemulihan secara terperinci untuk membantu anda menubuhkan strategi sandaran dan pemulihan GitLab lengkap. 1. Backup Manual Gunakan Gitlab-Rakegitlab: Backup: Buat Perintah untuk Melaksanakan Backup Manual. Perintah ini menyokong maklumat utama seperti repositori Gitlab, pangkalan data, pengguna, kumpulan pengguna, kunci, dan kebenaran. Fail sandaran lalai disimpan dalam direktori/var/opt/gitlab/sandaran. Anda boleh mengubah suai /etc /gitlab

Panduan Lengkap untuk Memeriksa Konfigurasi HDFS Dalam Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk memeriksa konfigurasi dan menjalankan status HDFS secara berkesan pada sistem CentOS. Langkah -langkah berikut akan membantu anda memahami sepenuhnya persediaan dan operasi HDFS. Sahkan Pembolehubah Alam Sekitar Hadoop: Pertama, pastikan pembolehubah persekitaran Hadoop ditetapkan dengan betul. Di terminal, laksanakan arahan berikut untuk mengesahkan bahawa Hadoop dipasang dan dikonfigurasi dengan betul: Hadoopversion Semak fail konfigurasi HDFS: Fail konfigurasi teras HDFS terletak di/etc/hadoop/conf/direktori, di mana core-site.xml dan hdfs-site.xml adalah kritikal. gunakan

Membolehkan pecutan GPU pytorch pada sistem CentOS memerlukan pemasangan cuda, cudnn dan GPU versi pytorch. Langkah-langkah berikut akan membimbing anda melalui proses: Pemasangan CUDA dan CUDNN Tentukan keserasian versi CUDA: Gunakan perintah NVIDIA-SMI untuk melihat versi CUDA yang disokong oleh kad grafik NVIDIA anda. Sebagai contoh, kad grafik MX450 anda boleh menyokong CUDA11.1 atau lebih tinggi. Muat turun dan pasang Cudatoolkit: Lawati laman web rasmi Nvidiacudatoolkit dan muat turun dan pasang versi yang sepadan mengikut versi CUDA tertinggi yang disokong oleh kad grafik anda. Pasang Perpustakaan Cudnn:

Docker menggunakan ciri -ciri kernel Linux untuk menyediakan persekitaran berjalan yang cekap dan terpencil. Prinsip kerjanya adalah seperti berikut: 1. Cermin digunakan sebagai templat baca sahaja, yang mengandungi semua yang anda perlukan untuk menjalankan aplikasi; 2. Sistem Fail Kesatuan (Unionfs) menyusun pelbagai sistem fail, hanya menyimpan perbezaan, menjimatkan ruang dan mempercepatkan; 3. Daemon menguruskan cermin dan bekas, dan pelanggan menggunakannya untuk interaksi; 4. Ruang nama dan cgroups melaksanakan pengasingan kontena dan batasan sumber; 5. Pelbagai mod rangkaian menyokong interkoneksi kontena. Hanya dengan memahami konsep -konsep teras ini, anda boleh menggunakan Docker dengan lebih baik.

Memasang MySQL pada CentOS melibatkan langkah -langkah berikut: Menambah sumber MySQL YUM yang sesuai. Jalankan YUM Pasang Perintah MySQL-Server untuk memasang pelayan MySQL. Gunakan perintah mysql_secure_installation untuk membuat tetapan keselamatan, seperti menetapkan kata laluan pengguna root. Sesuaikan fail konfigurasi MySQL seperti yang diperlukan. Tune parameter MySQL dan mengoptimumkan pangkalan data untuk prestasi.

Panduan Lengkap untuk Melihat Log Gitlab Di bawah Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk melihat pelbagai log Gitlab dalam sistem CentOS, termasuk log utama, log pengecualian, dan log lain yang berkaitan. Sila ambil perhatian bahawa laluan fail log mungkin berbeza -beza bergantung pada versi GitLab dan kaedah pemasangan. Jika laluan berikut tidak wujud, sila semak fail Direktori Pemasangan dan Konfigurasi GitLab. 1. Lihat log Gitlab utama Gunakan arahan berikut untuk melihat fail log utama aplikasi GitLabRails: Perintah: Sudocat/var/Log/Gitlab/Gitlab-Rails/Production.log Perintah ini akan memaparkan produk

Apabila memasang dan mengkonfigurasi GitLab pada sistem CentOS, pilihan pangkalan data adalah penting. GitLab serasi dengan pelbagai pangkalan data, tetapi PostgreSQL dan MySQL (atau MariaDB) paling biasa digunakan. Artikel ini menganalisis faktor pemilihan pangkalan data dan menyediakan langkah pemasangan dan konfigurasi terperinci. Panduan Pemilihan Pangkalan Data Ketika memilih pangkalan data, anda perlu mempertimbangkan faktor -faktor berikut: PostgreSQL: Pangkalan data lalai Gitlab adalah kuat, mempunyai skalabilitas yang tinggi, menyokong pertanyaan kompleks dan pemprosesan transaksi, dan sesuai untuk senario aplikasi besar. MySQL/MariaDB: Pangkalan data relasi yang popular digunakan secara meluas dalam aplikasi web, dengan prestasi yang stabil dan boleh dipercayai. MongoDB: Pangkalan Data NoSQL, mengkhususkan diri dalam
