Rumah Peranti teknologi AI Apple membangunkan 'Arkitek AI' GAUDI: menjana pemandangan 3D ultra-realistik berdasarkan teks!

Apple membangunkan 'Arkitek AI' GAUDI: menjana pemandangan 3D ultra-realistik berdasarkan teks!

May 02, 2023 pm 03:46 PM
ai arkitek

Kini, model imej terhasil teks baharu dikeluarkan sekali-sekala, dan setiap daripadanya mempunyai kesan yang sangat hebat. Medan ini telah memukau semua orang. Walau bagaimanapun, sistem AI seperti OpenAI's DALL-E 2 atau Google's Imagen hanya boleh menghasilkan imej dua dimensi Jika teks juga boleh diubah menjadi pemandangan tiga dimensi, pengalaman visual akan menjadi dua kali ganda. Kini, pasukan AI dari Apple telah melancarkan seni bina saraf terkini untuk penjanaan pemandangan 3D - GAUDI.

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Ia boleh menangkap pengedaran pemandangan 3D yang kompleks dan realistik, pemaparan mendalam daripada kamera mudah alih dan juga berdasarkan gesaan teks Cipta pemandangan 3D ! Model ini dinamakan sempena Antoni Gaudi, seorang arkitek terkenal Sepanyol.

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Alamat kertas: https://arxiv.org/pdf/2207.13751.pdf

Pada masa ini, NeRF digunakan terutamanya sebagai medium storan saraf untuk model 3D dan pemandangan 3D yang boleh dipaparkan dari perspektif kamera yang berbeza. NeRF juga sudah mula digunakan dalam pengalaman realiti maya.

Jadi, bolehkah NeRF, dengan keupayaan hebatnya untuk memaparkan imej secara realistik dari sudut kamera yang berbeza, boleh digunakan dalam AI generatif? Sudah tentu, terdapat pasukan penyelidik yang telah cuba menjana pemandangan 3D Contohnya, Google melancarkan sistem AI Dream Fields untuk kali pertama tahun lepas Ia menggabungkan keupayaan NeRF untuk menjana paparan 3D dengan keupayaan CLIP OpenAI untuk menilai kandungan imej. , dan akhirnya mencapai keupayaan untuk Menjana penerangan teks padanan NeRF.

Kapsyen: Google Dream Fields

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Walau bagaimanapun, Google’s Dream Fields boleh hanya menjana paparan 3D bagi satu objek, dan terdapat banyak kesukaran untuk memanjangkannya kepada pemandangan 3D yang tidak dikekang sepenuhnya. Kesukaran terbesar ialah terdapat sekatan besar pada kedudukan kamera Untuk satu objek, setiap kedudukan kamera yang mungkin dan munasabah boleh dipetakan ke kubah, tetapi dalam adegan 3D, kedudukan kamera akan dipengaruhi oleh objek. dan dinding, dsb. Had halangan. Jika faktor ini tidak dipertimbangkan semasa penjanaan pemandangan, sukar untuk menghasilkan pemandangan 3D.

2

Pakar rendering 3D GAUDI

Untuk masalah kedudukan kamera terhad yang dinyatakan di atas, model GAUDI Apple telah menghasilkan tiga rangkaian khusus Untuk memudahkannya: GAUDI mempunyai

penyahkod pose kamera, yang memisahkan pose kamera daripada geometri 3D dan rupa pemandangan, boleh meramalkan kemungkinan kedudukan kamera dan memastikan bahawa output adalah sah kedudukan seni bina pemandangan 3D.

Kapsyen: Seni bina model penyahkod

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Khusus adegan

Penyahkod adegan Kemudian anda boleh meramalkan perwakilan satah tiga dimensi, iaitu kanvas 3D. Kemudian, penyahkod medan radiasi akan menggunakan persamaan pemaparan volum pada kanvas ini untuk melukis imej seterusnya.

Generasi 3D GAUDI terdiri daripada dua peringkat:

Salah satunya ialah pengoptimuman parameter terpendam dan rangkaian: mempelajari perwakilan terpendam yang mengekod medan sinaran 3D dan pose kamera yang sepadan dengan ribuan trajektori. Tidak seperti untuk objek tunggal, pose kamera yang berkesan berbeza-beza mengikut adegan, jadi perlu untuk mengekodkan pose kamera yang sah untuk setiap adegan.

Yang kedua ialah menggunakan model resapan untuk mempelajari model generatif pada perwakilan terpendam, supaya ia boleh dimodelkan dengan baik dalam kedua-dua tugas penaakulan bersyarat dan tanpa syarat. Yang pertama menjana pemandangan 3D berdasarkan teks atau gesaan imej, manakala yang kedua menjana pemandangan 3D berdasarkan trajektori kamera.

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Dengan pemandangan dalaman 3D, GAUDI boleh menjana pergerakan kamera baharu. Seperti dalam beberapa contoh di bawah, penerangan teks mengandungi maklumat tentang pemandangan dan laluan navigasi. Di sini pasukan penyelidik menggunakan pengekod teks berasaskan RoBERTa yang telah terlatih dan menggunakan perwakilan perantaraannya untuk melaraskan model resapan Kesan yang dihasilkan adalah seperti berikut: Gesaan teks: Masuk ke dapur

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!.

Gesaan teks: Pergi ke tingkat atas

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Gesaan teks: Pergi melalui koridor

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Di samping itu, dengan menggunakan ResNet-18 yang telah terlatih sebagai pengekod imej, GAUDI dapat mencuba medan sinaran imej tertentu yang diperhatikan dari sudut pandangan rawak , dengan itu mengekstrak daripada isyarat imej Cipta pemandangan 3D. Petua Imej:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Jana pemandangan 3D:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Imej Petua:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Jana adegan 3D:

苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!

Eksperimen Penyelidik pada empat set data berbeza, termasuk set data pengimbasan dalaman ARKitScences, menunjukkan bahawa GAUDI boleh membina semula pandangan yang dipelajari dan memadankan kualiti kaedah sedia ada. Walaupun dalam tugas besar menghasilkan pemandangan 3D dengan ratusan ribu imej untuk beribu-ribu adegan dalaman, GAUDI tidak mengalami keruntuhan mod atau masalah orientasi.

Kemunculan GAUDI bukan sahaja akan memberi kesan kepada banyak tugas penglihatan komputer, tetapi keupayaan penjanaan pemandangan 3Dnya juga akan memberi manfaat kepada pembelajaran dan perancangan pengukuhan berasaskan model, SLAM dan 3D kandungan dan bidang penyelidikan lain.

Setakat ini, kualiti video yang dihasilkan oleh GAUDI tidaklah tinggi, dan banyak artifak boleh dilihat. Walau bagaimanapun, sistem ini mungkin merupakan permulaan dan asas yang baik untuk sistem AI berterusan Apple untuk memaparkan objek dan pemandangan 3D Dikatakan bahawa GAUDI juga akan digunakan pada set kepala XR Apple untuk menjana kedudukan digital. Anda boleh menantikannya~

Atas ialah kandungan terperinci Apple membangunkan 'Arkitek AI' GAUDI: menjana pemandangan 3D ultra-realistik berdasarkan teks!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Baris arahan shutdown centos Baris arahan shutdown centos Apr 14, 2025 pm 09:12 PM

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Apakah kaedah sandaran untuk gitlab di centos Apakah kaedah sandaran untuk gitlab di centos Apr 14, 2025 pm 05:33 PM

Dasar sandaran dan pemulihan Gitlab di bawah sistem CentOS untuk memastikan keselamatan data dan pemulihan, Gitlab pada CentOS menyediakan pelbagai kaedah sandaran. Artikel ini akan memperkenalkan beberapa kaedah sandaran biasa, parameter konfigurasi dan proses pemulihan secara terperinci untuk membantu anda menubuhkan strategi sandaran dan pemulihan GitLab lengkap. 1. Backup Manual Gunakan Gitlab-Rakegitlab: Backup: Buat Perintah untuk Melaksanakan Backup Manual. Perintah ini menyokong maklumat utama seperti repositori Gitlab, pangkalan data, pengguna, kumpulan pengguna, kunci, dan kebenaran. Fail sandaran lalai disimpan dalam direktori/var/opt/gitlab/sandaran. Anda boleh mengubah suai /etc /gitlab

Cara Memeriksa Konfigurasi HDFS CentOS Cara Memeriksa Konfigurasi HDFS CentOS Apr 14, 2025 pm 07:21 PM

Panduan Lengkap untuk Memeriksa Konfigurasi HDFS Dalam Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk memeriksa konfigurasi dan menjalankan status HDFS secara berkesan pada sistem CentOS. Langkah -langkah berikut akan membantu anda memahami sepenuhnya persediaan dan operasi HDFS. Sahkan Pembolehubah Alam Sekitar Hadoop: Pertama, pastikan pembolehubah persekitaran Hadoop ditetapkan dengan betul. Di terminal, laksanakan arahan berikut untuk mengesahkan bahawa Hadoop dipasang dan dikonfigurasi dengan betul: Hadoopversion Semak fail konfigurasi HDFS: Fail konfigurasi teras HDFS terletak di/etc/hadoop/conf/direktori, di mana core-site.xml dan hdfs-site.xml adalah kritikal. gunakan

Bagaimana sokongan GPU untuk Pytorch di CentOS Bagaimana sokongan GPU untuk Pytorch di CentOS Apr 14, 2025 pm 06:48 PM

Membolehkan pecutan GPU pytorch pada sistem CentOS memerlukan pemasangan cuda, cudnn dan GPU versi pytorch. Langkah-langkah berikut akan membimbing anda melalui proses: Pemasangan CUDA dan CUDNN Tentukan keserasian versi CUDA: Gunakan perintah NVIDIA-SMI untuk melihat versi CUDA yang disokong oleh kad grafik NVIDIA anda. Sebagai contoh, kad grafik MX450 anda boleh menyokong CUDA11.1 atau lebih tinggi. Muat turun dan pasang Cudatoolkit: Lawati laman web rasmi Nvidiacudatoolkit dan muat turun dan pasang versi yang sepadan mengikut versi CUDA tertinggi yang disokong oleh kad grafik anda. Pasang Perpustakaan Cudnn:

Penjelasan terperinci mengenai Prinsip Docker Penjelasan terperinci mengenai Prinsip Docker Apr 14, 2025 pm 11:57 PM

Docker menggunakan ciri -ciri kernel Linux untuk menyediakan persekitaran berjalan yang cekap dan terpencil. Prinsip kerjanya adalah seperti berikut: 1. Cermin digunakan sebagai templat baca sahaja, yang mengandungi semua yang anda perlukan untuk menjalankan aplikasi; 2. Sistem Fail Kesatuan (Unionfs) menyusun pelbagai sistem fail, hanya menyimpan perbezaan, menjimatkan ruang dan mempercepatkan; 3. Daemon menguruskan cermin dan bekas, dan pelanggan menggunakannya untuk interaksi; 4. Ruang nama dan cgroups melaksanakan pengasingan kontena dan batasan sumber; 5. Pelbagai mod rangkaian menyokong interkoneksi kontena. Hanya dengan memahami konsep -konsep teras ini, anda boleh menggunakan Docker dengan lebih baik.

CentOS memasang MySQL CentOS memasang MySQL Apr 14, 2025 pm 08:09 PM

Memasang MySQL pada CentOS melibatkan langkah -langkah berikut: Menambah sumber MySQL YUM yang sesuai. Jalankan YUM Pasang Perintah MySQL-Server untuk memasang pelayan MySQL. Gunakan perintah mysql_secure_installation untuk membuat tetapan keselamatan, seperti menetapkan kata laluan pengguna root. Sesuaikan fail konfigurasi MySQL seperti yang diperlukan. Tune parameter MySQL dan mengoptimumkan pangkalan data untuk prestasi.

Cara Melihat Log Gitlab Di Bawah Centos Cara Melihat Log Gitlab Di Bawah Centos Apr 14, 2025 pm 06:18 PM

Panduan Lengkap untuk Melihat Log Gitlab Di bawah Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk melihat pelbagai log Gitlab dalam sistem CentOS, termasuk log utama, log pengecualian, dan log lain yang berkaitan. Sila ambil perhatian bahawa laluan fail log mungkin berbeza -beza bergantung pada versi GitLab dan kaedah pemasangan. Jika laluan berikut tidak wujud, sila semak fail Direktori Pemasangan dan Konfigurasi GitLab. 1. Lihat log Gitlab utama Gunakan arahan berikut untuk melihat fail log utama aplikasi GitLabRails: Perintah: Sudocat/var/Log/Gitlab/Gitlab-Rails/Production.log Perintah ini akan memaparkan produk

Cara Memilih Pangkalan Data Gitlab di CentOs Cara Memilih Pangkalan Data Gitlab di CentOs Apr 14, 2025 pm 05:39 PM

Apabila memasang dan mengkonfigurasi GitLab pada sistem CentOS, pilihan pangkalan data adalah penting. GitLab serasi dengan pelbagai pangkalan data, tetapi PostgreSQL dan MySQL (atau MariaDB) paling biasa digunakan. Artikel ini menganalisis faktor pemilihan pangkalan data dan menyediakan langkah pemasangan dan konfigurasi terperinci. Panduan Pemilihan Pangkalan Data Ketika memilih pangkalan data, anda perlu mempertimbangkan faktor -faktor berikut: PostgreSQL: Pangkalan data lalai Gitlab adalah kuat, mempunyai skalabilitas yang tinggi, menyokong pertanyaan kompleks dan pemprosesan transaksi, dan sesuai untuk senario aplikasi besar. MySQL/MariaDB: Pangkalan data relasi yang popular digunakan secara meluas dalam aplikasi web, dengan prestasi yang stabil dan boleh dipercayai. MongoDB: Pangkalan Data NoSQL, mengkhususkan diri dalam

See all articles