Jadual Kandungan
Bentuk, tekstur, penyesuaian bahan
Kaedah dan proses penyelidikan
Pengenalan kepada pengarang
Rumah Peranti teknologi AI Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Apr 12, 2023 pm 11:16 PM
gpu Model NVIDIA

Abracadabra!

Dari segi penjanaan 2D model 3D, Nvidia telah melancarkan penyelidikan "bertaraf dunia" yang diisytiharkan sendiri: GET3D.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Selepas latihan tentang imej 2D, model boleh menjana bentuk 3D dengan tekstur ketelitian tinggi dan butiran geometri yang kompleks.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Berapa kuasanya?

Bentuk, tekstur, penyesuaian bahan

GET3D dinamakan kerana keupayaannya menjana jerat 3D bertekstur eksplisit (Janakan jerat 3D Tekstur Eksplisit) .

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Alamat kertas: https://arxiv.org/pdf/2209.11163.pdf

Iaitu bentuk yang diciptanya adalah dalam bentuk jala segi tiga, seperti model kertas, ditutup dengan bahan bertekstur.

Kuncinya ialah model ini boleh menjana pelbagai model berkualiti tinggi.

Contohnya, pelbagai roda pada kaki kerusi, lampu dan cermin telinga haiwan; , pakaian manusia...

Bangunan unik di kedua-dua belah jalan, kenderaan yang berbeza berpusing-pusing, dan orang lain yang lalu lalang Tetapi...

Ia sangat memakan masa untuk mencipta dunia maya 3D yang sama melalui pemodelan manual.

Walaupun model AI yang dijana 3D sebelumnya lebih pantas daripada pemodelan manual, mereka masih kekurangan keupayaan untuk menjana model yang lebih terperinci.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Malah kaedah rendering songsang terkini hanya boleh menjana objek 3D berdasarkan imej 2D yang diambil dari pelbagai sudut, Pembangun hanya boleh membina satu objek 3D pada satu masa.

GET3D adalah berbeza.

Pembangun boleh mengimport model yang dijana dengan mudah ke dalam enjin permainan, pemodel 3D dan pemapar filem untuk mengeditnya.

Apabila pencipta mengeksport model yang dijana GET3D ke aplikasi grafik, mereka boleh menggunakan kesan pencahayaan yang realistik semasa model bergerak atau berputar dalam pemandangan.

Seperti yang ditunjukkan dalam gambar:

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Selain itu, GET3D juga boleh mencapai penjanaan bentuk berpandukan teks.

Dengan menggunakan StyleGAN-NADA, alat AI lain daripada NVIDIA, pembangun boleh menggunakan gesaan teks untuk menambah gaya tertentu pada imej.

Sebagai contoh, anda boleh menukar kereta yang diberikan kepada kereta atau teksi yang terbakar

Tukar rumah biasa Transform menjadi rumah bata, rumah terbakar, atau rumah berhantu.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Atau gunakan ciri-ciri cetakan harimau dan cetakan panda pada mana-mana haiwan...

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Ia seperti "Animal Crossing" Simpsons...

NVIDIA memperkenalkan bahawa apabila dilatih pada GPU NVIDIA tunggal, GET3D boleh menjana kira-kira 20 objek sesaat.

Di sini, lebih besar dan lebih pelbagai set data latihan yang ia pelajari, lebih pelbagai dan terperinci outputnya.

Nvidia berkata bahawa pasukan penyelidik menggunakan GPU A100 untuk melatih model pada kira-kira 1 juta imej dalam masa 2 hari sahaja.

Kaedah dan proses penyelidikan

Rangka kerja GET3D, fungsi utamanya adalah untuk mensintesis bentuk tiga dimensi bertekstur.

Proses penjanaan terbahagi kepada dua bahagian: bahagian pertama ialah cawangan geometri, yang boleh mengeluarkan jerat permukaan mana-mana topologi. Bahagian lain ialah cawangan tekstur, yang menghasilkan medan tekstur dari mana titik permukaan boleh ditanya.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Semasa latihan, rasterizer boleh dibezakan Ia digunakan untuk cekap menjadikan jaringan tekstur yang terhasil menjadi imej resolusi tinggi dua dimensi. Keseluruhan proses boleh dipisahkan, membenarkan latihan lawan daripada imej dengan menyebarkan kecerunan diskriminasi 2D.

Selepas itu, kecerunan disebarkan daripada diskriminator 2D ke dua cawangan penjana.

Para penyelidik menjalankan eksperimen yang meluas untuk menilai model. Mereka mula-mula membandingkan kualiti jejaring bertekstur 3D yang dijana oleh GET3D dengan yang sedia ada yang dijana menggunakan set data ShapeNet dan Turbosquid.

Seterusnya, penyelidik mengoptimumkan model dalam kajian seterusnya berdasarkan hasil perbandingan dan menjalankan lebih banyak eksperimen.

Model GET3D boleh mencapai pemisahan fasa dalam geometri dan tekstur.

Rajah menunjukkan bentuk yang dijana oleh kod tersembunyi geometri yang sama dalam setiap baris, sambil menukar kod tekstur.

Menunjukkan dalam setiap lajur bentuk yang dijana oleh kod penyembunyian tekstur yang sama semasa menukar kod geometri.

Selain itu, penyelidik memasukkan kod tersembunyi geometri dari kiri ke kanan dalam bentuk yang dijana oleh kod penyembunyian tekstur yang sama dalam setiap baris.

dan bentuk yang dijana oleh kod penyembunyian geometri yang sama semasa memasukkan kod tekstur dari atas ke bawah. Keputusan menunjukkan bahawa setiap interpolasi adalah bermakna kepada model yang dihasilkan.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Dalam subgraf setiap model, GET3D dapat menjana peralihan lancar antara bentuk berbeza dalam semua kategori.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Dalam setiap baris, ganggu kod tersembunyi secara setempat dengan menambahkan bunyi kecil. Dengan cara ini, GET3D dapat menghasilkan bentuk yang kelihatan serupa tetapi sedikit berbeza secara tempatan.

Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta

Penyelidik ambil perhatian bahawa versi masa depan GET3D boleh menggunakan teknologi anggaran pose kamera untuk membolehkan pembangun melatih model untuk dunia sebenar data dan bukannya set data sintetik.

Pada masa hadapan, melalui penambahbaikan, pembangun boleh melatih GET3D pada pelbagai bentuk 3D sekaligus, bukannya melatihnya pada satu kategori objek pada satu masa.

Sanja Fidler, naib presiden penyelidikan kecerdasan buatan di NVIDIA, berkata,

GET3D membawa kita jauh daripada artificial kandungan 3D yang dipacu kecerdasan Pempopularan penciptaan adalah satu langkah lebih dekat. Keupayaannya untuk menjana bentuk 3D bertekstur dengan cepat boleh menjadi pengubah permainan untuk pembangun, membantu mereka mengisi dunia maya dengan cepat dengan pelbagai objek menarik.

Pengenalan kepada pengarang

Pengarang pertama kertas kerja, Jun Gao, ialah pelajar kedoktoran dalam kumpulan pembelajaran mesin Universiti Toronto, dan penyelianya ialah Sanja Fidler.

Selain kelayakan akademiknya yang cemerlang, beliau juga merupakan seorang saintis penyelidik di Makmal Kepintaran Buatan Toronto NVIDIA.

Penyelidikannya tertumpu terutamanya pada pembelajaran mendalam (DL), dengan matlamat pembelajaran perwakilan geometri berstruktur. Pada masa yang sama, penyelidikannya juga mendapat pandangan daripada persepsi manusia terhadap imej dan video 2D dan 3D.

Pelajar cemerlang yang sebegitu berasal dari Universiti Peking. Beliau lulus dengan ijazah sarjana muda pada 2018. Semasa di Universiti Peking, beliau bekerja bersama Profesor Wang Liwei.

Selepas tamat pengajian, beliau turut menjalani latihan di Universiti Stanford, MSRA dan NVIDIA.

Mentor Jun Gao juga merupakan peneraju dalam industri.

Fidler ialah profesor bersekutu di Universiti Toronto dan ahli fakulti di Vector Institute, di mana beliau juga merupakan ahli pengasas bersama.

Selain mengajar, beliau juga merupakan Naib Presiden Penyelidikan Kepintaran Buatan di NVIDIA, mengetuai makmal penyelidikan di Toronto.

Sebelum datang ke Toronto, beliau adalah Penolong Profesor Penyelidik di Institut Teknologi Toyota di Chicago. Institut ini terletak di kampus Universiti Chicago dan dianggap sebagai institusi akademik.

Bidang penyelidikan Fidler memfokuskan pada penglihatan komputer (CV) dan pembelajaran mesin (ML), memfokuskan pada persilangan CV dan grafik, penglihatan tiga dimensi dan Pembinaan semula dan sintesis 3D, serta kaedah interaktif untuk anotasi imej, dsb.

Atas ialah kandungan terperinci Satu GPU, 20 model sesaat! Mainan baharu NVIDIA menggunakan GET3D untuk mencipta alam semesta. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Dok pengembangan kad grafik Beelink EX menjanjikan kehilangan prestasi GPU sifar Dok pengembangan kad grafik Beelink EX menjanjikan kehilangan prestasi GPU sifar Aug 11, 2024 pm 09:55 PM

Salah satu ciri menonjol Beelink GTi 14 yang dilancarkan baru-baru ini ialah PC mini mempunyai slot PCIe x8 tersembunyi di bawahnya. Pada pelancaran, syarikat itu berkata bahawa ini akan memudahkan untuk menyambungkan kad grafik luaran ke sistem. Beelink mempunyai n

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Model dialog NVIDIA ChatQA telah berkembang kepada versi 2.0, dengan panjang konteks disebut pada 128K Model dialog NVIDIA ChatQA telah berkembang kepada versi 2.0, dengan panjang konteks disebut pada 128K Jul 26, 2024 am 08:40 AM

Komuniti LLM terbuka ialah era apabila seratus bunga mekar dan bersaing Anda boleh melihat Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 dan banyak lagi. model yang cemerlang. Walau bagaimanapun, berbanding dengan model besar proprietari yang diwakili oleh GPT-4-Turbo, model terbuka masih mempunyai jurang yang ketara dalam banyak bidang. Selain model umum, beberapa model terbuka yang mengkhusus dalam bidang utama telah dibangunkan, seperti DeepSeek-Coder-V2 untuk pengaturcaraan dan matematik, dan InternVL untuk tugasan bahasa visual.

AMD FSR 3.1 dilancarkan: ciri penjanaan bingkai juga berfungsi pada GPU Nvidia GeForce RTX dan Intel Arc AMD FSR 3.1 dilancarkan: ciri penjanaan bingkai juga berfungsi pada GPU Nvidia GeForce RTX dan Intel Arc Jun 29, 2024 am 06:57 AM

AMD menunaikan janji awalnya pada 24 Mac untuk melancarkan FSR 3.1 pada Q2 tahun ini. Apa yang benar-benar membezakan keluaran 3.1 ialah penyahgandingan bahagian penjanaan bingkai daripada bahagian peningkatan. Ini membolehkan pemilik GPU Nvidia dan Intel menggunakan FSR 3.

'Kilang AI' akan mempromosikan pembentukan semula keseluruhan susunan perisian, dan NVIDIA menyediakan bekas Llama3 NIM untuk digunakan oleh pengguna 'Kilang AI' akan mempromosikan pembentukan semula keseluruhan susunan perisian, dan NVIDIA menyediakan bekas Llama3 NIM untuk digunakan oleh pengguna Jun 08, 2024 pm 07:25 PM

Menurut berita dari laman web ini pada 2 Jun, pada ucaptama Huang Renxun 2024 Taipei Computex yang sedang berlangsung, Huang Renxun memperkenalkan kecerdasan buatan generatif akan mempromosikan pembentukan semula keseluruhan timbunan perisian dan menunjukkan perkhidmatan mikro asli awan NIM (Nvidia Inference Microservices). . Nvidia percaya bahawa "kilang AI" akan mencetuskan revolusi perindustrian baharu: mengambil industri perisian yang dipelopori oleh Microsoft sebagai contoh, Huang Renxun percaya bahawa kecerdasan buatan generatif akan menggalakkan pembentukan semula timbunan penuhnya. Untuk memudahkan penggunaan perkhidmatan AI oleh perusahaan dari semua saiz, NVIDIA melancarkan perkhidmatan mikro asli awan NIM (Nvidia Inference Microservices) pada Mac tahun ini. NIM+ ialah satu set perkhidmatan mikro asli awan yang dioptimumkan untuk mengurangkan masa ke pasaran

Melebihi DPO secara menyeluruh: Pasukan Chen Danqi mencadangkan pengoptimuman pilihan mudah SimPO, dan turut memperhalusi model sumber terbuka 8B terkuat Melebihi DPO secara menyeluruh: Pasukan Chen Danqi mencadangkan pengoptimuman pilihan mudah SimPO, dan turut memperhalusi model sumber terbuka 8B terkuat Jun 01, 2024 pm 04:41 PM

Untuk menyelaraskan model bahasa besar (LLM) dengan nilai dan niat manusia, adalah penting untuk mempelajari maklum balas manusia untuk memastikan bahawa ia berguna, jujur ​​dan tidak berbahaya. Dari segi penjajaran LLM, kaedah yang berkesan ialah pembelajaran pengukuhan berdasarkan maklum balas manusia (RLHF). Walaupun keputusan kaedah RLHF adalah cemerlang, terdapat beberapa cabaran pengoptimuman yang terlibat. Ini melibatkan latihan model ganjaran dan kemudian mengoptimumkan model dasar untuk memaksimumkan ganjaran tersebut. Baru-baru ini, beberapa penyelidik telah meneroka algoritma luar talian yang lebih mudah, salah satunya ialah pengoptimuman keutamaan langsung (DPO). DPO mempelajari model dasar secara langsung berdasarkan data keutamaan dengan meparameterkan fungsi ganjaran dalam RLHF, sekali gus menghapuskan keperluan untuk model ganjaran yang jelas. Kaedah ini mudah dan stabil

Tiada data OpenAI diperlukan, sertai senarai model kod besar! UIUC mengeluarkan StarCoder-15B-Instruct Tiada data OpenAI diperlukan, sertai senarai model kod besar! UIUC mengeluarkan StarCoder-15B-Instruct Jun 13, 2024 pm 01:59 PM

Di barisan hadapan teknologi perisian, kumpulan UIUC Zhang Lingming, bersama penyelidik dari organisasi BigCode, baru-baru ini mengumumkan model kod besar StarCoder2-15B-Instruct. Pencapaian inovatif ini mencapai kejayaan ketara dalam tugas penjanaan kod, berjaya mengatasi CodeLlama-70B-Instruct dan mencapai bahagian atas senarai prestasi penjanaan kod. Keunikan StarCoder2-15B-Instruct terletak pada strategi penjajaran diri yang tulen Keseluruhan proses latihan adalah terbuka, telus, dan sepenuhnya autonomi dan boleh dikawal. Model ini menjana beribu-ribu arahan melalui StarCoder2-15B sebagai tindak balas kepada penalaan halus model asas StarCoder-15B tanpa bergantung pada anotasi manual yang mahal.

LLM sudah selesai! OmniDrive: Mengintegrasikan persepsi 3D dan perancangan penaakulan (terbaharu NVIDIA) LLM sudah selesai! OmniDrive: Mengintegrasikan persepsi 3D dan perancangan penaakulan (terbaharu NVIDIA) May 09, 2024 pm 04:55 PM

Ditulis di atas & pemahaman peribadi pengarang: Kertas kerja ini didedikasikan untuk menyelesaikan cabaran utama model bahasa besar multimodal semasa (MLLM) dalam aplikasi pemanduan autonomi, iaitu masalah melanjutkan MLLM daripada pemahaman 2D kepada ruang 3D. Peluasan ini amat penting kerana kenderaan autonomi (AV) perlu membuat keputusan yang tepat tentang persekitaran 3D. Pemahaman spatial 3D adalah penting untuk AV kerana ia memberi kesan langsung kepada keupayaan kenderaan untuk membuat keputusan termaklum, meramalkan keadaan masa depan dan berinteraksi dengan selamat dengan alam sekitar. Model bahasa besar berbilang mod semasa (seperti LLaVA-1.5) selalunya hanya boleh mengendalikan input imej resolusi rendah (cth.) disebabkan oleh had resolusi pengekod visual, had panjang jujukan LLM. Walau bagaimanapun, aplikasi pemanduan autonomi memerlukan

See all articles