Keluaran baharu sumber terbuka AI Kestabilan: Penjanaan 3D memperkenalkan model penyebaran video, ketekalan kualiti meningkat, 4090 boleh dimainkan-AI-php.cn

Jadual Kandungan

Rumah

Keluaran baharu sumber terbuka AI Kestabilan: Penjanaan 3D memperkenalkan model penyebaran video, ketekalan kualiti meningkat, 4090 boleh dimainkan

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 20, 2024 pm 02:25 PM

AI pasangan nilai kunci ai sumber terbuka

Stability AI, syarikat di sebalik Stable Diffusion, telah melancarkan sesuatu yang baharu.

Apa yang dibawa oleh ini ialah kemajuan baharu dalam grafik 3D:

Video 3D (SV3D) Stabil berdasarkan Resapan Video Stabil, yang boleh menjana jerat 3D berkualiti tinggi dengan hanya satu gambar.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Stable Video Diffusion (SVD) ialah model yang dikeluarkan sebelum ini oleh Stability AI untuk menjana video resolusi tinggi. Kemunculan SV3D menandakan kali pertama model penyebaran video telah berjaya digunakan dalam bidang penjanaan 3D.

Secara rasmi menyatakan bahawa berdasarkan ini, SV3D telah meningkatkan kualiti dan ketekalan paparan penjanaan 3D. . melihat butiran kertas.

Menggunakan model resapan video untuk penjanaan 3D Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Memperkenalkan model resapan video terpendam, tujuan teras SV3D adalah untuk menggunakan ketekalan temporal model video untuk meningkatkan ketekalan penjanaan 3D.

Dan data video itu sendiri juga lebih mudah diperoleh daripada data 3D.

Stability AI menyediakan dua versi SV3D kali ini:

SV3D_u: Jana video orbit berdasarkan satu imej.

SV3D_p: Memperluaskan fungsi SV3D_u untuk mencipta video model 3D berdasarkan laluan kamera yang ditentukan.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩 Mereka juga mereka bentuk fungsi kehilangan khas yang dipanggil pensampelan penyulingan skor bertopeng (SDS) untuk meningkatkan kualiti dan konsistensi model 3D yang dijana dengan mengoptimumkan kawasan yang tidak dapat dilihat secara langsung dalam data latihan.

Pada masa yang sama, SV3D memperkenalkan model pencahayaan berdasarkan Gaussian sfera untuk memisahkan kesan pencahayaan dan tekstur, dengan berkesan mengurangkan masalah pencahayaan terbina dalam sambil mengekalkan kejelasan tekstur.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Khusus dari segi seni bina, SV3D mengandungi komponen utama berikut:

UNet: SV3D dibina berdasarkan SVD dan mengandungi UNet berbilang lapisan, di mana setiap lapisan mempunyai siri blok sisa (termasuk Lapisan konvolusi 3D) dan dua modul Transformer yang masing-masing memproses maklumat spatial dan temporal.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩 Input bersyarat: Imej input dibenamkan ke dalam ruang terpendam melalui pengekod VAE, digabungkan dengan keadaan pendam hingar, dan input ke dalam UNet bersama-sama matriks benam CLIP bagi imej input digunakan sebagai kunci setiap salib modul Transformer -pasangan nilai lapisan perhatian.

Pengekodan trajektori kamera: SV3D mereka bentuk dua jenis trajektori, statik dan dinamik, untuk mengkaji kesan keadaan sikap kamera. Dalam orbit statik, kamera mengelilingi objek pada sudut azimut yang dijarakkan secara tetap dalam orbit dinamik, kamera membenarkan sudut azimut jarak yang tidak teratur dan sudut ketinggian yang berbeza.

Maklumat trajektori gerakan kamera dan maklumat masa hingar resapan akan dimasukkan ke dalam modul sisa bersama-sama dan ditukar kepada pembenaman kedudukan sinusoidal Kemudian maklumat terbenam ini akan disepadukan dan diubah secara linear, dan ditambah pada masa hingar pembenaman langkah.
Reka bentuk sedemikian bertujuan untuk meningkatkan keupayaan model untuk memproses imej dengan mengawal trajektori kamera dan input hingar dengan halus.

Selain itu, SV3D menggunakan CFG (panduan bebas pengelas) semasa proses penjanaan untuk mengawal ketajaman penjanaan, terutamanya apabila menjana beberapa bingkai terakhir trek, penskalaan CFG segi tiga digunakan untuk mengelakkan penajaman berlebihan .

Para penyelidik melatih SV3D pada set data Objaverse, dengan resolusi imej 575×576 dan medan pandangan 33.8 darjah. Makalah ini mendedahkan bahawa ketiga-tiga model (SV3D_u, SV3D_c, SV3D_p) telah dilatih pada 4 nod selama kira-kira 6 hari, setiap nod dilengkapi dengan 8 80GB A100 GPU.

Hasil eksperimen

Dari segi sintesis perspektif baharu (NVS) dan pembinaan semula 3D, SV3D mengatasi kaedah sedia ada lain dan mencapai SOTA.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Berdasarkan hasil perbandingan kualitatif, paparan berbilang paparan yang dijana oleh SV3D mempunyai butiran yang lebih kaya dan lebih dekat dengan imej input asal. Dalam erti kata lain, SV3D boleh menangkap butiran dengan lebih tepat dan mengekalkan konsistensi apabila melihat perubahan sudut dalam memahami dan membina semula struktur 3D objek.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Hasil sebegini telah membangkitkan emosi ramai netizen:

Boleh dibayangkan dalam tempoh 6-12 bulan akan datang, teknologi generasi 3D akan digunakan dalam permainan dan projek video.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Selalu ada beberapa idea berani di ruang komen...

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Dan projek itu adalah sumber terbuka.

Stability AI开源上新：3D生成引入视频扩散模型，质量一致性up，4090可玩

Pautan rujukan:
[1]https://twitter.com/StabilityAI/status/1769817136799855098.
[2]https://stability.ai/news/introducing-stable-video-3d.
[3]https://sv3d.github.io/index.html.

Atas ialah kandungan terperinci Keluaran baharu sumber terbuka AI Kestabilan: Penjanaan 3D memperkenalkan model penyebaran video, ketekalan kualiti meningkat, 4090 boleh dimainkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7467

Tutorial CakePHP

1376

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Untuk menyediakan tanda aras dan sistem penilaian menjawab soalan saintifik dan kompleks baharu untuk model besar, UNSW, Argonne, University of Chicago dan institusi lain bersama-sama melancarkan rangka kerja SciQAG Jul 25, 2024 am 06:42 AM

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Prestasi SOTA, kaedah AI ramalan pertalian protein-ligan pelbagai mod Xiamen, menggabungkan maklumat permukaan molekul buat kali pertama Jul 17, 2024 pm 06:37 PM

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S

SK Hynix akan memaparkan produk berkaitan AI baharu pada 6 Ogos: HBM3E 12 lapisan, NAND 321 tinggi, dsb. Aug 01, 2024 pm 09:40 PM

Menurut berita dari laman web ini pada 1 Ogos, SK Hynix mengeluarkan catatan blog hari ini (1 Ogos), mengumumkan bahawa ia akan menghadiri Global Semiconductor Memory Summit FMS2024 yang akan diadakan di Santa Clara, California, Amerika Syarikat dari 6 hingga 8 Ogos, mempamerkan banyak produk penjanaan teknologi baru. Pengenalan kepada Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage), dahulunya Sidang Kemuncak Memori Flash (FlashMemorySummit) terutamanya untuk pembekal NAND, dalam konteks peningkatan perhatian kepada teknologi kecerdasan buatan, tahun ini dinamakan semula sebagai Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage) kepada jemput vendor DRAM dan storan serta ramai lagi pemain. Produk baharu SK hynix dilancarkan tahun lepas

Iyo One: Bahagian fon kepala, sebahagian komputer audio Aug 08, 2024 am 01:03 AM

Pada bila-bila masa, tumpuan adalah satu kebaikan. Pengarang |. Editor Tang Yitao |. AIPin yang paling popular telah menemui ulasan negatif yang belum pernah terjadi sebelumnya. Marques Brownlee (MKBHD) menyifatkannya sebagai produk terburuk yang pernah dia semak; Editor The Verge, David Pierce berkata dia tidak akan mengesyorkan sesiapa pun membeli peranti ini. Pesaingnya, RabbitR1, tidak jauh lebih baik. Keraguan terbesar tentang peranti AI ini ialah ia jelas hanya sebuah aplikasi, tetapi Arnab telah membina perkakasan bernilai $200. Ramai orang melihat inovasi perkakasan AI sebagai peluang untuk menumbangkan era telefon pintar dan menumpukan diri mereka kepadanya.

'Bapa Pembelajaran Mesin' Mitchell menulis: Bagaimana AI mempercepatkan pembangunan saintifik dan bagaimana Amerika Syarikat merebut peluang Jul 29, 2024 pm 08:23 PM

Editor |. ScienceAI Baru-baru ini, Tom M. Mitchell, seorang profesor di Carnegie Mellon University dan dikenali sebagai "Bapa Pembelajaran Mesin," menulis kertas putih AI untuk Sains baharu, memfokuskan pada "Bagaimanakah kecerdasan buatan mempercepatkan pembangunan saintifik? Kerajaan A.S. Bantu mencapai matlamat ini? ScienceAI telah menyusun teks penuh kertas putih asal tanpa mengubah maksud asalnya. Bidang kecerdasan buatan telah mencapai kemajuan yang ketara baru-baru ini, termasuk model bahasa berskala besar seperti GPT, Claude, dan Gemini, sekali gus meningkatkan kemungkinan kesan yang sangat positif daripada kecerdasan buatan, mungkin akan mempercepatkan.

Sistem AI penemuan saintifik automatik sepenuhnya yang pertama, pengarang Transformer permulaan Sakana AI melancarkan AI Scientist Aug 13, 2024 pm 04:43 PM

Editor |. ScienceAI Setahun yang lalu, Llion Jones, pengarang terakhir kertas Transformer Google, meninggalkan untuk memulakan perniagaan dan mengasaskan syarikat kecerdasan buatan SakanaAI dengan bekas penyelidik Google, David Ha. SakanaAI mendakwa mencipta model asas baharu berdasarkan kecerdasan yang diilhamkan oleh alam semula jadi! Kini, SakanaAI telah menyerahkan kertas jawapannya. SakanaAI mengumumkan pelancaran AIScientist, sistem AI pertama di dunia untuk penyelidikan saintifik automatik dan penemuan terbuka! Daripada mengandung, menulis kod, menjalankan eksperimen dan meringkaskan hasil, kepada menulis keseluruhan kertas kerja dan menjalankan ulasan rakan sebaya, AIScientist membuka kunci penyelidikan saintifik dan pecutan AI

Prestasi ini 11 kali lebih kuat Pasukan Georgia Tech dan Tsinghua menggunakan AI untuk membantu dalam menemui bahan storan tenaga baharu, yang diterbitkan dalam sub-jurnal Nature. Jul 24, 2024 pm 05:42 PM

Editor |. Kapasitor elektrostatik kulit lobak ialah komponen penyimpanan tenaga utama dalam sistem kuasa termaju dalam bidang pertahanan, penerbangan, tenaga dan pengangkutan. Ketumpatan tenaga ialah angka merit kapasitor elektrostatik dan ditentukan terutamanya oleh pilihan bahan dielektrik. Kebanyakan bahan dielektrik polimer gred industri ialah poliolefin fleksibel atau aromatik tegar yang menawarkan sama ada ketumpatan tenaga tinggi atau kestabilan terma yang tinggi, tetapi bukan kedua-duanya. Di sini, pasukan penyelidik dari Institut Teknologi Georgia, Universiti Connecticut dan Universiti Tsinghua menggunakan kecerdasan buatan (AI), kimia polimer dan kejuruteraan molekul untuk menemui salah satu siri polynorbornene dan polyimide

HyperOS 2.0 debut dengan Xiaomi 15, AI adalah tumpuan Sep 01, 2024 pm 03:39 PM

Baru-baru ini, tersebar berita bahawa Xiaomi akan melancarkan versi HyperOS 2.0 yang dinanti-nantikan pada bulan Oktober. 1.HyperOS2.0 dijangka akan dikeluarkan serentak dengan telefon pintar Xiaomi 15. HyperOS 2.0 akan meningkatkan keupayaan AI dengan ketara, terutamanya dalam penyuntingan foto dan video. HyperOS2.0 akan membawakan antara muka pengguna (UI) yang lebih moden dan diperhalusi, memberikan kesan visual yang lebih lancar, jelas dan lebih cantik. Kemas kini HyperOS 2.0 juga termasuk beberapa penambahbaikan antara muka pengguna, seperti keupayaan berbilang tugas yang dipertingkatkan, pengurusan pemberitahuan yang lebih baik dan lebih banyak pilihan penyesuaian skrin utama. Pengeluaran HyperOS 2.0 bukan sahaja menunjukkan kekuatan teknikal Xiaomi, tetapi juga visinya untuk masa depan sistem pengendalian telefon pintar.

See all articles