


Keluaran baharu sumber terbuka AI Kestabilan: Penjanaan 3D memperkenalkan model penyebaran video, ketekalan kualiti meningkat, 4090 boleh dimainkan
Stability AI, syarikat di sebalik Stable Diffusion, telah melancarkan sesuatu yang baharu.
Apa yang dibawa oleh ini ialah kemajuan baharu dalam grafik 3D:
Video 3D (SV3D) Stabil berdasarkan Resapan Video Stabil, yang boleh menjana jerat 3D berkualiti tinggi dengan hanya satu gambar.
Stable Video Diffusion (SVD) ialah model yang dikeluarkan sebelum ini oleh Stability AI untuk menjana video resolusi tinggi. Kemunculan SV3D menandakan kali pertama model penyebaran video telah berjaya digunakan dalam bidang penjanaan 3D.
Secara rasmi menyatakan bahawa berdasarkan ini, SV3D telah meningkatkan kualiti dan ketekalan paparan penjanaan 3D. . melihat butiran kertas.
Menggunakan model resapan video untuk penjanaan 3D
SV3D_u: Jana video orbit berdasarkan satu imej.
- SV3D_p: Memperluaskan fungsi SV3D_u untuk mencipta video model 3D berdasarkan laluan kamera yang ditentukan.
- Para penyelidik juga menambah baik teknologi pengoptimuman 3D: menggunakan strategi latihan kasar hingga halus, mengoptimumkan jaringan NeRF dan DMTet untuk menjana objek 3D.
Mereka juga mereka bentuk fungsi kehilangan khas yang dipanggil pensampelan penyulingan skor bertopeng (SDS) untuk meningkatkan kualiti dan konsistensi model 3D yang dijana dengan mengoptimumkan kawasan yang tidak dapat dilihat secara langsung dalam data latihan.
Pada masa yang sama, SV3D memperkenalkan model pencahayaan berdasarkan Gaussian sfera untuk memisahkan kesan pencahayaan dan tekstur, dengan berkesan mengurangkan masalah pencahayaan terbina dalam sambil mengekalkan kejelasan tekstur.
Khusus dari segi seni bina, SV3D mengandungi komponen utama berikut:
UNet: SV3D dibina berdasarkan SVD dan mengandungi UNet berbilang lapisan, di mana setiap lapisan mempunyai siri blok sisa (termasuk Lapisan konvolusi 3D) dan dua modul Transformer yang masing-masing memproses maklumat spatial dan temporal.Input bersyarat: Imej input dibenamkan ke dalam ruang terpendam melalui pengekod VAE, digabungkan dengan keadaan pendam hingar, dan input ke dalam UNet bersama-sama matriks benam CLIP bagi imej input digunakan sebagai kunci setiap salib modul Transformer -pasangan nilai lapisan perhatian.
Pengekodan trajektori kamera: SV3D mereka bentuk dua jenis trajektori, statik dan dinamik, untuk mengkaji kesan keadaan sikap kamera. Dalam orbit statik, kamera mengelilingi objek pada sudut azimut yang dijarakkan secara tetap dalam orbit dinamik, kamera membenarkan sudut azimut jarak yang tidak teratur dan sudut ketinggian yang berbeza.
- Maklumat trajektori gerakan kamera dan maklumat masa hingar resapan akan dimasukkan ke dalam modul sisa bersama-sama dan ditukar kepada pembenaman kedudukan sinusoidal Kemudian maklumat terbenam ini akan disepadukan dan diubah secara linear, dan ditambah pada masa hingar pembenaman langkah.
- Reka bentuk sedemikian bertujuan untuk meningkatkan keupayaan model untuk memproses imej dengan mengawal trajektori kamera dan input hingar dengan halus.
Selain itu, SV3D menggunakan CFG (panduan bebas pengelas) semasa proses penjanaan untuk mengawal ketajaman penjanaan, terutamanya apabila menjana beberapa bingkai terakhir trek, penskalaan CFG segi tiga digunakan untuk mengelakkan penajaman berlebihan .
Para penyelidik melatih SV3D pada set data Objaverse, dengan resolusi imej 575×576 dan medan pandangan 33.8 darjah. Makalah ini mendedahkan bahawa ketiga-tiga model (SV3D_u, SV3D_c, SV3D_p) telah dilatih pada 4 nod selama kira-kira 6 hari, setiap nod dilengkapi dengan 8 80GB A100 GPU.
Hasil eksperimen
Dari segi sintesis perspektif baharu (NVS) dan pembinaan semula 3D, SV3D mengatasi kaedah sedia ada lain dan mencapai SOTA.
Berdasarkan hasil perbandingan kualitatif, paparan berbilang paparan yang dijana oleh SV3D mempunyai butiran yang lebih kaya dan lebih dekat dengan imej input asal. Dalam erti kata lain, SV3D boleh menangkap butiran dengan lebih tepat dan mengekalkan konsistensi apabila melihat perubahan sudut dalam memahami dan membina semula struktur 3D objek.
Hasil sebegini telah membangkitkan emosi ramai netizen:
Boleh dibayangkan dalam tempoh 6-12 bulan akan datang, teknologi generasi 3D akan digunakan dalam permainan dan projek video.
Selalu ada beberapa idea berani di ruang komen...
Dan projek itu adalah sumber terbuka.
Pautan rujukan:
[1]https://twitter.com/StabilityAI/status/1769817136799855098.
[2]https://stability.ai/news/introducing-stable-video-3d.
[3]https://sv3d.github.io/index.html.
Atas ialah kandungan terperinci Keluaran baharu sumber terbuka AI Kestabilan: Penjanaan 3D memperkenalkan model penyebaran video, ketekalan kualiti meningkat, 4090 boleh dimainkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S

Menurut berita dari laman web ini pada 1 Ogos, SK Hynix mengeluarkan catatan blog hari ini (1 Ogos), mengumumkan bahawa ia akan menghadiri Global Semiconductor Memory Summit FMS2024 yang akan diadakan di Santa Clara, California, Amerika Syarikat dari 6 hingga 8 Ogos, mempamerkan banyak produk penjanaan teknologi baru. Pengenalan kepada Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage), dahulunya Sidang Kemuncak Memori Flash (FlashMemorySummit) terutamanya untuk pembekal NAND, dalam konteks peningkatan perhatian kepada teknologi kecerdasan buatan, tahun ini dinamakan semula sebagai Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage) kepada jemput vendor DRAM dan storan serta ramai lagi pemain. Produk baharu SK hynix dilancarkan tahun lepas

Pada bila-bila masa, tumpuan adalah satu kebaikan. Pengarang |. Editor Tang Yitao |. AIPin yang paling popular telah menemui ulasan negatif yang belum pernah terjadi sebelumnya. Marques Brownlee (MKBHD) menyifatkannya sebagai produk terburuk yang pernah dia semak; Editor The Verge, David Pierce berkata dia tidak akan mengesyorkan sesiapa pun membeli peranti ini. Pesaingnya, RabbitR1, tidak jauh lebih baik. Keraguan terbesar tentang peranti AI ini ialah ia jelas hanya sebuah aplikasi, tetapi Arnab telah membina perkakasan bernilai $200. Ramai orang melihat inovasi perkakasan AI sebagai peluang untuk menumbangkan era telefon pintar dan menumpukan diri mereka kepadanya.

Editor |. ScienceAI Baru-baru ini, Tom M. Mitchell, seorang profesor di Carnegie Mellon University dan dikenali sebagai "Bapa Pembelajaran Mesin," menulis kertas putih AI untuk Sains baharu, memfokuskan pada "Bagaimanakah kecerdasan buatan mempercepatkan pembangunan saintifik? Kerajaan A.S. Bantu mencapai matlamat ini? ScienceAI telah menyusun teks penuh kertas putih asal tanpa mengubah maksud asalnya. Bidang kecerdasan buatan telah mencapai kemajuan yang ketara baru-baru ini, termasuk model bahasa berskala besar seperti GPT, Claude, dan Gemini, sekali gus meningkatkan kemungkinan kesan yang sangat positif daripada kecerdasan buatan, mungkin akan mempercepatkan.

Editor |. ScienceAI Setahun yang lalu, Llion Jones, pengarang terakhir kertas Transformer Google, meninggalkan untuk memulakan perniagaan dan mengasaskan syarikat kecerdasan buatan SakanaAI dengan bekas penyelidik Google, David Ha. SakanaAI mendakwa mencipta model asas baharu berdasarkan kecerdasan yang diilhamkan oleh alam semula jadi! Kini, SakanaAI telah menyerahkan kertas jawapannya. SakanaAI mengumumkan pelancaran AIScientist, sistem AI pertama di dunia untuk penyelidikan saintifik automatik dan penemuan terbuka! Daripada mengandung, menulis kod, menjalankan eksperimen dan meringkaskan hasil, kepada menulis keseluruhan kertas kerja dan menjalankan ulasan rakan sebaya, AIScientist membuka kunci penyelidikan saintifik dan pecutan AI

Editor |. Kapasitor elektrostatik kulit lobak ialah komponen penyimpanan tenaga utama dalam sistem kuasa termaju dalam bidang pertahanan, penerbangan, tenaga dan pengangkutan. Ketumpatan tenaga ialah angka merit kapasitor elektrostatik dan ditentukan terutamanya oleh pilihan bahan dielektrik. Kebanyakan bahan dielektrik polimer gred industri ialah poliolefin fleksibel atau aromatik tegar yang menawarkan sama ada ketumpatan tenaga tinggi atau kestabilan terma yang tinggi, tetapi bukan kedua-duanya. Di sini, pasukan penyelidik dari Institut Teknologi Georgia, Universiti Connecticut dan Universiti Tsinghua menggunakan kecerdasan buatan (AI), kimia polimer dan kejuruteraan molekul untuk menemui salah satu siri polynorbornene dan polyimide

Baru-baru ini, tersebar berita bahawa Xiaomi akan melancarkan versi HyperOS 2.0 yang dinanti-nantikan pada bulan Oktober. 1.HyperOS2.0 dijangka akan dikeluarkan serentak dengan telefon pintar Xiaomi 15. HyperOS 2.0 akan meningkatkan keupayaan AI dengan ketara, terutamanya dalam penyuntingan foto dan video. HyperOS2.0 akan membawakan antara muka pengguna (UI) yang lebih moden dan diperhalusi, memberikan kesan visual yang lebih lancar, jelas dan lebih cantik. Kemas kini HyperOS 2.0 juga termasuk beberapa penambahbaikan antara muka pengguna, seperti keupayaan berbilang tugas yang dipertingkatkan, pengurusan pemberitahuan yang lebih baik dan lebih banyak pilihan penyesuaian skrin utama. Pengeluaran HyperOS 2.0 bukan sahaja menunjukkan kekuatan teknikal Xiaomi, tetapi juga visinya untuk masa depan sistem pengendalian telefon pintar.
