Rumah Tutorial Perkakasan Kajian perkakasan Google mengeluarkan model 'Vlogger': satu gambar menghasilkan video 10 saat

Google mengeluarkan model 'Vlogger': satu gambar menghasilkan video 10 saat

Mar 21, 2024 pm 12:21 PM
Google robot menterjemah Kesan Inggeris gambar yang cantik penyuntingan video

Google telah mengeluarkan rangka kerja video baharu:

Anda hanya memerlukan gambar wajah anda dan rakaman ucapan anda untuk mendapatkan video ucapan anda yang seperti hidup.

Panjang video berubah-ubah, dan contoh semasa yang dilihat adalah sehingga 10s.

Anda boleh melihat bahawa kedua-dua bentuk mulut dan ekspresi muka adalah sangat semula jadi.

Jika imej input meliputi seluruh bahagian atas badan, ia juga boleh digunakan dengan pelbagai isyarat:

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Selepas membacanya, netizen berkata:

Dengannya, kita tidak perlu lagi menyusun rambut dan pakaian. untuk persidangan video dalam talian pada masa hadapan.

Nah, ambil potret dan rakam audio pertuturan (kepala anjing manual)

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Gunakan suara anda untuk mengawal potret untuk menjana video

Rangka kerja ini dipanggil VLOGGER.

Ia terutamanya berdasarkan model resapan dan mengandungi dua bahagian:

Satu ialah model resapan manusia-ke-3d-gerakan rawak.

Yang lain ialah seni bina resapan baharu untuk mempertingkatkan model teks-ke-imej.

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Antaranya, bekas bertanggungjawab menggunakan bentuk gelombang audio sebagai input untuk menjana tindakan kawalan badan watak, termasuk mata, ekspresi dan gerak isyarat, postur badan keseluruhan, dll.

Yang terakhir ialah model imej-ke-imej dimensi temporal yang digunakan untuk memanjangkan model resapan imej berskala besar dan menggunakan tindakan yang baru diramalkan untuk menjana bingkai yang sepadan.

Untuk menjadikan keputusan sesuai dengan imej watak tertentu, VLOGGER juga mengambil peta pose imej parameter sebagai input.

Latihan VLOGGER selesai pada set data yang sangat besar (bernama MENTOR).

Berapa besarnya? Ia berdurasi 2,200 jam dan mengandungi sejumlah 800,000 video aksara.

Antaranya, tempoh video set ujian juga adalah 120 jam, dengan jumlah 4,000 aksara.

Google memperkenalkan bahawa prestasi VLOGGER yang paling cemerlang ialah kepelbagaiannya:

Seperti yang ditunjukkan dalam gambar di bawah, semakin gelap (merah) warna imej piksel akhir, semakin kaya tindakan.

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Berbanding dengan kaedah serupa sebelumnya dalam industri, kelebihan terbesar VLOGGER ialah ia tidak perlu melatih semua orang, tidak bergantung pada pengesanan muka dan pemangkasan, dan video yang dihasilkan adalah lengkap (termasuk kedua-dua muka dan bibir , termasuk pergerakan badan), dsb.

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Khususnya, seperti yang ditunjukkan dalam jadual berikut:

Kaedah Pelakon Semula Wajah tidak boleh mengawal penjanaan video sedemikian dengan audio dan teks.

Audio-ke-gerakan boleh menjana audio dengan mengekod audio ke dalam pergerakan muka 3D, tetapi kesan yang dihasilkannya tidak cukup realistik.

Penyegerakan bibir boleh memproses video dengan tema yang berbeza, tetapi ia hanya boleh mensimulasikan pergerakan mulut.

Sebagai perbandingan, dua kaedah terakhir, SadTaker dan Styletalk, berprestasi paling hampir dengan Google VLOGGER, tetapi mereka juga dikalahkan oleh ketidakupayaan untuk mengawal badan dan mengedit video lagi.

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Bercakap tentang suntingan video, seperti dalam gambar di bawah, salah satu aplikasi model VLOGGER ialah ini boleh membuatkan watak diam, tutup mata, tutup mata kiri sahaja, atau buka seluruh mata dengan satu klik:

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Aplikasi lain ialah terjemahan video:

Sebagai contoh, menukar pertuturan bahasa Inggeris dalam video asal kepada bahasa Sepanyol dengan bentuk mulut yang sama.

Netizen mengeluh

Akhirnya, mengikut "peraturan lama", Google tidak mengeluarkan model itu, dan kini yang kita boleh lihat adalah lebih banyak kesan dan kertas.

Nah, terdapat banyak aduan:

Kualiti imej model, penyegerakan bibir tidak sepadan, ia masih kelihatan sangat robotik, dll.

Oleh itu, sesetengah orang tidak teragak-agak untuk meninggalkan ulasan negatif:

Adakah ini tahap Google?

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

Maaf atas nama "VLOGGER".

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

——Berbanding dengan Sora OpenAI, kenyataan netizen itu sememangnya tidak munasabah. .

Apa pendapat anda?

Lagi kesan:

https://enriccorona.github.io/vlogger/

Kertas penuh:

https://enriccorona.github.io/vlogger/paper.pdf

🎜

Atas ialah kandungan terperinci Google mengeluarkan model 'Vlogger': satu gambar menghasilkan video 10 saat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara Mengulas DeepSeek Cara Mengulas DeepSeek Feb 19, 2025 pm 05:42 PM

DeepSeek adalah alat pengambilan maklumat yang kuat. .

Cara Mencari DeepSeek Cara Mencari DeepSeek Feb 19, 2025 pm 05:39 PM

DeepSeek adalah enjin carian proprietari yang hanya mencari dalam pangkalan data atau sistem tertentu, lebih cepat dan lebih tepat. Apabila menggunakannya, pengguna dinasihatkan untuk membaca dokumen itu, cuba strategi carian yang berbeza, dapatkan bantuan dan maklum balas mengenai pengalaman pengguna untuk memanfaatkan kelebihan mereka.

Sesame Open Door Exchange Web Pautan Pautan Gerbang Perdagangan Laman Web Pendaftaran Terkini Sesame Open Door Exchange Web Pautan Pautan Gerbang Perdagangan Laman Web Pendaftaran Terkini Feb 28, 2025 am 11:06 AM

Artikel ini memperkenalkan proses pendaftaran versi web Web Open Exchange (GATE.IO) dan aplikasi Perdagangan Gate secara terperinci. Sama ada pendaftaran web atau pendaftaran aplikasi, anda perlu melawat laman web rasmi atau App Store untuk memuat turun aplikasi tulen, kemudian isi nama pengguna, kata laluan, e -mel, nombor telefon bimbit dan maklumat lain, dan lengkap e -mel atau pengesahan telefon bimbit.

Mengapa pautan Bybit Exchange tidak dimuat turun dan dipasang secara langsung? Mengapa pautan Bybit Exchange tidak dimuat turun dan dipasang secara langsung? Feb 21, 2025 pm 10:57 PM

Mengapa pautan Bybit Exchange tidak dimuat turun dan dipasang secara langsung? Bybit adalah pertukaran cryptocurrency yang menyediakan perkhidmatan perdagangan kepada pengguna. Aplikasi mudah alih Exchange tidak boleh dimuat turun terus melalui AppStore atau GooglePlay untuk sebab -sebab berikut: 1. Aplikasi pertukaran cryptocurrency sering tidak memenuhi keperluan ini kerana ia melibatkan perkhidmatan kewangan dan memerlukan peraturan dan standard keselamatan tertentu. 2. Undang -undang dan Peraturan Pematuhan di banyak negara, aktiviti yang berkaitan dengan urus niaga cryptocurrency dikawal atau terhad. Untuk mematuhi peraturan ini, aplikasi bybit hanya boleh digunakan melalui laman web rasmi atau saluran yang diberi kuasa lain

Cara Muat turun DeepSeek Cara Muat turun DeepSeek Feb 19, 2025 pm 05:45 PM

Pastikan untuk mengakses muat turun laman web rasmi dan periksa dengan teliti nama domain dan reka bentuk laman web. Selepas memuat turun, imbas fail. Baca protokol semasa pemasangan dan elakkan cakera sistem semasa memasang. Uji fungsi dan hubungi perkhidmatan pelanggan untuk menyelesaikan masalah. Kemas kini versi dengan kerap untuk memastikan keselamatan dan kestabilan perisian.

Platform Perdagangan Pintu Terbuka Sesame Muat turun Versi Mudah Alih Platform Perdagangan Platform Perdagangan Alamat Muat Turun Platform Perdagangan Pintu Terbuka Sesame Muat turun Versi Mudah Alih Platform Perdagangan Platform Perdagangan Alamat Muat Turun Feb 28, 2025 am 10:51 AM

Adalah penting untuk memilih saluran rasmi untuk memuat turun aplikasi dan memastikan keselamatan akaun anda.

Top 10 Disyorkan untuk App Perdagangan Aset Digital Crypto (2025 Global Ranking) Top 10 Disyorkan untuk App Perdagangan Aset Digital Crypto (2025 Global Ranking) Mar 18, 2025 pm 12:15 PM

Artikel ini mencadangkan sepuluh platform perdagangan cryptocurrency teratas yang memberi perhatian kepada, termasuk Binance, OKX, Gate.io, Bitflyer, Kucoin, Bybit, Coinbase Pro, Kraken, BYDFI dan Xbit yang desentralisasi. Platform ini mempunyai kelebihan mereka sendiri dari segi kuantiti mata wang transaksi, jenis urus niaga, keselamatan, pematuhan, dan ciri khas. Memilih platform yang sesuai memerlukan pertimbangan yang komprehensif berdasarkan pengalaman perdagangan anda sendiri, toleransi risiko dan keutamaan pelaburan. Semoga artikel ini membantu anda mencari saman terbaik untuk diri sendiri

Portal Log Masuk Versi Rasmi Binance Binance Portal Log Masuk Versi Rasmi Binance Binance Feb 21, 2025 pm 05:42 PM

Untuk mengakses versi Login Laman Web Binance yang terkini, ikuti langkah mudah ini. Pergi ke laman web rasmi dan klik butang "Login" di sudut kanan atas. Pilih kaedah log masuk anda yang sedia ada. Masukkan nombor mudah alih berdaftar atau e -mel dan kata laluan anda dan pengesahan lengkap (seperti kod pengesahan mudah alih atau Google Authenticator). Selepas pengesahan yang berjaya, anda boleh mengakses Portal Log masuk laman web rasmi Binance.

See all articles