Jadual Kandungan
Ikhtisar Kaedah
Rumah Peranti teknologi AI Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Apr 12, 2023 pm 08:10 PM
video imej

Kami tahu bahawa kemajuan dalam model generatif dan model bahasa visual multimodal telah membuka jalan kepada model teks-ke-imej berskala besar dengan realisme dan kepelbagaian generatif yang belum pernah berlaku sebelum ini. Model ini menawarkan proses kreatif baharu, tetapi terhad kepada penggubahan imej baharu dan bukannya mengedit imej sedia ada. Untuk merapatkan jurang ini, kaedah penyuntingan berasaskan teks intuitif membolehkan pengeditan berasaskan teks bagi imej yang dijana dan sebenar serta mengekalkan beberapa sifat asal imej ini. Sama seperti imej, banyak model teks-ke-video telah dicadangkan baru-baru ini, tetapi terdapat beberapa kaedah yang menggunakan model ini untuk penyuntingan video. ​

Dalam penyuntingan video berpandukan teks, pengguna menyediakan video input serta gesaan teks yang menerangkan sifat jangkaan video yang dijana, seperti ditunjukkan dalam Rajah 1 di bawah. Matlamat mempunyai tiga aspek berikut, 1) Penjajaran, video yang diedit harus mematuhi gesaan teks input 2) Kesetiaan, video yang diedit harus mengekalkan kandungan video asal, 3) Kualiti, video yang diedit harus mempunyai kualiti yang tinggi; .

Seperti yang anda lihat, Penyuntingan video adalah lebih mencabar daripada penyuntingan imej, ia memerlukan mensintesis tindakan baharu dan bukannya mengubah suai rupa visual . Terdapat juga keperluan untuk mengekalkan konsistensi temporal. Oleh itu, menggunakan kaedah penyuntingan peringkat imej seperti SDEdit dan Prompt-to-Prompt pada bingkai video tidak mencukupi untuk mencapai hasil yang baik.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Dalam kertas kerja baru-baru ini yang diterbitkan oleh Google Research dan lain-lain di arXiv, Penyelidik mencadangkan kaedah baharu, Dreamix, yang diilhamkan oleh UniTune dan menggunakan model penyebaran video bersyarat (VDM) teks pada penyuntingan video.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

  • Alamat kertas: https://arxiv.org/ pdf/2302.01329.pdf
  • Laman utama projek: https://dreamix-video-editing.github.io/

Inti kaedah dalam artikel ini adalah untuk menjadikan VDM bersyarat teks mengekalkan kesetiaan tinggi kepada video input melalui dua idea utama berikut . Seseorang tidak menggunakan hingar tulen sebagai permulaan model, tetapi menggunakan versi video asal yang diturunkan taraf untuk mengekalkan hanya maklumat spatiotemporal yang rendah dengan mengurangkan saiz dan menambah hingar yang lain adalah untuk meningkatkan lagi kesetiaan video asal dengan menala halus model generatif pada video asal Belanja.

Penalaan halus memastikan model memahami sifat resolusi tinggi video asal. Penalaan halus mudah bagi video input menyumbang kepada kebolehsuntingan gerakan yang agak rendah kerana model belajar untuk memilih gerakan mentah dan bukannya mengikut gesaan teks. Kami mencadangkan kaedah penalaan halus hibrid baru yang mana VDM juga diperhalusi pada set bingkai individu video input dan membuang masanya. Campurkan penalaan halus meningkatkan kualiti penyuntingan gerakan dengan ketara.

Para penyelidik selanjutnya menggunakan model penyuntingan video mereka untuk mencadangkan rangka kerja animasi imej baharu , seperti ditunjukkan dalam Rajah 2 di bawah. Rangka kerja ini terdiri daripada beberapa langkah, seperti menganimasikan objek dan latar belakang dalam imej, mencipta pergerakan kamera dinamik dan banyak lagi. Mereka melakukan ini melalui operasi pemprosesan imej mudah seperti penyalinan bingkai atau transformasi imej geometri, mencipta video kasar. Kemudian gunakan editor video Dreamix untuk mengedit video. Di samping itu, penyelidik juga menggunakan kaedah penalaan halus mereka untuk penjanaan video dipacu matlamat, iaitu versi video Dreambooth.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Dalam bahagian paparan eksperimen, penyelidik menjalankan penyelidikan kualitatif yang meluas dan penilaian manual, Menunjukkan keupayaan berkuasa kaedah mereka, sila rujuk animasi berikut untuk butiran.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Untuk kajian Google ini, sesetengah orang mengatakan bahawa 3D + gerakan dan penyuntingan Alat mungkin menjadi topik hangat untuk gelombang kertas seterusnya.

Orang lain berkata: Anda boleh membuat filem sendiri mengikut bajet tidak lama lagi, yang anda perlukan hanyalah skrin hijau dan teknologi ini:

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Ikhtisar Kaedah

Artikel ini mencadangkan kaedah baharu untuk penyuntingan video, khususnya :

Penyuntingan video berpandukan teks oleh video yang dimusnahkan kejuruteraan terbalik

Mereka menggunakan VDM (Model Penyebaran Video) berlatarkan, mula-mula memusnahkan video input pada tahap tertentu melalui pensampelan rendah, dan kemudian tambah bunyi. Seterusnya model resapan lata digunakan untuk proses pensampelan dan bersyarat pada masa t untuk meningkatkan skala video kepada resolusi temporal-ruang terakhir. ​

Dalam proses memusnahkan video input, anda perlu melakukan operasi pensampelan turun dahulu untuk mendapatkan model asas (16 bingkai 24 × 40), dan kemudian tambahkan varians ialah Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem hingar Gaussian, seterusnya merosakkan video input. ​

Untuk video yang diproses di atas, langkah seterusnya ialah menggunakan VDM berlatarkan untuk memetakan video resolusi rendah yang rosak kepada video resolusi tinggi yang sejajar dengan teks . Idea teras di sini ialah memandangkan video resolusi temporal dan spatial yang bising, sangat rendah, terdapat banyak video resolusi tinggi yang boleh dilaksanakan dengan sempurna yang sepadan dengannya. Model asas dalam kertas ini bermula daripada video yang rosak, yang mempunyai bunyi yang sama seperti proses resapan pada masa s. Kajian itu kemudiannya menggunakan VDM untuk membalikkan proses resapan sehingga masa 0. Akhirnya, video itu dinaik taraf melalui model resolusi super.

Penalaan halus imej video hibrid

Penalaan halus model penyebaran video menggunakan hanya video input akan mengehadkan pergerakan objek berubah, Sebaliknya, kajian ini menggunakan sasaran hibrid, iaitu, sebagai tambahan kepada sasaran asal (sudut kiri bawah), kertas ini juga melakukan penalaan halus pada set bingkai yang tidak teratur Ini dilakukan melalui "masked temporal perhatian" untuk mengelakkan perhatian temporal. Daya dan belitan ditala dengan halus (kanan bawah). Operasi ini membolehkan menambah gerakan pada video statik.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Penaakulan

dalam apl Berdasarkan pra-pemprosesan (Pra-pemprosesan Bergantung Aplikasi, ditinggalkan dalam rajah di bawah), penyelidikan ini menyokong pelbagai aplikasi dan boleh menukar kandungan input ke dalam format video bersatu. Untuk imej-ke-video, imej input disalin dan diubah, mensintesis video kasar dengan beberapa gerakan kamera untuk penjanaan video dipacu objek, inputnya ditinggalkan dan diperhalusi secara berasingan untuk mengekalkan kesetiaan. Video kasar ini kemudiannya disunting menggunakan Editor Video Dreamix (kanan): seperti yang dinyatakan sebelum ini, video pertama kali dimusnahkan dengan pensampelan rendah, menambah bunyi. Model penyebaran video berpandukan teks yang diperhalusi kemudiannya digunakan untuk meningkatkan skala video kepada resolusi temporal dan spatial terakhirnya.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Hasil eksperimen

Penyuntingan video: Dalam gambar di bawah, Dreamix menukar aksi kepada menari, dan penampilan berubah daripada monyet kepada beruang, Tetapi sifat asas subjek dalam video tidak berubah:

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem


Dreamix juga boleh menjana pengubahsuaian visual yang lancar yang konsisten dengan maklumat masa video input, seperti rusa yang boleh papan selaju seperti yang ditunjukkan di bawah:

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Imej ke video: Apabila input ialah imej, Dreamix boleh menambah objek bergerak baharu menggunakan videonya sebelum ini , seperti berikut Seekor unicorn muncul dalam hutan berkabus dan dizum masuk.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Penguin muncul di sebelah pondok:

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Penjanaan video dipacu matlamat: Dreamix juga boleh mengambil koleksi imej yang menunjukkan subjek yang sama dan menjana video baharu dengan subjek itu sebagai objek bergerak. Gambar di bawah menunjukkan seekor ulat menggeliat di atas daun:

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Selain analisis kualitatif, kajian itu juga menjalankan perbandingan garis dasar, terutamanya menggunakan Dreamix Compare with dua kaedah asas: Imagen-Video dan Plug-and-Play (PnP). Jadual berikut menunjukkan keputusan pemarkahan:

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Rajah 8 menunjukkan video yang disunting oleh Dreamix dan dua contoh asas: teks kepada Model video mendayakan pengeditan kesetiaan rendah kerana ia tidak dikondisikan pada video asal. PnP mengekalkan pemandangan tetapi kurang konsisten dari bingkai ke bingkai Dreamix berprestasi baik pada ketiga-tiga gol.

Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem

Sila rujuk kertas asal untuk butiran lanjut teknikal.

Atas ialah kandungan terperinci Google adalah yang pertama mengeluarkan AIGC generasi video, netizen: anda boleh menyesuaikan filem. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Di manakah fail video disimpan dalam cache penyemak imbas? Di manakah fail video disimpan dalam cache penyemak imbas? Feb 19, 2024 pm 05:09 PM

Dalam folder manakah penyemak imbas menyimpan video tersebut Apabila kita menggunakan pelayar Internet setiap hari, kita sering menonton pelbagai video dalam talian, seperti menonton video muzik di YouTube atau menonton filem di Netflix. Video ini akan dicache oleh penyemak imbas semasa proses pemuatan supaya ia boleh dimuatkan dengan cepat apabila dimainkan semula pada masa hadapan. Jadi persoalannya, dalam folder manakah video yang dicache ini sebenarnya disimpan? Pelayar yang berbeza menyimpan folder video cache di lokasi yang berbeza. Di bawah ini kami akan memperkenalkan beberapa pelayar biasa dan mereka

Adakah ia melanggar untuk menyiarkan video orang lain di Douyin? Bagaimanakah ia mengedit video tanpa pelanggaran? Adakah ia melanggar untuk menyiarkan video orang lain di Douyin? Bagaimanakah ia mengedit video tanpa pelanggaran? Mar 21, 2024 pm 05:57 PM

Dengan peningkatan platform video pendek, Douyin telah menjadi bahagian yang sangat diperlukan dalam kehidupan seharian setiap orang. Di TikTok, kita boleh melihat video menarik dari seluruh dunia. Sesetengah orang suka menyiarkan video orang lain, yang menimbulkan persoalan: Adakah Douyin melanggar apabila menyiarkan video orang lain? Artikel ini akan membincangkan isu ini dan memberitahu anda cara mengedit video tanpa pelanggaran dan cara mengelakkan isu pelanggaran. 1. Adakah ia melanggar penyiaran video orang lain oleh Douyin? Menurut peruntukan Undang-undang Hak Cipta negara saya, penggunaan tanpa kebenaran karya pemilik hak cipta tanpa kebenaran pemilik hak cipta adalah satu pelanggaran. Oleh itu, menyiarkan video orang lain di Douyin tanpa kebenaran pengarang asal atau pemilik hak cipta adalah satu pelanggaran. 2. Bagaimana untuk mengedit video tanpa pelanggaran? 1. Penggunaan domain awam atau kandungan berlesen: Awam

Bagaimana untuk membuang tera air video dalam Wink Bagaimana untuk membuang tera air video dalam Wink Feb 23, 2024 pm 07:22 PM

Bagaimana untuk membuang tera air daripada video dalam Wink? Terdapat alat untuk membuang tera air daripada video dalam winkAPP, tetapi kebanyakan rakan tidak tahu bagaimana untuk membuang tera air daripada video dalam Wink dibawa oleh editor Teks tutorial, pengguna yang berminat datang dan lihat! Cara membuang tera air video dalam Wink 1. Buka APP wink dahulu dan pilih fungsi [Remove Watermark] di kawasan halaman utama 2. Kemudian pilih video yang ingin anda keluarkan watermark dalam album 3. Kemudian pilih video dan klik sudut kanan atas selepas mengedit video [√];4 Akhir sekali, klik [Pencetakan satu klik] seperti yang ditunjukkan dalam rajah di bawah dan kemudian klik [Proses].

Bagaimana untuk membuat wang daripada menyiarkan video di Douyin? Bagaimanakah seorang pemula boleh membuat wang di Douyin? Bagaimana untuk membuat wang daripada menyiarkan video di Douyin? Bagaimanakah seorang pemula boleh membuat wang di Douyin? Mar 21, 2024 pm 08:17 PM

Douyin, platform video pendek kebangsaan, bukan sahaja membolehkan kami menikmati pelbagai video pendek yang menarik dan novel pada masa lapang kami, tetapi juga memberi kami pentas untuk menunjukkan diri kami dan merealisasikan nilai kami. Jadi, bagaimana untuk membuat wang dengan menyiarkan video di Douyin? Artikel ini akan menjawab soalan ini secara terperinci dan membantu anda menjana lebih banyak wang di TikTok. 1. Bagaimana untuk membuat wang daripada menyiarkan video di Douyin? Selepas menyiarkan video dan mendapat jumlah tontonan tertentu pada Douyin, anda akan berpeluang untuk mengambil bahagian dalam pelan perkongsian pengiklanan. Kaedah pendapatan ini adalah salah satu yang paling biasa kepada pengguna Douyin dan juga merupakan sumber pendapatan utama bagi banyak pencipta. Douyin memutuskan sama ada untuk menyediakan peluang perkongsian pengiklanan berdasarkan pelbagai faktor seperti berat akaun, kandungan video dan maklum balas khalayak. Platform TikTok membolehkan penonton menyokong pencipta kegemaran mereka dengan menghantar hadiah,

2 Cara untuk Alih Keluar Slow Motion daripada Video pada iPhone 2 Cara untuk Alih Keluar Slow Motion daripada Video pada iPhone Mar 04, 2024 am 10:46 AM

Pada peranti iOS, apl Kamera membolehkan anda merakam video gerak perlahan, atau 240 bingkai sesaat jika anda mempunyai iPhone terkini. Keupayaan ini membolehkan anda menangkap aksi berkelajuan tinggi dengan terperinci yang kaya. Tetapi kadangkala, anda mungkin mahu memainkan video gerak perlahan pada kelajuan biasa supaya anda boleh menghargai butiran dan tindakan dalam video dengan lebih baik. Dalam artikel ini, kami akan menerangkan semua kaedah untuk mengalih keluar gerakan perlahan daripada video sedia ada pada iPhone. Cara Mengalih Keluar Gerak Perlahan daripada Video pada iPhone [2 Kaedah] Anda boleh menggunakan Apl Foto atau Apl iMovie untuk mengalih keluar gerakan perlahan daripada video pada peranti anda. Kaedah 1: Buka pada iPhone menggunakan aplikasi Photos

Cara menyiarkan video di Weibo tanpa memampatkan kualiti imej_Cara menyiarkan video di Weibo tanpa memampatkan kualiti imej Cara menyiarkan video di Weibo tanpa memampatkan kualiti imej_Cara menyiarkan video di Weibo tanpa memampatkan kualiti imej Mar 30, 2024 pm 12:26 PM

1. Mula-mula buka Weibo pada telefon mudah alih anda dan klik [Saya] di sudut kanan bawah (seperti yang ditunjukkan dalam gambar). 2. Kemudian klik [Gear] di penjuru kanan sebelah atas untuk membuka tetapan (seperti yang ditunjukkan dalam gambar). 3. Kemudian cari dan buka [Tetapan Umum] (seperti yang ditunjukkan dalam gambar). 4. Kemudian masukkan pilihan [Video Follow] (seperti yang ditunjukkan dalam gambar). 5. Kemudian buka tetapan [Video Upload Resolution] (seperti yang ditunjukkan dalam gambar). 6. Akhir sekali, pilih [Kualiti Imej Asal] untuk mengelakkan pemampatan (seperti yang ditunjukkan dalam gambar).

Bagaimana untuk menerbitkan karya video Xiaohongshu? Apakah yang perlu saya perhatikan semasa menyiarkan video? Bagaimana untuk menerbitkan karya video Xiaohongshu? Apakah yang perlu saya perhatikan semasa menyiarkan video? Mar 23, 2024 pm 08:50 PM

Dengan kemunculan platform video pendek, Xiaohongshu telah menjadi platform untuk ramai orang berkongsi kehidupan mereka, meluahkan perasaan mereka dan mendapatkan trafik. Pada platform ini, menerbitkan karya video ialah cara interaksi yang sangat popular. Jadi, bagaimana untuk menerbitkan karya video Xiaohongshu? 1. Bagaimana untuk menerbitkan karya video Xiaohongshu? Mula-mula, pastikan anda mempunyai kandungan video yang sedia untuk dikongsi. Anda boleh menggunakan telefon bimbit anda atau peralatan kamera lain untuk merakam, tetapi anda perlu memberi perhatian kepada kualiti imej dan kejelasan bunyi. 2. Edit video: Untuk menjadikan kerja lebih menarik, anda boleh mengedit video. Anda boleh menggunakan perisian penyuntingan video profesional, seperti Douyin, Kuaishou, dsb., untuk menambah penapis, muzik, sari kata dan elemen lain. 3. Pilih kulit muka: Kulit adalah kunci untuk menarik pengguna untuk mengklik.

Bagaimana untuk menukar video yang dimuat turun oleh pelayar uc kepada video tempatan Bagaimana untuk menukar video yang dimuat turun oleh pelayar uc kepada video tempatan Feb 29, 2024 pm 10:19 PM

Bagaimana untuk menukar video yang dimuat turun oleh pelayar UC menjadi video tempatan? Ramai pengguna telefon mudah alih suka menggunakan Pelayar UC Mereka bukan sahaja boleh melayari web, tetapi juga menonton pelbagai video dan program TV dalam talian, dan memuat turun video kegemaran mereka ke telefon bimbit mereka. Sebenarnya, kami boleh menukar video yang dimuat turun kepada video tempatan, tetapi ramai orang tidak tahu bagaimana untuk melakukannya. Oleh itu, editor secara khas membawakan anda kaedah untuk menukar video yang dicache oleh pelayar UC kepada video tempatan saya harap ia dapat membantu anda. Kaedah untuk menukar video cache pelayar uc kepada video tempatan 1. Buka pelayar uc dan klik pilihan "Menu". 2. Klik "Muat Turun/Video". 3. Klik "Video Cache". 4. Tekan lama mana-mana video, apabila pilihan muncul, klik "Buka Direktori". 5. Semak yang anda ingin muat turun

See all articles