


MotionClone: Tiada latihan diperlukan, pengklonan satu klik pergerakan video

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com
Tiada latihan atau penalaan halus diperlukan atau pergerakan badan tempatan dengan satu klik untuk menyelesaikannya.
Kertas: https://arxiv.org/abs/2406.05338
Laman utama: https://bujiazi.github.io/motionclone.github.io/
- github.com/Bujiazi/MotionClone
- Tiada latihan atau penalaan halus diperlukan: Kaedah sebelumnya biasanya memerlukan model latihan untuk mengekod isyarat gerakan atau model resapan video penalaan halus agar sesuai dengan corak gerakan tertentu . Model latihan untuk mengekod isyarat gerakan mempunyai keupayaan generalisasi yang lemah untuk bergerak di luar domain latihan, dan memperhalusi model penjanaan video sedia ada boleh merosakkan kualiti penjanaan video asas model asas. MotionClone tidak memerlukan pengenalan sebarang latihan tambahan atau penalaan halus, meningkatkan keupayaan generalisasi gerakan sambil mengekalkan kualiti penjanaan model asas ke tahap yang terbaik.
- Kualiti gerakan yang lebih tinggi: Sukar untuk model video Wensheng sumber terbuka sedia ada untuk menjana pergerakan yang besar dan munasabah memperkenalkan panduan gerakan perhatian pemasaan komponen utama untuk meningkatkan amplitud gerakan video yang dijana dengan berkesan sambil memastikan pergerakan yang rasional.
- Hubungan kedudukan spatial yang lebih baik: Untuk mengelakkan ketidakpadanan semantik spatial yang mungkin disebabkan oleh pengklonan gerakan langsung, MotionClone mencadangkan panduan maklumat semantik spatial berdasarkan topeng perhatian silang untuk membantu dalam maklumat semantik spatial dan maklumat spatiotemporal yang betul gandingan.
Maklumat gerakan dalam modul perhatian temporal
Pembetulan semantik spatial
Panduan gerakan perhatian temporal komponen utama boleh mencapai pengklonan gerakan video rujukan, tetapi ia tidak dapat memastikan subjek yang bergerak konsisten dengan niat pengguna, yang akan mengurangkan kualiti penjanaan video . Dalam sesetengah kes, ia mungkin menyebabkan terkehel subjek yang bergerak. Untuk menyelesaikan masalah di atas, MotionClone memperkenalkan mekanisme bimbingan semantik spatial (panduan semantik sedar lokasi), membahagikan kawasan latar belakang depan dan belakang video melalui Topeng Perhatian Silang, dan menjaminnya dengan mengekang maklumat semantik masing-masing daripada latar belakang hadapan dan belakang video Susun atur rasional semantik spatial menggalakkan gandingan gerakan temporal dan semantik spatial yang betul.Butiran pelaksanaan MotionClone
DDIM Inversion: MotionClone menggunakan DDIM Inversion untuk menyongsangkan video rujukan input ke dalam ruang terpendam untuk melaksanakan pengekstrakan komponen utama perhatian sementara bagi video rujukan.
Peringkat bimbingan: Semasa setiap denoising, MotionClone pada masa yang sama memperkenalkan panduan gerakan perhatian temporal komponen utama dan panduan maklumat semantik spatial, yang bekerjasama untuk menyediakan gerakan komprehensif dan panduan semantik untuk penjanaan video yang boleh dikawal.
Topeng Gaussian: Dalam mekanisme bimbingan semantik spatial, fungsi kernel Gaussian digunakan untuk mengaburkan topeng perhatian silang untuk menghapuskan pengaruh maklumat struktur yang berpotensi.
30 video daripada set data DAVIS telah digunakan untuk ujian. Keputusan eksperimen menunjukkan bahawa MotionClone telah mencapai peningkatan yang ketara dalam kesesuaian teks, ketekalan masa dan penunjuk tinjauan pengguna berbilang, mengatasi kaedah pemindahan gerakan sebelumnya. Keputusan khusus ditunjukkan dalam jadual di bawah.
Perbandingan hasil penjanaan MotionClone dan kaedah migrasi gerakan sedia ada ditunjukkan dalam rajah di bawah. Dapat dilihat bahawa MotionClone mempunyai prestasi yang terkemuka.
Ringkasnya, MotionClone ialah rangka kerja pemindahan gerakan baharu yang boleh mengklon gerakan secara berkesan dalam video rujukan kepada adegan baharu yang ditentukan oleh kata gesaan yang diberikan pengguna tanpa latihan atau penalaan halus penyelesaian penyesuaian gerakan untuk model video Vincent sedia ada.
MotionClone memperkenalkan panduan maklumat gerakan komponen utama yang cekap dan panduan semantik spatial atas dasar mengekalkan kualiti penjanaan model asas sedia ada, yang meningkatkan konsistensi gerakan dengan video rujukan dengan ketara sambil memastikan keupayaan penjajaran semantik dengan teks mencapai penjanaan video berkualiti tinggi dan boleh dikawal.
Selain itu, MotionClone boleh menyesuaikan secara langsung kepada model komuniti yang kaya untuk mencapai penjanaan video yang pelbagai, dan mempunyai kebolehskalaan yang sangat tinggi.
Atas ialah kandungan terperinci MotionClone: Tiada latihan diperlukan, pengklonan satu klik pergerakan video. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri

Cakar mekanikal pertama! Yuanluobao muncul di Persidangan Robot Dunia 2024 dan mengeluarkan robot catur pertama yang boleh memasuki rumah

Pada Persidangan Robot Sedunia, robot domestik yang membawa 'harapan penjagaan warga tua masa depan' ini telah dikepung

Pasukan Li Feifei mencadangkan ReKep untuk memberi robot kecerdasan spatial dan mengintegrasikan GPT-4o

Anugerah ACL 2024 Diumumkan: Salah satu Kertas Terbaik mengenai Pentafsiran Oracle oleh HuaTech, Anugerah Ujian Masa GloVe

Hongmeng Smart Travel S9 dan persidangan pelancaran produk baharu senario penuh, beberapa produk baharu blockbuster dikeluarkan bersama-sama

Model UI besar pertama di China dikeluarkan! Model besar Motiff mencipta pembantu terbaik untuk pereka bentuk dan mengoptimumkan aliran kerja reka bentuk UI
