"Berita dari tapak ini pada 25 April, EMO (Emote Portrait Alive) ialah rangka kerja yang dibangunkan oleh Institut Penyelidikan Pengkomputeran Pintar Kumpulan Alibaba, sistem penjanaan video potret AI dipacu audio yang boleh memasukkan satu imej rujukan dan audio suara , menjana video dengan ekspresi muka ekspresif dan pelbagai postur kepala.”
Alibaba Cloud hari ini mengumumkan bahawa EMO, model AI yang dibangunkan melalui makmal, dilancarkan secara rasmi pada apl umum dan terbuka kepada semua pengguna secara percuma. Dengan fungsi ini, pengguna boleh memilih templat daripada lagu, meme hangat dan emotikon, dan kemudian memuat naik foto potret untuk membolehkan EMO mensintesis video nyanyian.
Menurut pengenalan, Tongyi App telah melancarkan lebih daripada 80 templat EMO dalam kumpulan pertama, termasuk lagu popular "Shangchunshan", "Wild Wolf Disco", dll., serta meme hangat Internet "Bobo Chicken" dan "Backhand" "Draw" dsb., tetapi audio tersuai tidak tersedia buat masa ini.
Laman web ini dilampirkan pada laman web rasmi EMO:
Laman utama projek rasmi: https://humanaigc.github.io/emote-portrait-alive/
kertas penyelidikan: arXiv /arxiv.org/abs/2402.17485
GitHub:https://github.com/HumanAIGC/EMO(Model dan kod sumber menjadi sumber terbuka)
Atas ialah kandungan terperinci Alibaba Cloud mengumumkan pelancaran model EMO yang dibangunkan sendiri pada Apl Tongyi, yang menggunakan foto + audio untuk menjana video nyanyian. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!