Artikel ini dicetak semula dengan kebenaran AI New Media Qubit (ID akaun awam: QbitAI Sila hubungi sumber untuk mencetak semula).
Google telah melancarkan "Pengarah AI" baharu, yang malah boleh menukar protagonis video dalam satu ayat .
Lihat, seekor beruang kecil sedang menari di atas rumput hijau.
Adakah semua beruang hari ini begitu artistik? ?
Tidak, Tidak, Tidak! Apa yang pada asalnya di atas rumput sebenarnya adalah monyet.
Untuk menukar daripada monyet kepada beruang, cuma katakan kepada AI ini:
Beruang kecil melompat mengikut rentak muzik Menari, memusingkan seluruh badannya. (Seekor beruang menari dan melompat mengikut muzik ceria, menggerakkan seluruh badannya)
Selain video "mengubah suai secara ajaib", AI bernama Dreamix ini juga boleh Menjadi statik gambar menjadi animasi - Ia boleh dilakukan dalam satu ayat sahaja.
Sebagai contoh, tunjukkan AI ini "foto berenang penyu" dan beritahunya:
Seekor penyu telah difoto sedang berenang di bawah air, dan seekor jerung menghampiri dari belakang. (Pukulan bawah air penyu laut dengan jerung mendekati dari belakang)
Orang yang baik, satu ayat bukan sahaja membuat berenang penyu Bangun dan menambah seekor jerung daripada udara nipis.
Kesan ini telah menarik ramai penonton untuk menyukainya.
Malah ada yang menegaskan bahawa AIGC akan terus mencetuskan kegilaan dalam tempoh dua tahun akan datang, malah lebih gila daripada pembangunan semasa milenium.
Ia akan dipuji sebaik sahaja ia dikeluarkan. Anda juga boleh melihat lebih banyak karya "pengarah" beliau untuk merasainya.
Pertama sekali, dari segi menukar aksara video, ini ialah medan asal:
Ini ialah medan AI A yang dibakar:
Ini adalah tulisan tangan manusia:
Ini ialah tulisan tangan robot yang dihasilkan oleh AI:
Ia juga berdasarkan video tulisan manusia Jika ayat segera digantikan dengan "tangan manusia sedang melukis bulatan", akan ada perbezaan. Kesan penjanaan:
Dan dari segi imej statik bertukar kepada animasi , imej asal ialah hutan berkabus:
AI menambahkan unicorn berlari ke hutan, dan kamera dizum keluar mengikut ayat gesaan.
Ada juga gambar pemandangan lembah sungai ini:
AI bukan sahaja membuat aliran sungai, tetapi juga menambah kerbau mandi ke pantai dan burung terbang ke langit.
Melihat perkara ini, sesetengah orang mungkin merasakan bahawa terdapat kekurangan semangat: animasi telah dibuat, tetapi kualiti imej juga telah banyak dikorbankan.
Kemudian anda juga boleh menunjukkan AI beberapa gambar lagi.
Sebagai contoh, tunjukkan AI 7 foto penggera kebakaran mainan sekaligus:
Kemudian biarkan ia menjana video berdasarkan ayat, Kualiti gambar akan menjadi lebih jelas sekarang.
Mengenai cara "pengarah AI" ini melakukannya, Google mengatakan bahawa kuncinya terletak pada "rakan lama" Model penyebaran (Model Resapan).
Model resapan juga merupakan teras alat lukisan AIGC yang popular DALL·E 2.
Penyelidik Google menegaskan bahawa terdapat AI "video janaan teks" yang serupa sebelum ini, tetapi jika model penyebaran video hanya diperhalusi pada video input, ia akan mengehadkan tahap perubahan gerakan.
Apa yang membezakan AI ini ialah:
Pasukan menggunakan "Sasaran Campuran" , yang selain memperhalusi sasaran asal, set Bingkai juga akan diperhalusi.
Mereka menggunakan mekanisme perhatian khusus dalam pembelajaran mendalam: Masked Temporal Attention, yang membantu model memfokus pada bahagian tertentu maklumat input dan mengabaikan bahagian lain yang tidak berkaitan.
- Ini meningkatkan keupayaan model untuk memproses data jujukan, menjana lebih pelbagai dinamik dalam video dan kesannya lebih semula jadi.
Dengan sokongan model resapan dan Masked Temporal Attention, untuk menukar protagonis video, input sebenarnya ditinggalkan - hanya lakukan Penalaan Halus, kesetiaan keputusannya juga cukup bagus.
Atas ialah kandungan terperinci Keajaiban 'Pengarah AI' baharu Google ialah ia boleh menukar protagonis video dengan hanya satu ayat, yang menakjubkan, dan kualiti gambar juga sangat baik.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!