masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

Rumah > Peranti teknologi > AI > Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari

Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari

王林

Lepaskan： 2024-07-17 01:56:08

asal

408 orang telah melayarinya

Ia juga merupakan video Tusheng, tetapi PaintsUndo telah mengambil laluan yang berbeza.

Pengarang ControlNet Lvmin Zhang mula hidup semula! Kali ini saya menyasarkan bidang lukisan.

Projek baharu PaintsUndo telah menerima 1.4k bintang (masih meningkat gila) tidak lama selepas ia dilancarkan.

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

Alamat projek: https://github.com/lllyasviel/Paints-UNDO

Melalui projek ini, pengguna memasukkan imej statik dan PaintsUndo secara automatik boleh membantu anda menjana video keseluruhan proses lukisan, bermula dari baris Terdapat kesan untuk mengikuti dari draf kepada produk siap.

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

Semasa proses lukisan, perubahan garisan adalah menakjubkan. PaintsUndo mula-mula menggunakan garisan ringkas untuk menggariskan badan utama watak, kemudian melukis latar belakang, menggunakan warna, dan akhirnya memperhalusinya agar menyerupai imej asal.

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

PaintsUndo tidak terhad kepada satu gaya imej Untuk jenis imej yang berbeza, ia juga akan menghasilkan video proses lukisan yang sepadan.

Corgi yang memakai tudung kelihatan perlahan-lahan ke kejauhan:

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

Pengguna juga boleh memasukkan satu imej dan mengeluarkan berbilang video:

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

Walau bagaimanapun, terdapat juga kekurangan, tetapi terdapat juga kekurangan, seperti yang terdapat dalam lukisan. dengan gubahan yang kompleks, dan penulis berkata projek itu masih diperhalusi.

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

Sebab mengapa PaintsUndo begitu berkuasa ialah ia disokong oleh satu siri model yang mengambil imej sebagai input dan kemudian mengeluarkan jujukan lukisan imej. Model ini mereplikasi pelbagai tindakan manusia, termasuk tetapi tidak terhad kepada lakaran, dakwat, lorekan, lorekan, transformasi, selak kiri dan kanan, pelarasan lengkung warna, menukar keterlihatan lapisan, dan juga mengubah idea keseluruhan semasa proses lukisan. .

Proses penggunaan tempatan adalah sangat mudah dan boleh dilengkapkan dengan beberapa baris kod: ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

git clone https://github.com/lllyasviel/Paints-UNDO.gitcd Paints-UNDOconda create -n paints_undo python=3.10conda activate paints_undopip install xformerspip install -r requirements.txtpython gradio_app.py

Salin selepas log masuk

Pengenalan model

Pengarang projek menggunakan 24GB VRAM pada Nvidia 4090 dan 3090TI untuk ujian inferens. Pengarang menganggarkan bahawa dengan pengoptimuman yang melampau (termasuk pemunggahan berat dan pemotongan perhatian) keperluan VRAM minimum teori ialah sekitar 10-12.5 GB. PaintsUndo menjangka untuk memproses imej dalam masa kira-kira 5 hingga 10 minit, bergantung pada tetapan, biasanya menghasilkan video 25 saat pada resolusi 320x512, 512x320, 384x448 atau 448x384.

Pada masa ini, projek itu telah mengeluarkan dua model: model bingkai tunggal paints_undo_single_frame dan model berbilang bingkai paints_undo_multi_frame.

Model bingkai tunggal menggunakan seni bina SD1.5 yang diubah suai, mengambil imej dan langkah operasi sebagai input dan output imej. Dengan mengandaikan bahawa karya seni biasanya memerlukan 1000 operasi manual untuk mencipta (contohnya, satu lejang ialah satu operasi), maka saiz langkah operasi ialah integer antara 0-999. Nombor 0 ialah karya seni siap akhir dan nombor 999 ialah lejang pertama yang dilukis pada kanvas putih tulen.

Model berbilang bingkai adalah berdasarkan siri model VideoCrafter, tetapi tidak menggunakan lvdm Crafter asal, dan semua kod latihan/inferens dilaksanakan sepenuhnya dari awal. Pengarang projek membuat banyak pengubahsuaian pada topologi rangkaian saraf, dan selepas latihan yang meluas, rangkaian saraf berkelakuan sangat berbeza daripada Crafter asal.

Seni bina keseluruhan model berbilang bingkai adalah serupa dengan Crafter, termasuk 5 komponen: 3D-UNet, VAE, CLIP, CLIP-Vision dan Tayangan Imej.

Model berbilang bingkai mengambil dua imej sebagai input dan mengeluarkan 16 bingkai perantaraan antara dua imej input. Model berbilang bingkai mempunyai hasil yang lebih konsisten daripada model bingkai tunggal, tetapi juga jauh lebih perlahan, kurang "kreatif" dan terhad kepada 16 bingkai.

PaintsUndo menggunakan model bingkai tunggal dan berbilang bingkai bersama-sama secara lalai. Pertama, model bingkai tunggal akan digunakan untuk membuat kesimpulan kira-kira 5-7 kali untuk mendapatkan 5-7 "bingkai kunci", dan kemudian model berbilang bingkai akan digunakan untuk "menginterpolasi" bingkai utama ini, dan akhirnya bingkai yang agak panjang. video akan dihasilkan.

^{Pautan rujukan: https://lllyasviel.github.io/pages/paints_undo/}

Atas ialah kandungan terperinci Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan：

projek

sumber：jiqizhixin.com

Artikel sebelumnya：Cara Mengesan Aplikasi ChatGPT Palsu di Apple App Store Artikel seterusnya：CTO Moka Liu Hongze: Dalam era model besar, organisasi dan struktur bakat akan membawa perubahan baharu

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

Cipta Masa Depan: Pengaturcaraan Java untuk Pemula Mutlak

2024-10-13 13:32:21
Anda Tidak Sendiri: Kuasai Python dengan Komuniti Menyokong di Sisi Anda

2024-10-12 11:58:51
Daripada Novis kepada Coder: Manfaatkan Kuasa Pengaturcaraan Python

2024-10-11 20:06:51
Think Like a Programmer: Belajar Asas Java

2024-10-11 18:59:31
Java Made Simple: Panduan Pemula untuk Kuasa Pengaturcaraan

2024-10-11 18:30:51
Bina Blog dengan PHP: Projek Mesra Permulaan

2024-10-11 15:51:51
Cakap Bahasa Sistem: Belajar C, Satu Baris pada Satu Masa

2024-10-11 15:42:10
Struktur Data dan Algoritma dalam C: Pendekatan Mesra Permulaan

2024-10-11 14:41:20
Pengekodan Tanpa Air Mata: Belajar C dengan Cara Mudah

2024-10-11 14:08:31
Analisis Data dengan Java: Panduan Pemula untuk Memproses Maklumat

2024-10-11 13:42:21

Isu terkini

Apakah format pembolehubah dalam nilai pulangan? Saya seorang pelajar baru php. Saya menjumpai sekeping kod: if($x<time()){return[false,...

daripada 2024-04-06 21:55:20

0

1

778

Halaman tiba-tiba tidak dapat menarik css atau bootstrap Jadi saya sedang membangunkan halaman, saya telah membuat sebahagian daripadanya semalam d...

daripada 2024-04-06 21:58:04

0

1

800

Pemeriksa Sudoku tidak berfungsi? Bolehkah sesiapa membantu saya mengenal pasti ralat? Saya mencuba segala-galanya pada editor dalam talian tetapi masih mendapat ralat. Tetapi a...

daripada 2024-04-06 21:21:07

0

1

474

Ubah suai gaya CSS sebaris secara dinamik dalam Javafx Saya cuba menukar imej latar belakang anak tetingkap apabila aplikasi dimaksimumkan. Latar...

daripada 2024-04-06 20:57:16

0

1

487

Apakah amalan terbaik untuk memaparkan maklumat versi dalam aplikasi web? Saya sedang membangunkan aplikasi web. Apakah amalan terbaik untuk memaparkan maklumat ver...

daripada 2024-04-06 19:13:16

0

2

476

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan