Jadual Kandungan
Penyelesaian penyesuaian penuh daripada LoRA, ControlNet, T2I-Adapter kepada peresap
Rumah Peranti teknologi AI Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Apr 12, 2023 pm 06:16 PM
membangun kod

Tidak lama selepas ChatGPT keluar dari kalangan, kemunculan ControlNet dengan cepat mendapat ramai pembangun dan pengguna biasa di Internet Inggeris dan Cina Malah ada pengguna yang mempromosikan bahawa kemunculan ControlNet membawa penciptaan AI ke era berjalan tegak. Tidak keterlaluan untuk mengatakan bahawa, termasuk ControlNet, T2I-Adapter, Composer, dan teknik latihan LoRA dalam tempoh yang sama, penjanaan terkawal, sebagai tembok tinggi terakhir penciptaan AI, berkemungkinan besar akan mendapat kejayaan selanjutnya dalam masa yang boleh dijangka. , dengan itu sangat Mengurangkan kos penciptaan pengguna dan meningkatkan kebolehmainan ciptaan. Hanya dalam dua minggu sejak ControlNet menjadi sumber terbuka, bilangan Star rasminya telah melebihi 10,000 Populariti ini sudah pasti tidak pernah berlaku sebelum ini.

Pada masa yang sama, komuniti sumber terbuka juga telah banyak menurunkan ambang untuk pengguna Contohnya, platform Muka Memeluk menyediakan berat model asas dan peresap rangka kerja model am, stabil-. diffusion-webui Platform Demo yang lengkap telah dibangunkan, dan Civitai telah menyumbangkan sejumlah besar pemberat LoRA yang digayakan.

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Walaupun webui kini paling popular The alat visualisasi telah cepat menyokong pelbagai model generatif yang dilancarkan baru-baru ini dan menyokong banyak pilihan untuk ditetapkan oleh pengguna. Kerana ia memberi tumpuan kepada kemudahan penggunaan antara muka hadapan, struktur kod di belakangnya sebenarnya sangat kompleks dan tidak cukup mesra untuk pembangun. Contohnya, walaupun webui menyokong pelbagai jenis pemuatan dan inferens, ia tidak boleh menyokong penukaran di bawah rangka kerja yang berbeza, dan juga tidak boleh menyokong latihan model yang fleksibel. Dalam perbincangan komuniti, kami menemui banyak perkara yang menyakitkan yang masih belum diselesaikan oleh kod sumber terbuka sedia ada.

Pertama sekali, rangka kerja kod tidak serasi Model popular pada masa ini, seperti ControlNet dan T2I-Adapter, tidak serasi dengan penyebar perpustakaan latihan Stable Diffusion arus perdana tidak serasi, model pra-latihan ControlNet tidak boleh digunakan secara langsung dalam rangka kerja penyebar.

Kedua, pemuatan model adalah terhad Pada masa ini, model disimpan dalam pelbagai format, seperti .bin, .ckpt, .pth , .satetensors, dsb. , sebagai tambahan kepada webui, rangka kerja peresap pada masa ini mempunyai sokongan terhad untuk format model ini Memandangkan kebanyakan model LoRA disimpan terutamanya dalam safetensors, adalah sukar bagi pengguna untuk memuatkan model LoRA secara langsung ke dalam model sedia ada yang dilatih. pada rangka kerja peresap.

Ketiga, Model asas adalah terhad Pada masa ini, ControlNet dan T2I-Adapter dilatih berdasarkan Stable-Diffusion-1.5, dan. hanya Berat model di bawah SD1.5 adalah sumber terbuka Memandangkan senario tertentu, model animasi berkualiti tinggi seperti apa-v4 dan ChilloutMix sudah wujud Walaupun maklumat yang boleh dikawal diperkenalkan, hasil akhir yang dihasilkan masih terhad oleh keupayaan UNet dalam SD1.5.

Akhir sekali, latihan model adalah terhad Pada masa ini, LoRA telah disahkan secara meluas sebagai salah satu kaedah yang paling berkesan untuk pemindahan gaya dan mengekalkan IP imej tertentu 1. Walau bagaimanapun, rangka kerja penyebar pada masa ini hanya menyokong pembenaman LoRA UNet dan tidak boleh menyokong pembenaman pengekod teks, yang akan mengehadkan latihan LoRA.

Selepas berbincang dengan komuniti sumber terbuka, kami mengetahui bahawa rangka kerja penyebar, sebagai asas kod umum, sedang merancang untuk menyesuaikan diri dengan model generasi yang dilancarkan baru-baru ini kerana ia melibatkan penulisan semula banyak asas; antara muka, ia masih Ia akan mengambil sedikit masa untuk dikemas kini. Untuk tujuan ini, kami bermula daripada masalah sebenar di atas dan menerajui dalam mencadangkan penyelesaian yang dibangunkan sendiri untuk setiap masalah untuk membantu pembangun membangun dengan lebih mudah dengan cepat.

Penyelesaian penyesuaian penuh daripada LoRA, ControlNet, T2I-Adapter kepada peresap

LoRA untuk peresap

Penyelesaian ini adalah untuk membenamkan pemberat LoRA secara fleksibel dalam pelbagai format dalam rangka kerja peresap, iaitu model yang disimpan berdasarkan latihan peresap. Memandangkan latihan LoRA biasanya membekukan model asas, ia boleh disematkan dengan mudah ke dalam model sedia ada sebagai modul boleh pasang sebagai gaya atau kekangan bersyarat IP. LoRA sendiri ialah teknik latihan am Prinsip asasnya ialah melalui penguraian peringkat rendah, bilangan parameter modul boleh dikurangkan dengan banyaknya Pada masa ini, dalam penjanaan imej, ia biasanya digunakan untuk melatih modul boleh pasang yang bebas daripada model asas , kegunaan sebenar adalah untuk menggabungkannya dengan keluaran model asas dalam bentuk sisa.

Pertama ialah pembenaman pemberat LoRA Pada masa ini, pemberat yang disediakan pada platform Civitai terutamanya disimpan dalam format ckpt atau safetensors, dibahagikan kepada dua situasi berikut.

(1) Model penuh (model asas + modul LoRA)

Jika model penuh dalam format safetensors, ia boleh ditukar dengan skrip peresap berikut

python ./scripts/convert_original_stable_diffusion_to_diffusers.py --checkpoint_path xxx.safetensors--dump_path save_dir --from_safetensors
Salin selepas log masuk

Jika model penuh dalam format ckpt, ia boleh ditukar melalui skrip peresap berikut

python ./scripts/convert_original_stable_diffusion_to_diffusers.py --checkpoint_path xxx.ckpt--dump_path save_dir
Salin selepas log masuk

Selepas penukaran selesai, peresap boleh digunakan terus API untuk pemuatan model

from diffusers import StableDiffusionPipeline
pipeline = StableDiffusionPipeline.from_pretrained (save_dir,torch_dtype=torch.float32)
Salin selepas log masuk

(2) LoRA sahaja (hanya mengandungi modul LoRA)

Pada masa ini penyebar secara rasmi tidak boleh menyokong pemuatan hanya pemberat LoRA, dan pemberat LoRA pada platform sumber terbuka pada asasnya disimpan dalam borang ini. Pada asasnya, ia melengkapkan pemetaan semula nilai kunci dalam pemberat LoRA dan menyesuaikannya dengan model peresap. Atas sebab ini, kami sendiri menyokong ciri ini dan menyediakan skrip penukaran.

pipeline = StableDiffusionPipeline.from_pretrained (model_id,torch_dtype=torch.float32)
model_path = "onePieceWanoSagaStyle_v2Offset.safetensors"
state_dict = load_file (model_path)
Salin selepas log masuk

Hanya perlu menentukan model dalam format peresap dan pemberat LoRA disimpan dalam format safetensors. Kami menyediakan contoh penukaran.

# the default mergering ratio is 0.75, you can manually set it 
python convert_lora_safetensor_to_diffusers.py
Salin selepas log masuk

Selain itu, LoRA sendiri boleh dilatih dengan cepat dengan data kecil kerana ringan, dan boleh dibenamkan ke dalam rangkaian lain. Untuk tidak terhad kepada pemberat LoRA sedia ada, kami menyokong latihan berbilang modul (pengekod teks+UNet) LoRA dalam rangka kerja peresap dan telah menyerahkan PR dalam pangkalan kod rasmi (https://github.com/ huggingface/diffusers/pull /2479), dan menyokong latihan LoRA dalam ColossalAI.

Kod adalah sumber terbuka di: https://github.com/haofanwang/Lora-for-Diffusers

ControlNet for diffusers

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Penyelesaian ini adalah untuk menyokong penggunaan ControlNet dalam diffusers rangka kerja. Berdasarkan beberapa percubaan komuniti sumber terbuka, kami menyediakan kes penggunaan lengkap ControlNet+Anything-V3, menyokong penggantian model asas daripada SD1.5 asal kepada model anything-v3, supaya ControlNet mempunyai penjanaan animasi yang lebih baik keupayaan.

Selain itu, kami juga menyokong ControlNet+Inpainting dan menyediakan saluran paip yang disesuaikan dengan penyebar,

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

dan Multi-ControlNet untuk kawalan berbilang keadaan.

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Kod adalah sumber terbuka di: https://github.com/haofanwang/ControlNet-for -Penyerap

T2I-Penyesuai untuk peresap

Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular

Sama seperti ControlNet, kami juga menyokong penyesuaian sumber terbuka T2I-Adapter kepada peresap pada masa yang sama.

Kod adalah sumber terbuka di: https://github.com/haofanwang/T2I-Adapter-for-Diffusers

Pada masa ini, ketiga-tiga penyelesaian penyesuaian di atas telah dibuka kepada komuniti, dan telah diiktiraf secara rasmi masing-masing dalam ControlNet dan T2I-Adapter. Mereka juga telah menerima terima kasih daripada pengarang stable-diffusion-webui-colab . Kami sedang mengekalkan perbincangan dengan pegawai penyebar dan akan menyelesaikan penyepaduan penyelesaian di atas ke dalam pangkalan kod rasmi dalam masa terdekat. Anda juga dialu-alukan untuk mencuba kerja kami lebih awal Jika anda mempunyai sebarang pertanyaan, anda boleh terus membangkitkan isu dan kami akan membalas secepat mungkin.

Atas ialah kandungan terperinci Set lengkap tutorial untuk menyesuaikan rangka kerja Peresap ada di sini! Daripada T2I-Adapter kepada ControlNet yang popular. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Empat alat pengaturcaraan berbantukan AI yang disyorkan Empat alat pengaturcaraan berbantukan AI yang disyorkan Apr 22, 2024 pm 05:34 PM

Alat pengaturcaraan berbantukan AI ini telah menemui sejumlah besar alat pengaturcaraan berbantukan AI yang berguna dalam peringkat pembangunan AI yang pesat ini. Alat pengaturcaraan berbantukan AI boleh meningkatkan kecekapan pembangunan, meningkatkan kualiti kod dan mengurangkan kadar pepijat Ia adalah pembantu penting dalam proses pembangunan perisian moden. Hari ini Dayao akan berkongsi dengan anda 4 alat pengaturcaraan berbantukan AI (dan semua menyokong bahasa C# saya harap ia akan membantu semua orang). https://github.com/YSGStudyHards/DotNetGuide1.GitHubCopilotGitHubCopilot ialah pembantu pengekodan AI yang membantu anda menulis kod dengan lebih pantas dan dengan sedikit usaha, supaya anda boleh lebih memfokuskan pada penyelesaian masalah dan kerjasama. Git

Program kod jauh universal GE pada mana-mana peranti Program kod jauh universal GE pada mana-mana peranti Mar 02, 2024 pm 01:58 PM

Jika anda perlu memprogramkan sebarang peranti dari jauh, artikel ini akan membantu anda. Kami akan berkongsi kod jauh universal GE teratas untuk pengaturcaraan sebarang peranti. Apakah alat kawalan jauh GE? GEUniversalRemote ialah alat kawalan jauh yang boleh digunakan untuk mengawal berbilang peranti seperti TV pintar, LG, Vizio, Sony, Blu-ray, DVD, DVR, Roku, AppleTV, pemain media penstriman dan banyak lagi. Alat kawalan jauh GEUniversal datang dalam pelbagai model dengan fungsi dan keupayaan yang berbeza. GEUniversalRemote boleh mengawal sehingga empat peranti. Kod Jauh Universal Teratas untuk Diprogramkan pada Mana-mana Peranti Alat kawalan jauh GE disertakan dengan set kod yang membolehkannya berfungsi dengan peranti yang berbeza. anda boleh

Pengaturcara AI manakah yang terbaik? Terokai potensi Devin, Tongyi Lingma dan ejen SWE Pengaturcara AI manakah yang terbaik? Terokai potensi Devin, Tongyi Lingma dan ejen SWE Apr 07, 2024 am 09:10 AM

Pada 3 Mac 2022, kurang daripada sebulan selepas kelahiran pengaturcara AI pertama di dunia, Devin, pasukan NLP Universiti Princeton membangunkan pengaturcara AI sumber terbuka ejen SWE. Ia memanfaatkan model GPT-4 untuk menyelesaikan isu secara automatik dalam repositori GitHub. Prestasi ejen SWE pada set ujian bangku SWE adalah serupa dengan Devin, mengambil purata 93 saat dan menyelesaikan 12.29% masalah. Dengan berinteraksi dengan terminal khusus, ejen SWE boleh membuka dan mencari kandungan fail, menggunakan semakan sintaks automatik, mengedit baris tertentu dan menulis serta melaksanakan ujian. (Nota: Kandungan di atas adalah sedikit pelarasan bagi kandungan asal, tetapi maklumat utama dalam teks asal dikekalkan dan tidak melebihi had perkataan yang ditentukan.) SWE-A

Ketahui cara membangunkan aplikasi mudah alih menggunakan bahasa Go Ketahui cara membangunkan aplikasi mudah alih menggunakan bahasa Go Mar 28, 2024 pm 10:00 PM

Tutorial aplikasi mudah alih pembangunan bahasa Go Memandangkan pasaran aplikasi mudah alih terus berkembang pesat, semakin ramai pembangun mula meneroka cara menggunakan bahasa Go untuk membangunkan aplikasi mudah alih. Sebagai bahasa pengaturcaraan yang mudah dan cekap, bahasa Go juga telah menunjukkan potensi yang kukuh dalam pembangunan aplikasi mudah alih. Artikel ini akan memperkenalkan secara terperinci cara menggunakan bahasa Go untuk membangunkan aplikasi mudah alih dan melampirkan contoh kod khusus untuk membantu pembaca bermula dengan cepat dan mula membangunkan aplikasi mudah alih mereka sendiri. 1. Persediaan Sebelum memulakan, kita perlu menyediakan persekitaran dan alatan pembangunan. kepala

Cara menggunakan Copilot untuk menjana kod Cara menggunakan Copilot untuk menjana kod Mar 23, 2024 am 10:41 AM

Sebagai seorang pengaturcara, saya teruja dengan alatan yang memudahkan pengalaman pengekodan. Dengan bantuan alat kecerdasan buatan, kami boleh menjana kod demo dan membuat pengubahsuaian yang diperlukan mengikut keperluan. Alat Copilot yang baru diperkenalkan dalam Visual Studio Code membolehkan kami mencipta kod yang dijana AI dengan interaksi sembang bahasa semula jadi. Dengan menerangkan kefungsian, kami dapat memahami dengan lebih baik maksud kod sedia ada. Bagaimana untuk menggunakan Copilot untuk menjana kod? Untuk bermula, kami terlebih dahulu perlu mendapatkan sambungan PowerPlatformTools yang terkini. Untuk mencapai ini, anda perlu pergi ke halaman sambungan, cari "PowerPlatformTool" dan klik butang Pasang

Pengedaran Linux manakah yang terbaik untuk pembangunan Android? Pengedaran Linux manakah yang terbaik untuk pembangunan Android? Mar 14, 2024 pm 12:30 PM

Pembangunan Android ialah kerja yang sibuk dan menarik, dan amat penting untuk memilih pengedaran Linux yang sesuai untuk pembangunan. Di antara banyak pengedaran Linux, yang manakah paling sesuai untuk pembangunan Android? Artikel ini akan meneroka isu ini dari beberapa aspek dan memberikan contoh kod khusus. Mula-mula, mari kita lihat beberapa pengedaran Linux yang popular pada masa ini: Ubuntu, Fedora, Debian, CentOS, dll. Mereka semua mempunyai kelebihan dan ciri tersendiri.

Cipta dan jalankan fail '.a' Linux Cipta dan jalankan fail '.a' Linux Mar 20, 2024 pm 04:46 PM

Bekerja dengan fail dalam sistem pengendalian Linux memerlukan penggunaan pelbagai arahan dan teknik yang membolehkan pembangun mencipta dan melaksanakan fail, kod, program, skrip dan perkara lain dengan cekap. Dalam persekitaran Linux, fail dengan sambungan ".a" mempunyai kepentingan yang besar sebagai perpustakaan statik. Perpustakaan ini memainkan peranan penting dalam pembangunan perisian, membolehkan pembangun mengurus dan berkongsi fungsi biasa dengan cekap merentas berbilang program. Untuk pembangunan perisian yang berkesan dalam persekitaran Linux, adalah penting untuk memahami cara mencipta dan menjalankan fail ".a". Artikel ini akan memperkenalkan cara memasang dan mengkonfigurasi fail ".a" Linux secara menyeluruh Mari kita terokai definisi, tujuan, struktur dan kaedah mencipta dan melaksanakan fail ".a" Linux. Apa itu L

Universiti Tsinghua dan sumber terbuka Zhipu AI GLM-4: melancarkan revolusi baharu dalam pemprosesan bahasa semula jadi Universiti Tsinghua dan sumber terbuka Zhipu AI GLM-4: melancarkan revolusi baharu dalam pemprosesan bahasa semula jadi Jun 12, 2024 pm 08:38 PM

Sejak pelancaran ChatGLM-6B pada 14 Mac 2023, model siri GLM telah mendapat perhatian dan pengiktirafan yang meluas. Terutama selepas ChatGLM3-6B menjadi sumber terbuka, pembangun penuh dengan jangkaan untuk model generasi keempat yang dilancarkan oleh Zhipu AI. Jangkaan ini akhirnya telah berpuas hati sepenuhnya dengan keluaran GLM-4-9B. Kelahiran GLM-4-9B Untuk memberikan model kecil (10B dan ke bawah) keupayaan yang lebih berkuasa, pasukan teknikal GLM melancarkan model sumber terbuka siri GLM generasi keempat baharu ini: GLM-4-9B selepas hampir setengah tahun penerokaan. Model ini sangat memampatkan saiz model sambil memastikan ketepatan, dan mempunyai kelajuan inferens yang lebih pantas dan kecekapan yang lebih tinggi. Penerokaan pasukan teknikal GLM tidak

See all articles