Selepas kemunculan aplikasi AI Stable Diffusion, ia cepat menjadi popular dalam tempoh yang sangat singkat dan menjadi alat generasi "wanita tercantik" yang diturunkan oleh ramai pemain dari mulut ke mulut. Walau bagaimanapun, apabila alat lukisan pengkomputeran AI ini dilancarkan secara rasmi oleh Stable Diffusion, kedua-dua penggunaan UI WEB dan latihan serta penjanaan model pada asasnya berdasarkan algoritma dipercepatkan NVIDIA CUDA, jadi kad A tidak disokong secara rasmi oleh Stable Penyebaran pada mulanya. Nasib baik, Stable Diffusion ialah produk sumber terbuka Dengan sokongan ramai pemain komuniti, banyak cawangan telah muncul yang menyokong pengkomputeran dipercepatkan GPU A-kad Contohnya, penggunaan berasaskan DirectML yang akan kami uji hari ini boleh melaksanakan grafik AMD Radeon kad. Stable Diffusion AI pengkomputeran pecutan.
Jika anda ingin menggunakan Stable Diffusion berasaskan DirectML secara tempatan, ia adalah lebih rumit daripada penggunaan UI WEB berasaskan CUDA yang mudah Namun, sudah ada pakej penyepaduan yang agak matang dalam talian untuk digunakan oleh pemain sahaja Pakej integrasi yang sepadan boleh merealisasikan pemasangan dan penggunaan kalis bodoh tempatan dengan satu klik, yang boleh menjimatkan banyak masa semua orang.
▲Selepas pakej penyepaduan yang kami pilih untuk ujian dipasang, ia secara automatik memasuki mod pengkomputeran dipercepatkan GPU AMD Buka http://127.0.0.1:7860 secara tempatan untuk membuka antara muka lukisan AI Stable Diffusion tempatan.
▲Anda boleh menetapkan parameter penjanaan lukisan seni AI yang berkaitan secara bebas pada antara muka UI WEB tempatan, klik "Jana" untuk mula melukis. Sila rujuk tutorial dalam talian yang berkaitan untuk mendapatkan butiran, kami tidak akan pergi ke butiran di sini.
Jadi, bolehkah cawangan penggunaan Stable Diffusion berdasarkan DirectML melaksanakan sokongan pecutan pengkomputeran perkakasan untuk kad grafik AMD? Sejauh manakah ia cekap? Pada masa lalu, pemain A-kad hanya boleh menjalankan Stable Diffusion di bawah sistem Linux dan mensimulasikan pecutan CUDA melalui ROCM (Radeon Open Compute Now, bolehkah pengiraan dipercepatkan AI bagi kad A dilaksanakan secara langsung di bawah sistem Windows). ? Bolehkah kita mencapai matlamat yang diharapkan? Untuk tujuan ini, kami memilih beberapa kad grafik siri AMD Radeon RX 5000, siri RX 6000 dan siri RX 7000 dan menjalankan pengalaman terperinci.
Platform Pengalaman
Kad grafik: AMD Radeon RX 5500XT (8GB), RX 5700 (8GB), RX 6500XT 4GB, RX 6600 (8GB), RX 6700XT (12GB), RX 6750XT (12GB), RX 6800X (169GB) ( 16GB), RX 7900 XT(20GB), RX 7900 XTX(24GB)
CPU: Intel Core i9-13900K
Papan induk: Intel Z790
Memori: DDR5 6000 16GB×2
SSD: AORUS NVMe PCIe SSD 2TB
Sistem pengendalian: Windows 11 Pro 22H2
Pemandu: AMD Software Adrenalin Edition 23.4.3
Dengan menguji, kami ingin tahu:
Apakah perbezaan dalam kuasa pengkomputeran lukisan AI bagi Stable Diffusion antara siri AMD Radeon 5000, siri 6000 dan siri 7000?
Berbanding dengan pecutan pengkomputeran AI CPU tradisional, bagaimanakah prestasi pecutan AMD GPU?
▲Penyelesaian penggunaan perkongsian sumber terbuka rangkaian yang kami pakai boleh melaksanakan pengiraan dipercepatkan perkakasan kad grafik AMD dengan betul Anda dapat melihat bahawa kadar penghunian GPU kekal pada 100% semasa proses penjanaan imej.
Modelnya ialah Novel AI Final-runed (CKPT)
Dalam bahagian pertama ujian, kami menggunakan kata kunci untuk menjana seorang wanita yang bergaya dan cantik dengan mata yang besar dan deria foto tertentu. Tetapan kata kunci adalah seperti berikut (ada yang dipetik daripada kata kunci kongsi sumber terbuka di Internet):
lora:koreanDollLikeness_v15:0.6> , kualiti terbaik, resolusi ultra tinggi, (fotorealistik:1.4), 1wanita, baju butang putih tanpa lengan, skirt hitam, choker hitam, comel, (aegyo sal:1) , (rambut perang platinum:1), ((mata bengkak)), memandang penonton, badan penuh, menghadap ke hadapan, fesyen, premium
Tetapan peleraian: 512×512
Langkah pensampelan: 20
Pekali bimbingan perkataan gesaan: 7
Jana kumpulan - kuantiti setiap kumpulan: 1-1, 4-1
Semasa ujian, memandangkan kebanyakan kad grafik mempunyai lebih daripada 8GB memori video, kami pada asasnya menetapkan mod lalai video tinggi biasa dalam parameter pengendalian Hanya versi memori video 4GB RX 6500XT ditambah --lowvram semasa dijalankan. mod berjalan memori rendah (jika tidak, ia tidak akan berfungsi). Berdasarkan keputusan ujian keseluruhan, kad grafik AMD daripada siri Radeon RX 5000 hingga siri RX 7000 hampir kesemuanya telah mencapai prestasi pecutan pengkomputeran AI bagi aplikasi Stable Diffusion, khususnya, prestasi kad grafik siri Radeon RX 7000 adalah lebih baik daripada kad grafik siri RX 6000. Peningkatan yang besar. Sebagai contoh, kadar penjanaan imej RX 6900XT di bawah tetapan dan algoritma model ini adalah kira-kira 8.87 gambar/saat, manakala RX 7900 XT boleh mencapai 15.76 gambar/saat, peningkatan prestasi hampir 100%.
Berbanding dengan CPU, semua kad grafik AMD mempunyai kelebihan yang sangat jelas Prestasi RX 7900 XT adalah kira-kira 30 kali ganda daripada Core i9-13900K Malah kad grafik peringkat permulaan RX 5500XT daripada dua generasi pertama mempunyai prestasi Ia juga hampir 5 kali ganda berbanding Core i9-13900K.
Satu-satunya perkara yang agak tidak normal ialah RX 6500XT Mengikut spesifikasi teras, ia sepatutnya lebih kuat daripada RX 5500XT Namun, kerana konfigurasi memori video hanya 4GB, selepas menghidupkan memori video yang rendah mod dalam ujian, imej yang dijana Kelajuan sangat terjejas, jauh di bawah prestasi biasa pecutan GPU, dan hanya boleh mencapai tahap lebih tinggi sedikit daripada pengkomputeran CPU.
Dalam ujian seterusnya, kami menggunakan satu siri kata kunci yang agak kompleks untuk menjana vila di tepi air, bersama-sama dengan keperluan untuk kesan seperti cahaya matahari, riak dan pantulan. Kata kunci adalah seperti berikut:
'lukisan cantik rumah gaya Tudor berhampiran air pada waktu matahari terbenam, hutan fantasi fotorealistik, komposisi sinematik, perincian tinggi sinematik, pencahayaan sinematik ultra realistik, Depth of Field, sangat terperinci, berkod warna yang cantik, 8k, '
Tetapan peleraian: 512×512
Langkah pensampelan: 50
Pekali panduan perkataan gesaan: 7.5
Jana kumpulan - kuantiti setiap kumpulan: 1-1, 2-1, 4-1
Keputusan ujian bahagian ini pada asasnya konsisten dengan ujian sebelumnya. Kad grafik siri RX 7000 masih mendominasi dari segi prestasi Berbanding dengan kad grafik siri RX 6000, peningkatan prestasi adalah kira-kira 100%. . Prestasi RX 7900 XT mencapai Prestasi kad grafik peringkat permulaan RX 5500XT hampir 5 kali ganda daripada Core i9-13900K.
Memandangkan konfigurasi memori video 4GB RX 6500XT hanya boleh dijalankan dalam mod memori video rendah, kelajuan penjanaan imej masih sangat terjejas, yang jauh lebih rendah daripada prestasi biasa pecutan GPU dan secara kasarnya bersamaan dengan Core i9-13900K .
Ini adalah ujian yang mudah tetapi menarik melalui pengalaman ini, kami berpendapat terdapat beberapa titik rujukan yang boleh diringkaskan untuk dirujuk oleh pemain:
1. Pada masa ini, kad grafik AMD boleh mencapai pecutan pengkomputeran Stable Diffusion AI di bawah sistem Windows melalui penyelesaian penggunaan sumber terbuka, dan terdapat juga banyak pakej penyepaduan yang tidak mudah difahami oleh pemain yang berminat boleh mencubanya
2. Berdasarkan keputusan ujian, kad grafik AMD boleh mencapai peningkatan prestasi yang jauh lebih baik daripada pengiraan CPU dalam pengiraan penjanaan imej AI Stable Diffusion Menggunakan GPU untuk mempercepatkan pengiraan boleh membawa hasil dua kali ganda dengan
3. Berdasarkan situasi ujian, apabila resolusi pemaparan ditetapkan kepada melebihi 512 (seperti 768×768), memori video akan melebihi Ini mempunyai perhubungan tertentu dengan pelan penempatan dan model, tetapi ia juga mencerminkan Apabila berjalan dalam mod biasa, memori video 8GB hampir merupakan keperluan kemasukan yang sukar untuk Resapan Stabil. Jika ingatan video kurang daripada 8GB, walaupun semasa memaparkan pada resolusi 512×512, memori video akan menjadi tidak mencukupi Pada masa ini, anda perlu menggunakan penyelesaian berjalan memori video rendah --lowvram, tetapi ia akan menjadi sangat perlahan menurunkan kelajuan pengiraan, seperti dalam ujian RX 6500XT 4GB. Oleh itu, jika anda ingin bermain Stable Diffusion dengan lancar, kami mengesyorkan agar kad grafik mempunyai memori video 8GB atau lebih tinggi
4. Berdasarkan hasil keseluruhan, kami percaya bahawa GPU AMD masih mempunyai ruang yang besar untuk pengoptimuman algoritma, berdasarkan pengalaman yang tidak boleh dipercayai, jurang prestasi dari RX 7900 XTX hingga Core i9-13900K tidak cukup besar. Ini ada kaitan dengan penyelesaian algoritma dan model yang kami gunakan Kami juga berharap pengaturcara dalam pelbagai komuniti boleh membangunkan lebih banyak penyelesaian pecutan pengkomputeran untuk kad grafik AMD.
Tidak kira apa pun, prestasi pengkomputeran dipercepatkan perkakasan kad grafik AMD untuk Stable Diffusion telah ditunjukkan, dan kesannya sudah pasti ia adalah berita baik untuk pengguna kad grafik AMD untuk bertahan Sudah tiba masanya untuk meneruskan ke arah pengoptimuman.
Atas ialah kandungan terperinci Kad grafik AMD Radeon Ujian pengalaman lukisan Stable Diffusion AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!