Après l'émergence de l'application d'IA Stable Diffusion, elle est rapidement devenue populaire en très peu de temps et est devenue l'outil de génération de « plus belle dame » transmis de bouche à oreille par de nombreux joueurs. Cependant, lorsque cet outil de dessin informatique IA a été officiellement lancé par Stable Diffusion, le déploiement de l'interface utilisateur WEB ainsi que la formation et la génération du modèle étaient essentiellement basés sur l'algorithme accéléré NVIDIA CUDA, de sorte que la carte A n'était pas officiellement prise en charge par Stable. Diffusion dans un premier temps. Heureusement, Stable Diffusion est un produit open source. Avec le soutien de nombreux acteurs de la communauté, de nombreuses branches ont émergé prenant en charge le calcul accéléré par GPU A-card. Par exemple, le déploiement basé sur DirectML que nous allons tester aujourd'hui peut implémenter les graphiques AMD Radeon. cartes. Accélération matérielle informatique Stable Diffusion AI.
Si vous souhaitez déployer localement Stable Diffusion basé sur DirectML, c'est relativement plus compliqué que le déploiement pratique de l'interface utilisateur WEB basé sur CUDA. Cependant, il existe déjà des packages d'intégration en ligne relativement matures que les joueurs doivent simplement télécharger le correspondant. Le package d'intégration permet une installation et un déploiement locaux infaillibles en un seul clic, ce qui peut faire gagner beaucoup de temps à chacun.
▲Une fois le package d'intégration que nous avons choisi pour les tests installé, il entre automatiquement en mode de calcul accéléré par AMD GPU. Ouvrez http://127.0.0.1:7860 localement pour ouvrir l'interface de dessin Stable Diffusion AI locale.
▲Vous pouvez définir librement les paramètres de génération de dessins artistiques IA pertinents sur l'interface WEB locale de l'interface utilisateur, cliquez sur « Générer » pour commencer à dessiner. Veuillez vous référer aux didacticiels en ligne pertinents pour plus de détails, nous n'entrerons pas dans les détails ici.
Alors, la branche de déploiement Stable Diffusion basée sur DirectML peut-elle implémenter la prise en charge de l'accélération matérielle informatique pour les cartes graphiques AMD ? Quelle est son efficacité ? Dans le passé, les joueurs de carte A ne pouvaient exécuter Stable Diffusion que sous le système Linux et simuler l'accélération CUDA via ROCM (Radeon Open Compute). Désormais, le calcul accéléré par l'IA de la carte A peut-il être directement implémenté sous le système Windows. ? Pouvons-nous atteindre nos objectifs attendus ? À cette fin, nous avons sélectionné plusieurs cartes graphiques AMD Radeon RX 5000, RX 6000 et RX 7000 et mené une expérience détaillée.
Plateforme d'expérience
Carte graphique : AMD Radeon RX 5500XT (8 Go), RX 5700 (8 Go), RX 6500XT 4 Go, RX 6600 (8 Go), RX 6700XT (12 Go), RX 6750XT (12 Go), RX 6800 (16 Go), RX 6900XT (16 Go). ), RX 7900 XT (20 Go), RX 7900 XTX (24 Go)
CPU : Intel Core i9-13900K
Carte mère : Intel Z790
Mémoire : DDR5 6000 16 Go × 2
SSD : SSD AORUS NVMe PCIe 2 To
Système d'exploitation : Windows 11 Pro 22H2
Pilote : AMD Software Adrenalin Edition 23.4.3
En testant, nous voulons savoir :
Quelle est la différence dans la puissance de calcul de l'IA de Stable Diffusion entre les AMD Radeon séries 5000, 6000 et 7000 ?
Par rapport à l'accélération informatique traditionnelle de l'IA du processeur, quelles sont les performances d'accélération du GPU AMD ?
▲La solution de déploiement de partage réseau open source que nous adoptons peut implémenter correctement le calcul accéléré matériel des cartes graphiques AMD. Vous pouvez voir que le taux d'occupation du GPU reste à 100 % pendant le processus de génération d'images.
Le modèle est Novel AI Final-runed (CKPT)
Dans la première partie du test, nous avons utilisé des mots-clés pour générer une femme aux grands yeux, à la mode et belle, qui avait également une certaine sensation photo. Les paramètres des mots-clés sont les suivants (certains sont cités à partir de mots-clés open source partagés sur Internet) :
lora:koreanDollLikeness_v15:0.6>, meilleure qualité, ultra haute résolution, (photoréaliste:1.4), 1 femme, chemise boutonnée blanche sans manches, jupe noire, tour de cou noir, mignon, (idole Kpop), (aegyo sal:1), ( cheveux blond platine : 1), ((yeux gonflés)), regardant le spectateur, corps entier, face à face, mode, premium
Résolution : 512 × 512
Étape d'échantillonnage : 20
Coefficient de guidage des mots rapides : 7
Générer des lots - quantité par lot : 1-1, 4-1
Dans le test, étant donné que la plupart des cartes graphiques ont plus de 8 Go de mémoire vidéo, nous avons essentiellement défini le mode haute vidéo normal par défaut dans les paramètres de fonctionnement. Seule la version de mémoire vidéo de 4 Go du RX 6500XT utilisait le mode faible avec --lowvram ajouté. . Mode de fonctionnement de la mémoire vidéo (sinon cela ne fonctionnera pas). À en juger par les résultats globaux des tests, les cartes graphiques d'AMD de la série Radeon RX 5000 à la série RX 7000 ont presque toutes atteint les performances d'accélération de calcul IA des applications à diffusion stable. En particulier, les performances des cartes graphiques de la série Radeon RX 7000. est meilleur que celui des cartes graphiques de la série RX 6000. Une énorme amélioration. Par exemple, le taux de génération d'images du RX 6900XT avec ce paramètre et cet algorithme de modèle est d'environ 8,87 images/seconde, tandis que le RX 7900 XT peut atteindre 15,76 images/seconde, soit une amélioration des performances de près de 100 %.
Par rapport aux processeurs, toutes les cartes graphiques AMD présentent des avantages très évidents. Les performances du RX 7900 XT sont environ 30 fois supérieures à celles du Core i9-13900K. Même la carte graphique d'entrée de gamme RX 5500XT des deux premières générations est presque proche de 5. fois celui du Core i9-13900K.
La seule chose qui est un peu anormale est le RX 6500XT. Selon les spécifications de base, il devrait être plus puissant que le RX 5500XT. Cependant, puisque la configuration de la mémoire vidéo n'est que de 4 Go, une fois le mode d'exécution de faible mémoire vidéo activé. Dans le test, sa vitesse de génération d'images est affectée. Elle a un impact énorme, bien inférieur aux performances normales de l'accélération GPU, et ne peut atteindre qu'un niveau légèrement supérieur à celui du calcul CPU.
Dans le test suivant, nous avons utilisé une série de mots-clés relativement complexes pour générer une villa au bord de l'eau, ainsi que des exigences en matière d'effets tels que la lumière du soleil, les ondulations et les reflets. Les mots-clés sont les suivants :
'magnifique rendu d'une maison de style Tudor près de l'eau au coucher du soleil, forêt fantastique, photoréaliste, composition cinématographique, détails cinématographiques élevés, éclairage cinématographique ultra réaliste, profondeur de champ, hyper détaillé, magnifiquement codé par couleur, 8k,'
Résolution : 512 × 512
Étape d'échantillonnage : 50
Coefficient de guidage des mots rapides : 7,5
Générer des lots - quantité par lot : 1-1, 2-1, 4-1
Les résultats des tests de cette partie sont fondamentalement cohérents avec le test précédent. Les cartes graphiques de la série RX 7000 dominent toujours en termes de performances. Par rapport aux cartes graphiques de la série RX 6000, l'amélioration des performances est d'environ 100 %. Par rapport aux performances de calcul du processeur, l'amélioration des performances du calcul accéléré par GPU est toujours très significative. Les performances du RX 7900 XT atteignent Les performances de la carte graphique d'entrée de gamme RX 5500XT sont presque 5 fois supérieures à celles du Core i9-13900K.
Le RX 6500XT avec une configuration de mémoire de 4 Go ne peut fonctionner qu'en mode mémoire faible, de sorte que la vitesse de génération d'images est toujours fortement affectée, ce qui est bien inférieur aux performances normales d'accélération GPU et à peu près équivalente à celle du Core i9-13900K.
Il s'agit d'un test simple mais intéressant. À travers cette expérience, nous pensons qu'il existe quelques points de référence qui peuvent être résumés auxquels les joueurs peuvent se référer :
1. Actuellement, les cartes graphiques AMD peuvent atteindre une accélération informatique de diffusion stable sous les systèmes Windows grâce à des solutions de déploiement open source, et il existe également de nombreux packages d'intégration infaillibles sur Internet. Les joueurs intéressés peuvent l'essayer ;
2. À en juger par les résultats des tests, les cartes graphiques AMD peuvent obtenir une augmentation des performances bien meilleure que les calculs du CPU dans les calculs de génération d'images AI de Stable Diffusion. L'utilisation du GPU pour accélérer les calculs peut apporter deux fois le résultat avec la moitié de l'effort ;3. À en juger par la situation de test, lorsque la résolution de rendu est définie pour dépasser 512 (comme 768×768), la mémoire vidéo sera dépassée. Cela a une certaine relation avec le plan et le modèle de déploiement, mais cela reflète également le. situation normale. Lors de l'exécution en mode, 8 Go de mémoire vidéo constituent presque une condition d'entrée stricte pour une diffusion stable. Si la mémoire vidéo est inférieure à 8 Go, même lors d'un rendu à une résolution de 512 × 512, la mémoire vidéo sera insuffisante. À ce stade, vous devrez utiliser la solution d'exécution à faible mémoire vidéo de --lowvram, mais cela ralentira considérablement. réduire la vitesse de calcul, comme dans le test RX 6500XT 4GB. Donc si vous souhaitez jouer à Stable Diffusion en douceur, nous recommandons que la carte graphique ait une mémoire vidéo de 8 Go ou plus
;4. À en juger par les résultats globaux, nous pensons que le GPU AMD a encore une énorme marge d'optimisation des algorithmes. À en juger par une expérience peu fiable, l'écart de performances entre le RX 7900 XTX et le Core i9-13900K n'est pas assez grand. Cela a quelque chose à voir avec les solutions algorithmiques et les modèles que nous avons déployés. Nous espérons également que les programmeurs de diverses communautés pourront développer des solutions d'accélération informatique plus nombreuses et de meilleure qualité pour les cartes graphiques AMD.
Quoi qu'il en soit, les performances de calcul accélérées par le matériel des cartes graphiques AMD pour la diffusion stable ont été démontrées, et l'effet est relativement évident. C'est sans aucun doute une bonne nouvelle pour les utilisateurs de cartes graphiques AMD. Le reste appartient aux joueurs et à AMD. chemin vers l’optimisation.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!