En tant que dernière version du modèle de génération d'images AI, Stable Diffusion 3 est ici avec de grandes attentes. Je pense que de nombreux amis doivent avoir plus ou moins utilisé le modèle de génération d'images dans leur travail et leur vie, nous le partagerons donc ci-dessous. Jetons un coup d'œil au processus de construction local de Stable diffusion 3. Sans plus tarder, passons aux choses pratiques.
La configuration de la plateforme utilisée dans cette build est la suivante : Compte tenu de la forte demande de puissance de calcul lors de l'exécution de Stable diffusion 3 en local, nous avons choisi cette fois la carte graphique GALAXY GeForce RTX 4070 Ti SUPER OC. La GEFORCE RTX 4070 Ti SUPER est construite sur la base du cœur AD103, qui constitue également le plus gros changement de cette carte graphique. Il contient 8 448 cœurs CUDA en interne, soit plus de 10 % de plus que les 7 680 cœurs du RTX 4070 Ti. La largeur de bits de la mémoire a été augmentée à 256 bits par rapport au RTX 4070 Ti, et les spécifications de la mémoire ont également été augmentées à 16 Go. GDDR6X, que ce soit pour les jeux ou l'IA, la création aide. Choisissez cette carte graphique pour trouver un équilibre entre prix et performances. Cette carte graphique est équipée de 16 Go de mémoire vidéo GDDR6x, avec une largeur de mémoire de 192 bits et une longueur de 35,4 cm. Afin de garantir que cette carte graphique est qualifiée pour la construction de Stable diffusion 3, certains tests des performances informatiques de cette carte graphique ont également été effectués au préalable. Les 8448 cœurs CUDA de la GeForce RTX 4070 Ti SUPER peuvent fournir du matériel. l'accélération, rendant le travail plus efficace soit améliorée. Presque tous les logiciels de modélisation sont optimisés pour les GPU NVIDIA, ils peuvent donc prendre en compte l'efficacité, la stabilité et la compatibilité. Nous avons testé les performances de V-Ray Benchmark. Le score du projet de test GPU CUDA est de 2746 points. Dans le test de Stable Diffusion 1.7, en sélectionnant le modèle v2-1_768-ema-pruned.ckpt, 21 images de cabanes ont été dessinées sous forme de diagrammes vincentiens. La résolution d'image était de 768*768, et cela a finalement pris. 54 secondes. Terminez. Après avoir activé la fonction TensorRT Engines, la vitesse est à nouveau réduite de moitié et elle peut être complétée en 27 secondes. Après une série de tests, nous avons déterminé que cette carte graphique est tout à fait capable de construire Stable Diffusion 3. Retroussons nos manches et commençons !un personnage féminin aux cheveux longs et flottants qui semblent être constitués de motifs éthérés et tourbillonnants ressemblant aux aurores boréales ou aux aurores boréales. L'arrière-plan est dominé par des bleus et des violets profonds, créant une atmosphère mystérieuse et dramatique. avec une peau pâle et des traits frappants, elle porte une tenue de couleur foncée avec des motifs subtils. Le style général de l'œuvre d'art rappelle les genres fantastiques ou surnaturels.se traduit par
un personnage féminin aux cheveux longs et flottants. être réalisé avec un motif tourbillonnant semblable aux aurores boréales ou aux aurores boréales. Le fond est dominé par des bleus foncés et des violets, créant une atmosphère mystérieuse et dramatique. Le visage du personnage est calme, avec une peau pâle et des traits délicats. Elle porte des vêtements sombres avec des motifs subtils. Le style général du tableau rappelle le genre fantastique ou surnaturel.Dans le flux de travail ci-dessus, la zone de texte verte est la zone de saisie pour les mots d'invite de transfert, et la zone de texte rouge est la zone de saisie pour les mots d'invite inverse. L'image générée après l'exécution est la suivante. 4070 Ti SUPER star YaoOC a généré cette image de 1024*1024 pixels en seulement 21,23 secondes, et l'expérience est très fluide. On peut voir que lors de l'exécution du modèle, la charge du GPU est instantanément pleine, ce qui montre que la demande du modèle en puissance de calcul GPU est assez terrifiante. À ce stade, le flux de travail de base officiel a été exécuté. L'éditeur a réessayé d'utiliser "Un Bob l'éponge mangeant de la glace" comme mot d'invite positif à générer, et l'image résultante est la suivante ((ci-dessus), le l'ensemble est relativement harmonieux. A titre de comparaison, vous pouvez jeter un œil à l'image (ci-dessous) que l'éditeur a utilisée pour générer à l'aide de Stable Diffusion 1.7 en utilisant les mêmes mots d'invite. Le premier workflow est réussi, essayons donc le deuxième workflow. Semblable au premier, faites glisser le fichier .json officiel dans l'interface pour obtenir un flux de travail similaire à celui actuel. L'emplacement du fichier modèle doit encore être configuré. Après la configuration, vous pouvez exécuter le workflow normalement. La GALAXY GeForce RTX 4070 Ti SUPER Xingyao OC a mis 14,92 secondes pour faire fonctionner ce modèle, ce qui est beaucoup plus court que le précédent. Cependant, lors de l’exécution du modèle, la charge GPU est toujours pleine instantanément. Les idées générales de déploiement des deux premiers workflows sont similaires. La sélection dépend principalement de vos besoins d'utilisation quotidiens. Après l'exécution, les paramètres peuvent être ajustés et optimisés davantage en fonction des besoins personnels, qui ne seront pas abordés ici. Parlons ensuite de ce troisième workflow. Suivez le même exemple et faites glisser le fichier .json, et vous verrez une erreur, ce qui signifie probablement que le fichier de modèle correspondant est manquant. Désactivez le rapport d'erreurs, vous pouvez voir qu'il y a une boîte de processus en rouge, qui est causée par l'absence du modèle requis pour améliorer la résolution de l'image. L'idée pour résoudre des problèmes similaires une fois pour toutes est d'installer un plug-in ComfyUI - ComfyUI Manager, qui peut détecter, télécharger et compléter les modèles et plug-ins manquants dans le flux de travail actuel. L'URL du plug-in est la suivante : https://github.com/ltdrdata/ComfyUI-ManagerLe fonctionnaire propose une variété de méthodes d'installation. Les amis intéressés peuvent l'étudier par eux-mêmes. Nous choisissons ici la première méthode d'installation. Fermez l'interface ComfyUI avant l'installation. Bien que cela ne soit pas officiellement mentionné, si vous utilisez la première méthode pour installer, vous devez d'abord télécharger et installer git. Ici, nous téléchargeons et installons le programme d'installation autonome 64 bits. Une fois l'installation terminée, ouvrez le terminal et exécutez les trois commandes suivantes dans l'ordre. cdCUsersithomeDocumentscomfyui_sd3ComfyUI_windows_portableComfyUIcdcustom_nodesgitclonehttps://github.com/ltdrdata/ComfyUI-Manager.gitL'adresse du dossier dans la première commande doit être modifiée en fonction de l'emplacement où ComfyUI est installé. Les exigences réseau ici sont relativement élevées. Si le réseau n'est pas bon, une erreur peut être signalée. Après avoir réussi, vous verrez la commande de fin de téléchargement. Ouvrez maintenant ComfyUI, vous pouvez voir deux autres boutons dans le coin inférieur droit. Cliquez sur Gestionnaire et vous pourrez voir une multitude d'éléments de configuration. Nous utilisons principalement les deux éléments dans la case rouge ici. Cliquez d'abord sur Installer les nœuds personnalisés manquants. Vous pouvez voir que les plug-ins manquants ont été détectés. Après l'installation, vous pouvez voir que le carré rouge dans le flux de travail est revenu à la normale. Cependant, si vous exécutez à nouveau le modèle à ce moment-là, vous constaterez qu'il ne peut fonctionner que selon les mêmes étapes que le premier modèle officiel, et l'amélioration de la résolution ultérieure cessera de fonctionner. En effet, nous n'avons pas encore installé le modèle 4x-UltraSharp.pth. Ouvrez Installer les modèles dans le gestionnaire, recherchez 4x-UltraSharp, vous pouvez voir les modèles concernés, cliquez sur Installer à l'arrière. Une fois l'installation terminée, exécutez-la à nouveau. Vous pouvez voir qu'après avoir exécuté le modèle Wenshengtu, il y aura 4 processus de modèle avec une résolution améliorée. Le processus complet prend 51,09 s. Ce flux de travail est assez stressant. du RTX 4070 Ti SUPER Xingyao OC est plutôt bon. Vous pouvez voir l'image après avoir augmenté la résolutionLa taille de l'image a également augmenté d'environ 4 fois. Donc ici, tout le monde doit avoir compris le processus de construction de Stable Diffusion 3 basé sur ComfyUI. Il convient de noter qu'en raison des différences d'environnement réseau, de raisons matérielles, etc., vous pouvez rencontrer divers problèmes pendant le processus de construction. il n'y a pas lieu de s'inquiéter des accidents. Vous pouvez les partager dans la zone de commentaires et en discuter et les résoudre ensemble.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!