Table des matières
SD - modèle.
Plus esthétique" >Plus esthétique
un jeune homme, méchés dans les cheveux, yeux marrons, en chemise blanche et jean bleu sur une plage avec un volcan en arrière-plan" >un jeune homme, méchés dans les cheveux, yeux marrons, en chemise blanche et jean bleu sur une plage avec un volcan en arrière-plan
Maison Périphériques technologiques IA Stable Diffusion-XL est ouvert en version bêta publique, vous libérant des invites longues et fastidieuses !

Stable Diffusion-XL est ouvert en version bêta publique, vous libérant des invites longues et fastidieuses !

Apr 23, 2023 am 10:16 AM
开源

Depuis la sortie de la version 5 de Midjourney, des améliorations significatives ont été apportées au réalisme des personnages et des détails des doigts dans les images générées, et des progrès ont également été réalisés en termes de précision de la compréhension rapide, de diversité esthétique et de compréhension du langage.

En revanche, bien que Stable Diffusion soit gratuit et open source, il doit écrire une longue liste d'invites à chaque fois, et générer des images de haute qualité dépend du tirage de cartes à plusieurs reprises.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Récemment, Stability AI a officiellement annoncé que le Stable Diffusion XL en cours de développement a commencé à être testé pour le public et est actuellement disponible en essai gratuit sur la plateforme Clipdrop.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Lien d'essai : ​https://clipdrop.co/stable-diffusion​

Emad Mostaque, fondateur et PDG de Stability AI, a déclaré que le modèle est encore en phase de formation, ce sera open source une fois que les paramètres sont stables ; SD-XL fonctionnera mieux dans les détails de l'image tels que la "poignée de main" et est presque entièrement contrôlable.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Stable Diffusion XL n'est pas le nom de la version finale, et ce n'est pas la v3, car l'architecture du SD-XL est très similaire à l'architecture du modèle de la série SD-v2.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Gym à domicile minimaliste avec revêtement de sol en caoutchouc, téléviseur mural, banc de musculation, ballon médicinal, haltères, tapis de yoga, équipement de haute technologie, très détaillé, organisé et efficace.

Simple Salle de gym à domicile, revêtement de sol en caoutchouc, téléviseur mural, banc de musculation, médecine-ball, haltères, tapis de yoga, équipement de haute technologie, détails élevés, organisation et efficacité

Les quelques exemples d'images suivants officiellement publiés par SD-XL peuvent be On peut voir que la qualité de l’image est très impressionnante.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Mais parfois, moins ne veut pas dire plus. L'espace de personnalisation devient de plus en plus petit et ne répond pas aux préférences de la plupart des gens. Stable Diffusion, actuellement v1.5, reste le modèle de base le plus populaire de la communauté.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Les internautes ont exprimé l'espoir que la nouvelle version de SD puisse rester compatible avec les modèles d'intégration, d'hyperréseau et de Lora de la version SD 2.1. Il serait trop inconfortable de se recycler à partir de zéro.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Certains internautes pensent que les performances du SD-XL sont similaires au modèle partagé par les internautes sur le site civit, et l'effet du nouveau modèle n'est pas particulièrement étonnant, ce qui est moyen.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

SD - modèle.

SD-v2.1 comprend 900 millions de paramètres, SD-XL compte environ 2,3 milliards de paramètres et Emad a déclaré que la version officielle pourrait en outre publier une version distillée plus petite.

SD-XL présente les améliorations suivantes par rapport à la version précédente :

Utilisez une invite descriptive plus courte pour générer des images de haute qualité
  • Peut générer des images qui correspondent davantage à l'invite
  • images La structure du corps humain est plus raisonnable
  • Par rapport aux versions v2.1 et v1.5 (dans une moindre mesure), les images générées par SD-XL sont plus conformes à l'esthétique publique
  • Le négatif une invite est possible Option
  • Le portrait obtenu est plus réaliste
  • Le texte dans l'image est plus clair
  • Il est à noter que SD-XL peut ne pas être compatible avec les versions précédentes du plug-in .

Texte clair et lisible

Dans la série v1 et la version v2.1 du modèle Stable Diffusion, il n'a pas la capacité de générer du texte lisible dans les images.

Bien que les informations textuelles générées par SD-XL ne soient pas toujours exactes, elles apportent une énorme amélioration.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Photo d'une femme assise dans un restaurant tenant un menu qui dit « Menu » dit " Stable Diffusion"

Une jeune femme tenant une pancarte indiquant "Stable Diffusion", des reflets dans les cheveux, assise à l'extérieur du restaurant, les yeux marrons, portant une robe, une lumière latérale

Liang, assise à l'extérieur du restaurant, yeux marrons, porter une jupe, lumières latérales

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Meilleure structure humaine

Stable La diffusion a toujours eu de nombreux problèmes pour générer l'anatomie humaine, plus de jambes, moins de bras sont un problème très courant, c'est généralement nécessaire. pour utiliser la fonction inpaint pour corriger davantage les détails de l'image ; ou utiliser la fonction Open Pose de ControlNet pour copier la posture du corps humain à partir de l'image de référence.

Par exemple, lorsque SD-v1.5 génère des images de yoga, des corps humains déformés apparaissent souvent.

Photo d'une femme en tenue de yoga, pose en triangle, plage en soirée, éclairage de jante

Bien que les images générées par SD-XL ne soient pas parfaites, elles ont fait des progrès significatifs dans la posture humaine.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Plus esthétique

Par exemple, avec le même thème d'une maison, SD-XL peut générer des photos plus symétriques et avoir de meilleurs effets visuels.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

SD-XL présente également des améliorations significatives dans les photos de portrait.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

prise de vue d'une femme

Une image qui correspond mieux à l'invite

SD-XL peut mieux comprendre l'invite de saisie et produire des images plus précises.

Par exemple, en prenant comme exemple le bicolore (bicolore), SD-v1.5 ne générera que des images en noir et blanc, tandis que SD-XL peut générer des images bicolores avec plusieurs couleurs.

La capacité à comprendre les invites s'est améliorée par rapport au modèle v1.

Portrait bicolore d'une femmeMidjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Portrait bicolore d'une femme

Parce que SD-XL appartient au même modèle de la série v2, la taille du modèle de texte est plus grande et peut être par rapport au modèle v1. Mieux comprendre les mots d'invite.

Par exemple, dans l'exemple ci-dessous, le modèle v1.5 ne peut jamais comprendre les deux sujets de l'image (robot et humain), mais le modèle SD-XL peut générer des images normales (bien que le robot soit toujours pas assez grand).

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

grand ami robot assis à côté d'un humain, fantôme dans le style coquille, fond d'écran animeMidjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Grand ami robot assis à côté d'un humain, fantôme dans le style coquille, fond d'écran anime

un jeune homme, mèches de cheveux, yeux marrons, en chemise blanche et jean bleu sur une plage avec un volcan en arrière-planMidjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Un jeune homme, mèches de cheveux, yeux marrons, en chemise blanche et jean bleu sur une plage avec un volcan en arrière-plan Chemise blanche et jean bleu, debout sur la plage, avec un volcan en arrière-plan

Style artistique

En termes de style artistique, SD-XL n'a pas été significativement amélioré et présente ses propres différences par rapport à la version précédente.

Par exemple, deux modèles génèrent des images de style Edward Hopper sous des angles différents.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

New York par Edward Hopper

Edward Hopper dessine New York

Le style de Leonid Afmov, SD-v1.5 est plus précis, SD-XL manque de couleurs différentes. coups de pinceau de planches colorées).

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

New York City par Leonid Afremov

new York dessiné par Leonid Afemov

william-Adolphe Bouguereau Style, V1.5 et SDXL peuvent générer un contenu similaire, parmi les deux eux, SD-XL est plus proche de la peinture académique classique créée par Bouguereau et présente plus de détails sur le visage.

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

moins Ajouter quelques clés non pertinentes Après l'écriture, le style du modèle peut soudainement changer.

Par exemple, générez d'abord une image de style photo.

un jeune homme, méchés dans les cheveux, yeux marrons, en chemise blanche et jean bleu sur une plage avec un volcan en arrière-plan

Un jeune homme, méchés dans les cheveux, yeux marrons, en chemise blanche et jean bleu sur une plage avec un volcan en arrière-plan Yeux, vêtu d'une chemise blanche et d'un jean bleu, debout sur la plage avec un volcan en arrière-plan

Après avoir ajouté une écharpe jaune, le style de l'image devient dessin animé style. Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

un jeune homme, des reflets dans les cheveux, les yeux marrons,

portant un foulard jaune,en chemise blanche et un jean bleu sur une plage avec un volcan en fond

un jeune homme, Cheveux teints de couleurs vives, yeux marron, portant un foulard jaune, portant une chemise blanche et un jean bleu, debout sur une plage avec un volcan en arrière-plan

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Le problème peut être dû à un problème d'aperçu, qui ne sera pas publié jusqu'à la sortie officielle, je ne sais pas si ce problème pourra être résolu plus tard.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article chaud

Repo: Comment relancer ses coéquipiers
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD
Hello Kitty Island Adventure: Comment obtenir des graines géantes
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Article chaud

Repo: Comment relancer ses coéquipiers
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD
Hello Kitty Island Adventure: Comment obtenir des graines géantes
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Tags d'article chaud

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

15 outils d'annotation d'images gratuits open source recommandés 15 outils d'annotation d'images gratuits open source recommandés Mar 28, 2024 pm 01:21 PM

15 outils d'annotation d'images gratuits open source recommandés

Dix outils d'annotation de texte gratuits open source recommandés Dix outils d'annotation de texte gratuits open source recommandés Mar 26, 2024 pm 08:20 PM

Dix outils d'annotation de texte gratuits open source recommandés

Le code source de 25 agents IA est désormais public, inspiré de « Virtual Town » et de « Westworld » de Stanford Le code source de 25 agents IA est désormais public, inspiré de « Virtual Town » et de « Westworld » de Stanford Aug 11, 2023 pm 06:49 PM

Le code source de 25 agents IA est désormais public, inspiré de « Virtual Town » et de « Westworld » de Stanford

Fraichement publié! Un modèle open source pour générer des images de style anime en un seul clic Fraichement publié! Un modèle open source pour générer des images de style anime en un seul clic Apr 08, 2024 pm 06:01 PM

Fraichement publié! Un modèle open source pour générer des images de style anime en un seul clic

Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA Apr 02, 2024 am 11:31 AM

Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Apr 03, 2024 am 11:55 AM

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS

Le modèle de code open source aiXcoder-7B le plus puissant de l'Université de Pékin ! Concentrez-vous sur des scénarios de développement réels et conçus spécifiquement pour le déploiement privé en entreprise Le modèle de code open source aiXcoder-7B le plus puissant de l'Université de Pékin ! Concentrez-vous sur des scénarios de développement réels et conçus spécifiquement pour le déploiement privé en entreprise Apr 09, 2024 pm 06:10 PM

Le modèle de code open source aiXcoder-7B le plus puissant de l'Université de Pékin ! Concentrez-vous sur des scénarios de développement réels et conçus spécifiquement pour le déploiement privé en entreprise

1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT 1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT Mar 11, 2024 pm 12:07 PM

1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT

See all articles