IT House News le 25 juin, Stability AI a récemment annoncé que son modèle d'image de génération de texte SDXL 0.9 avait été officiellement lancé. Cette version présente des améliorations significatives du contenu de l'image et des détails de la composition, et prend également en charge l'exécution sur des GPU grand public.
Il est rapporté que SDXL 0.9 possède le plus grand nombre de paramètres parmi tous les modèles d'images open source, avec un modèle de base de 3,5 milliards de paramètres et un modèle supplémentaire de 6,6 milliards de paramètres. Autour de ces deux modèles, le principe de fonctionnement de SDXL est d'utiliser le modèle de base pour créer des détails grossiers, puis d'utiliser des modèles supplémentaires pour affiner les images générées. Si vos amis d'IT House ont utilisé Stable Diffusion, vous devriez pouvoir le remarquer. . Un processus de travail progressif.
▲ Source image équipe SDXL
Stability AI indique que deux modèles CLIP sont utilisés dans SDXL0.9, dont OpenCLIP vitg /14, qui est le plus grand modèle OpenCLIP à ce jour. Grâce à ce modèle, Stable Diffusion est capable de générer des images plus réalistes avec une résolution plus élevée et une plus grande profondeur.
Stability AI a également déclaré que l'équipe SDXL publierait un blog de recherche détaillant les spécifications du modèle et plus de détails sur les paramètres de SDXL 0.9. Il est prévu que le modèle inaugurera la version officielle 1.0 en juillet et sera open source sur GitHub.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!