Les 5 meilleurs générateurs d'images IA open source
Il existe des dizaines de générateurs de texte-image IA gratuits et open source disponibles sur Internet, spécialisés dans des types spécifiques d'images. Nous avons donc passé au crible la pile et trouvé les meilleurs générateurs de texte-image d’IA open source que vous pouvez essayer dès maintenant.
1 Craiyon

Craiyon est l'un des générateurs d'images IA open source les plus facilement accessibles. Il est basé sur DALL-E Mini, et bien que vous puissiez cloner le référentiel Github et installer le modèle localement sur votre ordinateur, Craiyon semble avoir abandonné cette approche au profit de son site Web.
Le dépôt officiel de Github n'a pas été mis à jour depuis juin 2022, mais le dernier modèle est toujours disponible gratuitement sur le site officiel de Craiyon. Il n’existe pas non plus d’applications Android ou iOS.
En termes de fonctionnalités, vous verrez toutes les options habituelles que vous attendez d'un générateur d'images IA. Une fois que vous avez entré votre invite et obtenu une image, vous pouvez utiliser la fonction de mise à l'échelle pour obtenir une copie de plus haute résolution. Vous avez le choix entre trois styles : Art, Photo et Dessin. Vous pouvez également sélectionner l'option "Aucun" si vous souhaitez que le modèle décide.

De plus, le « Mode Expert » vous permet d'inclure des mots négatifs, ce qui indique au modèle d'éviter des éléments spécifiques. Il existe également une fonction de prédiction d'invite, qui utilise ChatGPT pour aider les utilisateurs à rédiger les invites les meilleures et les plus détaillées possibles. Enfin, les fonctionnalités de suppression d’arrière-plan basées sur l’IA peuvent vous aider à économiser du temps et des efforts en recadrant les arrière-plans des images.
Et c'est à peu près tout ce que fait Craiyon. Ce n'est pas le modèle de génération d'images IA le plus sophistiqué, mais il constitue un modèle de base si vous ne voulez pas quelque chose de détaillé ou de réaliste.
L'utilisation du modèle est gratuite, mais les utilisateurs gratuits sont limités à neuf images gratuites à la fois par minute. Vous pouvez vous abonner à leurs niveaux Supporter ou Professionnel (au prix de 5 $ et 20 $ par mois, respectivement, et facturés annuellement) pour ne recevoir aucune publicité ni filigrane, une génération plus rapide et la possibilité de garder vos images générées privées. Un niveau d'abonnement personnalisé permet également des modèles personnalisés, une intégration, une assistance dédiée et des serveurs privés.
2 Stable Diffusion 1.5
Stable Diffusion est peut-être l'un des modèles de génération de texte en image open source les plus populaires. Il alimente également d’autres modèles, notamment les trois générateurs d’images mentionnés ci-dessous. Il est sorti en 2022 et a connu de nombreuses implémentations depuis.

Je vous épargne les détails trop techniques du fonctionnement du modèle (pour lesquels vous pouvez consulter leur dépôt officiel Github), mais le modèle est facile à installer même pour les débutants complets et fonctionne bien tant que vous disposez d'un GPU dédié avec au moins 4 Go de mémoire. Vous pouvez également accéder à Stable Diffusion en ligne, et nous sommes là pour vous si vous souhaitez exécuter Stable Diffusion sur un Mac.
Il existe plusieurs points de contrôle (considérez-les comme versions) disponibles pour une diffusion stable. Alors que nous avons testé la version 1.5, la version 2.1 est également en développement actif et est plus précise.

Faire fonctionner le modèle est également plutôt simple. Nous l'avons testé avec l'interface utilisateur Web AUTOMATIC1111 Stable Diffusion, et tous les contrôles et paramètres fonctionnent bien. Il est également tout à fait à l'épreuve du NSFW grâce à la base de données LAION-5B sur laquelle le modèle s'est entraîné (même si elle n'est pas parfaite, remarquez). Bien que le temps de génération lui-même varie en fonction de votre matériel, vous pouvez vous attendre à ce que vos images soient détaillées et réalistes, même avec des invites de base.
3 DreamShaper
DreamShaper est un modèle de génération d'images basé sur la diffusion stable. Il a été conçu comme une alternative open source à MidJourney et se concentre sur le photoréalisme dans les images générées, bien qu'il puisse tout aussi bien gérer les styles d'anime et de peinture avec quelques ajustements.
Le modèle est plus performant que Stable Diffusion, offrant aux utilisateurs plus de liberté sur le résultat final, allant d'améliorations éclair à des restrictions NSFW plus souples. L'exécution du modèle est également simple, avec une version téléchargeable et pré-entraînée disponible en ligne pour un accès local et une multitude de sites Web, notamment Sinkin.ai, RandomSeed et Mage.space (nécessite un abonnement de base) qui vous permettent d'exécuter le modèle avec Accélération GPU.

Comme vous pouvez probablement le deviner maintenant, les images générées par DreamShaper ont tendance à paraître plus réalistes que celles générées par Stable Diffusion. Même si vous exécutez la même invite sur les deux modèles, le modèle DreamShaper sera probablement plus réaliste, détaillé et mieux éclairé.
Cela est particulièrement vrai pour les portraits ou les personnages, ce qui me manque par rapport à la même invite. Si vos images deviennent trop réalistes, voici quatre façons d'identifier une image générée par l'IA.
Vous n'avez pas non plus besoin d'un PC géant pour exécuter le modèle. Ma GTX 1650Ti avec 4 Go de VRAM faisait parfaitement fonctionner le modèle. Le temps de génération était un peu plus long, mais cela ne semblait pas affecter la production réelle. Cela dit, vous aurez peut-être besoin de GPU avec plus de VRAM pour exécuter DreamShaper XL, qui est basé sur le modèle Stable Diffusion XL.
4 InvokeAI
Invoke AI est un autre modèle de génération d'images basé sur l'IA basé sur Stable Diffusion, avec une version XL basée sur Stable Diffusion XL. Il possède également sa propre interface utilisateur Web et en ligne de commande, ce qui signifie que vous n'aurez pas à sauter des étapes avec des éléments tels que l'interface utilisateur Web Stable Diffusion.

Le modèle vise à permettre aux utilisateurs de créer des visuels basés sur leur propriété intellectuelle avec des flux de travail personnalisés. InvokeAI est l'un des meilleurs modèles de génération d'images d'IA open source pour former des modèles personnalisés et travailler avec la propriété intellectuelle.
Son référentiel officiel Github répertorie deux méthodes d'installation : l'installation via le programme d'installation d'InvokeAI ou l'utilisation de PyPI si vous êtes à l'aise avec un terminal et Python et avez besoin de plus de contrôle sur les packages installés avec le modèle.
Cependant, le contrôle supplémentaire entraîne quelques limitations, notamment des exigences matérielles plus strictes. InvokeAI recommande un GPU dédié avec au moins 4 Go de mémoire, avec six à huit Go recommandés pour exécuter la variante XL. Les exigences VRAM s'appliquent aux GPU AMD et Nvidia. Vous aurez également besoin d'au moins 12 Go de RAM et de 12 Go d'espace disque libre pour le modèle, ses dépendances et Python.

Bien que la documentation ne recommande pas les GPU Nvidia GTX séries 10 et 16 en raison de leur manque de mémoire vidéo, le programme d'installation fourni a très bien fonctionné. Bien que votre kilométrage puisse varier, si vous utilisez un GPU bas de gamme, attendez-vous à attendre plus longtemps pour voir vos invites se transformer en images. Enfin, si vous êtes sous Windows, vous ne pouvez utiliser qu'un GPU Nvidia, car les GPU AMD ne sont actuellement pas pris en charge.
Pour la partie génération d'images, le modèle a tendance à pencher davantage vers les styles artistiques que vers le photoréalisme. Bien sûr, vous pouvez entraîner le modèle sur votre ensemble de données et lui faire générer des images plus proches de ce que vous souhaitez, même si cela implique des images photoréalistes, surtout si vous travaillez dans la conception de produits, l'architecture ou les espaces de vente au détail. Cependant, une chose importante à garder à l'esprit est qu'InvokeAI est avant tout un moteur de génération d'images, ce qui signifie que vous devrez probablement utiliser vos propres modèles pour obtenir les meilleurs résultats (facilement trouvés via le gestionnaire de modèles fourni dans l'interface Web) par défaut. Le modèle est assez similaire à Stable Diffusion lui-même.
5 Openjourney
Openjourney est un modèle de génération d'images IA gratuit et open source basé encore une fois sur Stable Diffusion. Si vous vous demandez pourquoi le modèle s'appelle Openjourney, c'est parce qu'il a été formé sur des images Midjourney et peut imiter son style dans les images qu'il génère.
PromptHero, la société derrière Openjourney, vous permet de tester le modèle aux côtés d'autres modèles, notamment Stable Diffusion (versions 1.5 et 2), DreamShaper et Realistic Vision. Lors de votre inscription, vous obtenez 25 crédits gratuits (un crédit pour chaque image générée), après quoi vous devez vous abonner à leur niveau d'abonnement Pro, qui coûte 9 $ par mois et vous donne accès à 300 crédits chaque mois avec d'autres fonctionnalités exclusives.

Cependant, si vous souhaitez l'exécuter localement et gratuitement, vous pouvez télécharger le fichier modèle depuis HuggingFace et l'exécuter à l'aide de l'interface utilisateur Web de Stable Diffusion. Openjourney est également le deuxième modèle de génération d'images IA le plus téléchargé sur HuggingFace, juste derrière Stable Diffusion.
Openjourney ne répertorie aucune configuration matérielle spécifique pour exécuter le modèle localement sur son site Web, mais vous pouvez vous attendre à des exigences matérielles similaires à celles de Stable Diffusion. Cela signifie un GPU dédié avec 4 Go de VRAM, 16 Go de RAM et environ 12 à 15 Go d'espace libre sur votre ordinateur pour sauvegarder le modèle et ses dépendances.

Les images générées par Openjourney ont tendance à être équilibrées entre photoréalisme et art, sauf indication contraire. Si vous recherchez un modèle polyvalent et préférez l’apparence de Midjourney sans payer l’abonnement, Openjourney est l’une des meilleures options.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Tout en travaillant sur une IA agentique, les développeurs se retrouvent souvent à naviguer dans les compromis entre la vitesse, la flexibilité et l'efficacité des ressources. J'ai exploré le cadre de l'IA agentique et je suis tombé sur Agno (plus tôt c'était Phi-

La version comprend trois modèles distincts, GPT-4.1, GPT-4.1 Mini et GPT-4.1 Nano, signalant une évolution vers des optimisations spécifiques à la tâche dans le paysage du modèle grand langage. Ces modèles ne remplacent pas immédiatement les interfaces orientées utilisateur comme

Instruction ALTER TABLE de SQL: Ajout de colonnes dynamiquement à votre base de données Dans la gestion des données, l'adaptabilité de SQL est cruciale. Besoin d'ajuster votre structure de base de données à la volée? L'énoncé de la table alter est votre solution. Ce guide détaille l'ajout de Colu

Déverrouiller la puissance des modèles d'intégration: une plongée profonde dans le nouveau cours d'Andrew Ng Imaginez un avenir où les machines comprennent et répondent à vos questions avec une précision parfaite. Ce n'est pas de la science-fiction; Grâce aux progrès de l'IA, cela devient un R

Simuler les lancements de fusée avec Rocketpy: un guide complet Cet article vous guide à travers la simulation des lancements de fusées haute puissance à l'aide de Rocketpy, une puissante bibliothèque Python. Nous couvrirons tout, de la définition de composants de fusée à l'analyse de Simula

Gemini comme fondement de la stratégie d'IA de Google Gemini est la pierre angulaire de la stratégie d'agent AI de Google, tirant parti de ses capacités multimodales avancées pour traiter et générer des réponses à travers le texte, les images, l'audio, la vidéo et le code. Développé par Deepm

"Super heureux d'annoncer que nous acquérons une robotique de pollen pour amener les robots open source au monde", a déclaré Hugging Face sur X. "Depuis que Remi Cadene nous a rejoints de Tesla, nous sommes devenus la plate-forme logicielle la plus utilisée pour la robotique ouverte grâce à des remerciements grâce à des remerciements grâce à des remerciements à une robotique ouverte grâce à des remerciements à des remerciements à des remerciements à la robotique ouverte grâce à des remerciements à Gérom

Dans un développement significatif pour la communauté de l'IA, Agetica et ensemble AI ont publié un modèle de codage d'IA open source nommé Deepcoder-14b. Offrir des capacités de génération de code à égalité avec des concurrents à source fermée comme OpenAI
