Maison > Périphériques technologiques > IA > Comment accéder à une diffusion stable 3.5? - Analytique Vidhya

Comment accéder à une diffusion stable 3.5? - Analytique Vidhya

尊渡假赌尊渡假赌尊渡假赌
Libérer: 2025-03-19 10:56:24
original
329 Les gens l'ont consulté

Diffusion stable 3.5: une plongée profonde dans ses modèles et ses méthodes d'accès

La dernière version de Stability.ai, Stable Diffusion 3.5, possède trois modèles personnalisables - de la taille, du grand turbo et du médium - tous optimisés pour le matériel de consommation. Cet article explore ces modèles, leurs méthodes d'accès et leurs capacités.

Comment accéder à une diffusion stable 3.5? - Analytique Vidhya

Présentation du modèle

  • Disponibilité: téléchargeable en étreignant le visage et accessible via la stabilité de l'API, la réplique et d'autres plates-formes d'Ai.
  • Sécurité: la stabilité AI a mis en œuvre des protocoles de sécurité pour atténuer les abus.
  • Développement futur: les améliorations prévues incluent la prise en charge de ControlNet pour un contrôle d'image plus fin.
  • Compatibilité des plateformes: l'intégration transparente sur diverses plates-formes assure une utilisation flexible.

Table des matières

  • Aperçu
  • Modèles stables diffusion 3.5
  • Comparaison du modèle
  • Accéder à une diffusion stable 3.5
    • Via stabilité.ai plate-forme
    • Via le visage étreint
  • Conclusion
  • Questions fréquemment posées

Modèles stables diffusion 3.5 expliqués

  1. Diffusion stable 3.5 Grande: ce modèle phare (8,1 milliards de paramètres) offre une qualité d'image supérieure et une adhésion rapide, idéale pour une utilisation professionnelle à une résolution de 1 mégapixel.
  2. Diffusion stable 3.5 Grand turbo: une version plus rapide et rationalisée du grand modèle. Il obtient des résultats de haute qualité en seulement 4 étapes.
  3. STABLE DIFFUSION 3.5 Mélier: Conçu pour le matériel des consommateurs (2,5 milliards de paramètres), ce modèle équilibre la qualité avec l'efficacité, soutenant les résolutions de 0,25 à 2 mégapixels en utilisant l'architecture MMDIT-X améliorée. Il nécessite environ 9,9 Go de VRAM (à l'exclusion des encodeurs de texte).

Tous les modèles sont finables et optimisés pour le matériel des consommateurs.

Comparaison du modèle

Diffusion stable 3,5 Grand excelle dans l'adhésion rapide et rivalise avec des modèles plus grands en qualité d'image. Le grand turbo privilégie la vitesse sans sacrifier la qualité, tandis que le milieu offre une option très performante et économe en ressources.

Comment accéder à une diffusion stable 3.5? - Analytique Vidhya

Accéder à une diffusion stable 3.5

Via stabilité.ai plate-forme

Obtenez votre clé API à la plate-forme (25 crédits fournis lors de l'inscription). Utilisez le code Python suivant (Remplacez par votre clé API) dans un environnement jupytre:

 Demandes d'importation

Response = requers.Post (
    f "https://api.stability.ai/v2beta/stable-image/generate/sd3",
    en-têtes = {
        "Autorisation": f "Bearer Sk- {api-key}",
        "accepter": "image / *"
    },
    files = {"Aucun": ''},
    data = {
        "Invite": "Un homme d'âge moyen portant des vêtements formels",
        "output_format": "jpeg",
    },
)

Si réponse.status_code == 200:
    avec open ("./ man.jpeg", 'wb') en tant que fichier:
        file.write (réponse.content)
autre:
    Soulever une exception (str (réponse.json ())) 
Copier après la connexion

Comment accéder à une diffusion stable 3.5? - Analytique Vidhya

(Exemple d'image générée avec l'invite: "Un homme d'âge moyen portant des vêtements formels")

Via le visage étreint

Accédez au modèle directement sur le visage étreint. L'interface permet une inférence immédiate, comme indiqué ci-dessous:

Comment accéder à une diffusion stable 3.5? - Analytique VidhyaComment accéder à une diffusion stable 3.5? - Analytique VidhyaComment accéder à une diffusion stable 3.5? - Analytique Vidhya

(Exemple d'image générée avec l'invite: "Une forêt avec des arbres rouges")

Pour l'accès à l'API via un visage étreint, suivez ces étapes:

  1. Localisez la page de modèle stable de diffusion 3,5-de-place sur la face étreinte. (Remarque: les autres modèles sont sélectionnables).
  2. Obtenir l'accès (c'est un modèle fermé).
  3. Utilisez le code Python suivant (remplacez par votre jeton de face étreint):
 Demandes d'importation

Api_url = "https://api-inference.huggingface.co/models/stabilityai/stable-diffusion-3.5-large"
en-têtes = {"Autorisation": "Bearer Hf_Token"}

Def Query (charge utile):
    Response = requers.Post (API_URL, Headers = Headers, JSON = Payse)
    Retour Response.Content

image_bytes = query ({
    "Entrées": "Un ninja assis au sommet d'un grand bâtiment, 8k",
})

Importer IO
à partir de l'image d'importation PIL
image = image.open (io.bytesio (image_bytes)))
image 
Copier après la connexion

Comment accéder à une diffusion stable 3.5? - Analytique VidhyaComment accéder à une diffusion stable 3.5? - Analytique Vidhya

(Exemple d'image générée avec l'invite: "Un ninja assis au sommet d'un grand bâtiment, 8k")

Conclusion

Stable Diffusion 3.5 offre une suite polyvalente de modèles de génération d'images répondant à divers besoins et capacités matérielles. Son accessibilité via plusieurs plates-formes simplifie la génération d'images AI de haute qualité.

(Considérez le programme de pinacle Genai pour la formation générative de l'IA.)

Questions fréquemment posées

Q1: Authentification de l'API de la stabilité AI? Utilisez votre clé API dans les en-têtes de demande.

Q2: Erreurs de l'API AI de stabilité commune? Accès non autorisé, paramètres non valides ou dépasser les limites d'utilisation.

Q3: La diffusion stable 3.5 est-elle sans moyenne? Gratuit sous la licence de la communauté de stabilité pour la recherche, l'utilisation non commerciale et les organisations avec moins de 1 million de dollars de revenus. Les plus grandes entités nécessitent une licence d'entreprise.

Q4: Qu'est-ce qui distingue le milieu stable de diffusion 3.5? Amélioration de l'architecture MMDIT-X avec Normalisation QK et double attention pour une génération d'images améliorée entre les résolutions.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal