Maison > Périphériques technologiques > IA > Imagen 3: un guide avec des exemples dans l'API Gemini

Imagen 3: un guide avec des exemples dans l'API Gemini

Lisa Kudrow
Libérer: 2025-02-28 16:26:11
original
728 Les gens l'ont consulté

Imagen 3: Un tutoriel Python pour la génération de texte à l'image

Imagen 3 est un puissant modèle de texte à image capable de générer des images très détaillées et stylistiquement diverses, même en incorporant du texte. Ce didacticiel montre comment tirer parti des capacités d'imagen 3 par programme en utilisant l'API AI et Python génératifs de Google. Nous couvrirons la configuration de l'environnement, la mise en œuvre du code et explorerons diverses options de génération d'images.

Accéder à Imagen 3 via l'API Generative AI Google

Pour commencer, vous aurez besoin d'un projet Google Cloud et d'une clé API.

Configuration de votre environnement Google Cloud:

  1. Console Cloud Google: Accédez à la console Google Cloud et connectez-vous.
  2. Nouveau projet: Créer un nouveau projet (par exemple, "Imagen-tutorial").
  3. Détails du projet: Remplissez les détails du projet nécessaires. Le champ d'organisation est facultatif.

Imagen 3: A Guide With Examples in the Gemini API

Génération de clés de l'API:

  1. Accédez à la page de la clé API dans Google AI Studio.
  2. Cliquez sur "Créer une clé API."
  3. Sélectionnez votre projet nouvellement créé et cliquez sur "Créer".
  4. Enregistrez votre clé API en toute sécurité. Créez un fichier .env dans votre répertoire de projet avec le contenu suivant:
<code>GEMINI_API_KEY=<your_api_key></your_api_key></code>
Copier après la connexion

Configuration du compte de facturation:

Imagen 3 est un service payant. Associez un compte de facturation à votre projet Google Cloud pour éviter les erreurs d'utilisation de l'API. Suivez les invites dans Google AI Studio pour lier ou créer un compte de facturation. Le coût actuel par génération d'images est de 0,03 $ (vérifiez la page de tarification officielle des derniers tarifs).

Imagen 3: A Guide With Examples in the Gemini API

Configuration de l'environnement Python (Anaconda recommandé):

  1. Installez Anaconda: Téléchargez et installez Anaconda à partir du site officiel.
  2. Créer un environnement: conda create -n imagen python=3.9
  3. Activer l'environnement: conda activate imagen
  4. Installer les packages: pip install -q -U google-genai pillow python-dotenv

Génération d'images avec Python:

Créez un script Python (par exemple, gen_image.py) dans le même répertoire que votre fichier .env.

# Import necessary libraries
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import os
from dotenv import load_dotenv

# Load API key from .env
load_dotenv()
api_key = os.getenv("GEMINI_API_KEY")

# Initialize the client
client = genai.Client(api_key=api_key)

# Generate an image
prompt = """A dog surfing at the beach"""
response = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(number_of_images=1)
)

# Display the image
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()
Copier après la connexion

Imagen 3: A Guide With Examples in the Gemini API

Options de génération d'images avancées:

L'objet types.GenerateImagesConfig permet la personnalisation:

  • number_of_images: générer plusieurs images (par défaut: 4).
  • aspect_ratio: Contrôler le rapport d'aspect (par exemple, "9:16" pour les images verticales).
  • safety_filter_level: actuellement ne prend en charge que BLOCK_LOW_AND_ABOVE.
  • person_generation: Contrôlez si les gens sont autorisés à l'image (ALLOW_ADULT ou DONT_ALLOW).

Ingénierie rapide efficace:

Création des invites efficaces est cruciale. Utilisez un langage descriptif, spécifiez les styles et envisagez d'ajouter des détails sur l'éclairage, les paramètres de la caméra et les techniques artistiques pour de meilleurs résultats. Reportez-vous à la documentation officielle de l'imagen 3 pour des directives rapides détaillées.

Édition et personnalisation d'image (Accès actuellement limité):

Imagen 3 propose des fonctionnalités d'édition et de personnalisation d'image, mais l'accès est actuellement restreint.

Conclusion:

Ce didacticiel fournit une base pour l'utilisation d'Imagen 3 via l'API et Python Génératifs Google. Expérimentez avec différentes invites et options de configuration pour déverrouiller le plein potentiel de ce puissant modèle de texte à image. N'oubliez pas de toujours vérifier la documentation officielle pour les informations et les prix les plus à jour.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal