Générer et modifier des images sur Vertex AI

Gemini et Imagen sur Vertex AI fournissent les fonctionnalités de pointe d'IA générative d'image de Google aux développeurs d'applications. Avec Gemini et Imagen sur Vertex AI, les développeurs d'applications peuvent créer des produits d'IA nouvelle génération qui transforment en quelques secondes l'inspiration de leur utilisateur en éléments visuels de haute qualité grâce à l'IA générative.

Essayer la génération d'images (Vertex AI Studio)

Essayer Imagen dans Colab

Avec Gemini et Imagen, vous pouvez effectuer les opérations suivantes :

  • Générer des images inédites à partir d'une requête textuelle (génération IA de texte vers image).
  • Modifier ou étendre une image importée ou générée à l'aide d'une zone de masque que vous définissez.
  • Augmenter la résolution d'images existantes, générées ou modifiées.

Requêtes pour les images précédentes

Ces images sont générées à l'aide du modèle de génération d'images Imagen 3 général (imagen-3.0-generate-002) et des requêtes suivantes :

  1. Scène d'animation en pâte à modeler. Plan moyen d'une femme âgée. Elle porte des vêtements amples. Elle se tient dans un jardin luxuriant et arrose les plantes avec un arrosoir orange.
  2. Photo prise avec un appareil photo reflex numérique et un filtre polarisant. Photo de deux montgolfières au-dessus des formations rocheuses uniques de Cappadoce, en Turquie. Les couleurs et les motifs de ces ballons contrastent magnifiquement avec les tons terreux du paysage en contrebas. Ce plan capture le sentiment d'aventure qui accompagne une telle expérience.
  3. Un robot méca en bois usé, recouvert de vignes en fleurs, se tient paisiblement dans un champ de grandes fleurs sauvages, avec un petit oiseau bleu posé sur sa main tendue. Dessin animé numérique, avec des couleurs chaudes et des lignes douces. Une grande falaise avec une cascade se dresse derrière.
  4. Vue des mains d'une personne tenant une petite figurine d'oiseau en argile et la sculptant avec un outil de modelage dans l'autre main. Vous pouvez voir l'écharpe du sculpteur. Leurs mains sont couvertes de poussière d'argile. Image macro d'un appareil photo reflex numérique mettant en évidence la texture et la qualité de fabrication.
  5. Un grand bouquet de fleurs colorées dans un vieux vase en verre bleu sur la table. Au premier plan se trouve une magnifique pivoine entourée de diverses autres fleurs comme des roses, des lys, des marguerites, des orchidées, des fruits, des baies et des feuilles vertes. L'arrière-plan est gris foncé. Peinture à l'huile dans le style du siècle d'or néerlandais.
  6. Une seule case de bande dessinée montrant un garçon et son père sur une colline herbeuse, regardant le coucher de soleil. Une bulle de texte pointe vers la bouche du garçon et indique : "Le soleil se lèvera à nouveau." Style de couleurs douces, fin des années 1990

Guide de démarrage rapide : générer des images à partir de requêtes textuelles à l'aide d'Imagen

Vous pouvez générer des images inédites en n'utilisant que du texte descriptif comme entrée. Les exemples suivants montrent un cas simplifié de génération d'images, mais vous pouvez utiliser des paramètres supplémentaires pour adapter les images générées à vos besoins.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Configurez l'authentification pour votre environnement.

    Select the tab for how you plan to use the samples on this page:

    Python

    Pour utiliser les exemples Python de cette page dans un environnement de développement local, installez et initialisez la gcloud CLI, puis configurez le service Identifiants par défaut de l'application avec vos identifiants utilisateur.

      Installez la Google Cloud CLI.

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

      If you're using a local shell, then create local authentication credentials for your user account:

      gcloud auth application-default login

      You don't need to do this if you're using Cloud Shell.

      If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.

    Pour en savoir plus, consultez la section Configurer les ADC pour un environnement de développement local dans la documentation sur l'authentification Google Cloud .

    REST

    Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.

      Installez la Google Cloud CLI.

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

  9. Utilisez les exemples suivants pour générer une image :

    Python

    from google import genai
    from google.genai.types import GenerateImagesConfig
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_file = "output-image.png"
    
    image = client.models.generate_images(
        model="imagen-4.0-generate-001",
        prompt="A dog reading a newspaper",
        config=GenerateImagesConfig(
            image_size="2K",
        ),
    )
    
    image.generated_images[0].image.save(output_file)
    
    print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes")
    # Example response:
    # Created output image using 1234567 bytes
    

    REST

    1. Définissez les variables d'environnement :

      export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT # Replace with your Google Cloud project
      export GOOGLE_CLOUD_LOCATION=us-central1 # Replace with the appropriate location for your project
                  
    2. Exécutez la commande suivante :

      curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json; charset=utf-8" \
      "https://${GOOGLE_CLOUD_LOCATION}-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/imagen-4.0-generate-preview-05-20:predict" -d \
      $'{
        "instances": [
          {
            "prompt": "a cat reading a book"
          }
        ],
        "parameters": {
          "sampleCount": 1
        }
      }'
                  

      Le modèle renvoie un objet d'octets d'image en base64.

    Pour en savoir plus, consultez l'API Imagen Generate images.

  10. Versions de modèle

    Vous pouvez utiliser plusieurs modèles de génération d'images. Pour en savoir plus, consultez Modèles Gemini ou Modèles Imagen.

    Essayer d'autres exemples

    Pour obtenir la liste complète des tutoriels sur les notebooks Jupyter utilisant Imagen, consultez le cookbook de l'IA générative sur Vertex AI.

    Quand utiliser Gemini ou Imagen sur Vertex AI

    En plus d'utiliser les fonctionnalités de génération d'images intégrées à Gemini, vous pouvez également accéder à Imagen, notre modèle spécialisé de génération d'images.

    Attribut Image Gemini Imagen 4
    Points forts Recommandation par défaut.
    Flexibilité inégalée, compréhension du contexte, et édition simple et sans masque. Il est le seul à pouvoir modifier des conversations multitours.
    Meilleure qualité/latence
    Disponibilité Disponibilité générale Disponibilité générale
    Latence Durée plus longue. Ses fonctionnalités avancées nécessitent davantage de calculs. Faible Optimisé pour des performances en temps quasi réel.
    Coût Tarification basée sur les jetons. Rentable pour les tâches spécialisées.
    Tâches recommandées
    • Génération de texte et d'images entrelacés pour combiner facilement texte et images.
    • Combinez des éléments créatifs de plusieurs images avec une seule requête.
    • Modifiez des images de manière très spécifique, modifiez des éléments individuels avec de simples commandes en langage naturel et travaillez de manière itérative sur une image.
    • Appliquez un design ou une texture spécifique d'une image à une autre tout en conservant la forme et les détails du sujet d'origine.
    • La qualité de l'image, le photoréalisme, les détails artistiques ou les styles spécifiques (par exemple, l'impressionnisme et l'anime) sont des priorités absolues.
    • Intégrer une image de marque ou un style, ou générer des logos et des conceptions de produits
    • Générer une orthographe ou une typographie avancées

    Gemini est le modèle idéal pour commencer à générer des images. Choisissez Imagen 4 Ultra pour les cas d'utilisation avancés ou lorsque vous avez besoin de la meilleure qualité d'image (notez que vous ne pouvez générer qu'une seule image à la fois).

    Étapes suivantes

    Utilisez les liens suivants pour consulter la documentation sur la fonctionnalité.

    Crédit image : toutes les images ont été générées avec Imagen sur Vertex AI.