Développer le contenu d'une image à l'aide de l'outpainting

Cette page explique comment utiliser l'outpainting pour étendre le contenu d'une image à une zone plus grande ou à une zone avec des dimensions différentes.

Exemple d'outpainting

L'outpainting est une méthode d'édition basée sur des masques qui permet d'étendre le contenu d'une image de base pour l'adapter à un canevas de masque plus grand ou de taille différente.

exemple d'image de base — Image d'origine étendue pour correspondre à la taille d'image du masque (cible).
Source de l'image : Kari Shea sur Unsplash.

exemple d'image de masque — Image de masque aux dimensions de la sortie cible, avec marquage des dimensions et de l'emplacement des pixels de l'image d'origine.

exemple d'image de sortie — Image de sortie avec outpainting (sans prompt)

Afficher la fiche de modèle Imagen pour la modification et la personnalisation

Avant de commencer

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Configurez l'authentification pour votre environnement.

Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Python

Pour utiliser les exemples Python de cette page dans un environnement de développement local, installez et initialisez la gcloud CLI, puis configurez le service Identifiants par défaut de l'application avec vos identifiants utilisateur.
Pour en savoir plus, consultez la section Configurer les ADC pour un environnement de développement local dans la documentation sur l'authentification Google Cloud .
REST

Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .
Élargir le contenu d'une image

Utilisez les exemples de code suivants pour étendre le contenu d'une image existante.
Console
1. Dans la console Google Cloud , accédez à la page Vertex AI>Vertex AI Studio .
  
  Accéder à Vertex AI Studio
2. Cliquez sur Générer un contenu multimédia.
3. Cliquez sur Image.
4. Dans la liste Tâche, sélectionnez Extension.
5. Dans la liste Modèle, sélectionnez le modèle Imagen à utiliser.
6. Dans Image d'entrée, cliquez sur Ajouter, puis sélectionnez l'image que vous modifiez pour l'importer.
7. Dans la zone Requête, saisissez une requête décrivant comment modifier l'image.
8. Dans le menu "Format", sélectionnez un format :
  
  crop_square Carré
  
  crop_16_9 16:9
  
  crop_9_16 9:16
  
  crop_landscape 4:3
  
  crop_portrait 3:4
  
  fullscreen Custom
9. Dans la barre d'outils d'édition, sélectionnez l'emplacement de votre image :
  
  Aligner à gauche :
  
  Alignement horizontal au centre :
  
  Aligner à droite :
  
  Alignement en haut :
  
  Alignement vertical au centre :
  
  Aligner en bas :
10. Cliquez sur Exécuter.
Python

Installer
pip install --upgrade google-genai
Pour en savoir plus, consultez la documentation de référence du SDK.

Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
from google import genai from google.genai.types import ( RawReferenceImage, MaskReferenceImage, MaskReferenceConfig, EditImageConfig, ) client = genai.Client() # TODO(developer): Update and un-comment below line # output_file = "output-image.png" raw_ref = RawReferenceImage( reference_image=Image.from_file(location="test_resources/living_room.png"), reference_id=0, ) mask_ref = MaskReferenceImage( reference_id=1, reference_image=Image.from_file(location="test_resources/living_room_mask.png"), config=MaskReferenceConfig( mask_mode="MASK_MODE_USER_PROVIDED", mask_dilation=0.03, ), ) image = client.models.edit_image( model="imagen-3.0-capability-001", prompt="A chandelier hanging from the ceiling", reference_images=[raw_ref, mask_ref], config=EditImageConfig( edit_mode="EDIT_MODE_OUTPAINT", ), ) image.generated_images[0].image.save(output_file) print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes") # Example response: # Created output image using 1234567 bytes
REST

Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- LOCATION : région de votre projet (us-central1, europe-west2 ou asia-northeast3, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI.
- prompt : pour l'outpainting d'image, vous pouvez fournir une chaîne vide pour créer les images modifiées. Si vous choisissez de spécifier un prompt, décrivez la zone de masque pour obtenir de meilleurs résultats. Par exemple, utilisez un ciel bleu au lieu de insère un ciel bleu.
- referenceType : ReferenceImage correspond à une image qui fournit un contexte supplémentaire pour la modification d'images. Une image de référence brute RVB normale (REFERENCE_TYPE_RAW) est requise pour les cas d'utilisation de modification. Une seule image de référence brute peut exister dans une requête. L'image de sortie a la même hauteur et la même largeur que l'image de référence brute. Une image de référence de masque (REFERENCE_TYPE_MASK) est requise pour les cas d'utilisation de modification de masque. Si une image de référence brute est présente, l'image de masque doit avoir la même hauteur et la même largeur que l'image de référence brute. Si l'image de référence de masque est vide et que maskMode n'est pas défini sur MASK_MODE_USER_PROVIDED, le masque est calculé en fonction de l'image de référence brute.
- B64_BASE_IMAGE : image de base à modifier ou à améliorer. L'image doit être spécifiée en tant que chaîne d'octets encodés en base64. Limite de taille : 10 Mo.
- B64_OUTPAINTING_MASK : image en noir et blanc que vous souhaitez utiliser comme calque de masque pour modifier l'image d'origine. La résolution du masque doit être identique à celle de l'image d'entrée. La résolution de l'image de sortie sera identique à celle de l'image d'entrée. Cette image de masque doit être spécifiée en tant que chaîne d'octets encodés en base64. Limite de taille : 10 Mo.
- MASK_DILATION : float. Pourcentage de la largeur de l'image à utiliser pour dilater ce masque. Nous vous recommandons de définir 0.03 comme valeur pour l'outpainting. Définir "dilation": 0.0 peut entraîner l'apparition de bordures évidentes au point où l'image a été étendue ou un effet de bordure blanche.
- EDIT_STEPS : entier. Nombre d'étapes d'échantillonnage pour le modèle de base. Pour l'outpainting, commencez avec 35 étapes. Augmentez le nombre d'étapes si la qualité ne répond pas à vos exigences.
- EDIT_IMAGE_COUNT : nombre d'images modifiées. Valeurs entières acceptées : 1 à 4. Valeur par défaut : 4.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corps JSON de la requête :
{ "instances": [ { "prompt": "", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "B64_BASE_IMAGE" } }, { "referenceType": "REFERENCE_TYPE_MASK", "referenceId": 2, "referenceImage": { "bytesBase64Encoded": "B64_OUTPAINTING_MASK" }, "maskImageConfig": { "maskMode": "MASK_MODE_USER_PROVIDED", "dilation": MASK_DILATION } } ] } ], "parameters": { "editConfig": { "baseSteps": EDIT_STEPS }, "editMode": "EDIT_MODE_OUTPAINT", "sampleCount": EDIT_IMAGE_COUNT } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl

Remarque : Pour la commande suivante, nous partons du principe que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Remarque : Pour la commande suivante, nous partons du principe que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
L'exemple suivant représente la réponse à une requête avec "sampleCount": 2. La réponse renvoie deux objets de prédiction, avec les octets d'image générés encodés en base64.
{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Limites

Si l'image complétée est agrandie à 200 % ou plus de la taille de l'image d'origine, le modèle peut produire des détails déformés. Nous vous recommandons d'ajouter une étape de post-traitement pour exécuter le mélange alpha sur les images retouchées.

Le code suivant est un exemple de post-traitement :
```
parameters = {
   "editConfig": {
       "outpaintingConfig": {
         "blendingMode": "alpha-blending",
         "blendingFactor": 0.01,
       },
   },
}
```
Étapes suivantes

Consultez des articles concernant Imagen et d'autres produits d'IA générative sur Vertex AI :

Développer le contenu d'une image à l'aide de l'outpainting Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Exemple d'outpainting

Avant de commencer

Console

Python

REST

Élargir le contenu d'une image

Console

Python

Installer

REST

curl

PowerShell

Limites

Étapes suivantes

Développer le contenu d'une image à l'aide de l'outpainting