API Imagen Upscale

Versions de modèles compatibles

L'upscaling Imagen est compatible avec les modèles suivants :

  • imagen-4.0-upscale-preview

Pour en savoir plus sur les fonctionnalités compatibles avec le modèle, consultez Modèles Imagen.

Requête HTTP

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

Instances

Instances

Champ d'union image.

L'image que vous souhaitez améliorer. Vous pouvez fournir une chaîne bytesBase64Encoded qui encode une image ou une chaîne gcsUri URI vers un emplacement de bucket Cloud Storage.

bytesBase64Encoded

string

Chaîne encodée en base64 (octets) d'un fichier image ou vidéo.

gcsUri

string

URI de chaîne vers un emplacement de bucket Cloud Storage.

Paramètres

Paramètres
mode

string

Obligatoire. Pour les demandes de mise à l'échelle, transmettez la chaîne "upscale".

storageUri

string

Facultatif. URI de chaîne vers un emplacement de bucket Cloud Storage utilisé pour stocker les images générées. Si aucun bucket Cloud Storage n'est fourni, les octets d'image encodés en base64 sont renvoyés dans la réponse.

outputOptions

outputOptions

Facultatif. Décrit le format des images de sortie dans un objet outputOptions.

upscaleConfig.upscaleFactor

string

Facteur de scaling pour l'image mise à l'échelle. Les valeurs suivantes sont acceptées :

  • "x2"
  • "x3"
  • "x4"

Objet outputOptions

L'objet outputOptions décrit la sortie d'image.

Paramètres
outputOptions.mimeType

Facultatif : string

Format de sortie de l'image. Les valeurs suivantes sont acceptées :

  • "image/png" : enregistrer au format PNG.
  • "image/jpeg" : enregistrez-la au format JPEG.

La valeur par défaut est "image/png".

outputOptions.compressionQuality

Facultatif : int

Niveau de compression si le type de sortie est "image/jpeg". Les valeurs acceptées sont comprises entre 0 et 100. La valeur par défaut est 75.

Exemple de requête

REST

Avant d'utiliser les données de requête, effectuez les remplacements suivants :

  • REGION : région dans laquelle se trouve votre projet. Pour en savoir plus sur les régions compatibles, consultez Emplacements de l'IA générative sur Vertex AI.
  • PROJECT_ID : ID de votre projet Google Cloud .
  • BASE64_SUBJECT_IMAGE : image encodée en base64 de l'image du sujet.
  • ADD_WATERMARK : valeur booléenne facultative. Définissez la valeur sur true pour activer les images avec filigrane ou sur false pour les désactiver. La valeur par défaut est true.
  • GCS_IMAGE_PATH : chemin d'accès Cloud Storage à un fichier image.
  • GCS_OUTPUT_PATH : chemin d'accès Cloud Storage pour stocker la sortie générée.
  • OUTPUT_MIMETYPE : chaîne facultative qui définit le type de fichier de sortie de l'image. Les valeurs suivantes sont acceptées : "image/png" ou "image/jpeg". La valeur par défaut est "image/png".
  • COMPRESSION_QUALITY : valeur entière facultative qui spécifie le niveau de détail conservé par le modèle pour les images JPEG. La plage de valeurs suivante est acceptée : 0 - 100. Plus la valeur est élevée, plus le niveau de compression est élevé. La valeur par défaut est 75.
  • UPSCALE_FACTOR : facteur de scaling pour l'image améliorée. La résolution finale de l'image après application du facteur d'upscaling ne doit pas dépasser 17 mégapixels. Les valeurs suivantes sont acceptées :
    • "x2"
    • "x3"
    • "x4"

Méthode HTTP et URL :

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

Corps JSON de la requête :

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
La requête renvoie un objet image. Dans cet exemple, un objet image est renvoyé en tant qu'objet de prédiction avec une image encodée en base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}