Définir la résolution de sortie

Imagen sur Vertex AI vous permet de définir la résolution de sortie des images générées lorsque vous utilisez les modèles Imagen 4 suivants :

* {Console}

  1. Dans la Google Cloud console, accédez à la page Vertex AI > Vertex AI Studio .

    Accéder à Vertex AI Studio

  2. Cliquez sur Générer un média.

  3. Cliquez sur Image.

  4. Dans la liste Tâche, sélectionnez Texte en image.

  5. Dans la liste Modèle, sélectionnez le modèle Imagen à utiliser.

  6. Dans la zone Prompt, saisissez un prompt décrivant comment modifier l' image.

  7. Cliquez sur chevron_forward Paramètres, puis ajustez les options suivantes :

    • Format : choisissez un format parmi les options disponibles.
    • Nombre de résultats : ajustez le curseur pour sélectionner entre 1 et 4 images générées.
    • Résolution de sortie : choisissez une résolution de sortie parmi les options disponibles.
  8. Cliquez sur Exécuter.

REST

Pour en savoir plus sur l'API Imagen, consultez les ressources suivantes :

Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :

  • REGION : région dans laquelle se trouve votre projet. Pour en savoir plus sur les régions compatibles, consultez la page IA générative dans les emplacements Vertex AI.
  • TEXT_PROMPT : Le prompt textuel à utiliser pour générer des images.
  • PROJECT_ID: ID de votre Google Cloud projet.
  • MODEL_VERSION: : version du modèle Imagen à utiliser. Les valeurs suivantes sont acceptées lorsque vous utilisez sampleImageSize:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION : résolution de l'image de sortie. Les valeurs suivantes sont acceptées :
    • "1K"
    • "2K"

    Le paramètre par défaut est "1K".

  • IMAGE_COUNT: Le nombre d'images à générer. La plage de valeurs acceptée est comprise entre 1 et 4.

Méthode HTTP et URL :

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Corps JSON de la requête :

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, et exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La requête renvoie des objets image. Dans cet exemple, deux objets image sont renvoyés, avec deux objets de prédiction en tant qu'images encodées en base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}