Utiliser l'outil de reformulation de requêtes

Essayer la génération d'images (Vertex AI Studio)

Essayez Imagen dans un notebook Colab Imagen sur Vertex AI propose un outil de reformulation de prompt basé sur un LLM, également appelé outil de réécriture de prompt. Cet outil vous aide à obtenir des images de sortie de meilleure qualité en ajoutant plus de détails à votre prompt.

Si vous désactivez l'outil de réécriture de prompt, la qualité des images et la fidélité de la sortie au prompt que vous avez fourni peuvent être affectées. Cette fonctionnalité est activée par défaut pour les versions de modèle suivantes :

Le prompt reformulé n'est envoyé par la réponse de l'API que si le prompt d'origine contient moins de 30 mots.

Utiliser l'outil de réécriture de prompt

Pour utiliser l'outil de réécriture de prompt, procédez comme suit :

Console

  1. Dans la Google Cloud console, accédez à la page Vertex AI > Media Studio.

    Accéder à Media Studio

  2. Cliquez sur Imagen. La page de génération d'images Imagen Media Studio s'affiche.

  3. Dans le panneau Settings (Paramètres), ajustez les options suivantes :

    • Model (Modèle) : sélectionnez un modèle parmi les options disponibles.

      Pour en savoir plus sur les modèles disponibles, consultez la section Modèles Imagen.

    • Number of results (Nombre de résultats) : ajustez le curseur ou saisissez une valeur comprise entre 1 et 4.

    • Dans la zone Negative prompt (Prompt négatif), saisissez un prompt décrivant ce que vous ne voulez pas générer dans l'image.

  4. Dans la zone Write your prompt (Écrivez votre prompt), cliquez sur Help me write (M'aider à écrire).

    La fenêtre Enhance my prompt (Améliorer mon prompt) s'affiche.

  5. Dans la zone Current prompt (Prompt actuel), écrivez votre prompt, puis cliquez sur Enhance (Améliorer).

    Le prompt reformulé s'affiche dans la zone Enhanced prompt (Prompt amélioré). Vous pouvez modifier le prompt amélioré ou l'utiliser tel quel.

  6. Cliquez sur Insert (Insérer) pour utiliser le prompt affiché.

    Le prompt est inséré dans la zone Write your prompt (Écrivez votre prompt).

  7. Cliquez sur Générer.

REST

Pour en savoir plus sur l'API Imagen, consultez les ressources suivantes :

Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :

  • PROJECT_ID : ID de votre projet Google Cloud .
  • MODEL_VERSION : version du modèle de génération d'images à utiliser.

    Pour en savoir plus sur les versions et les fonctionnalités des modèles, consultez la section Versions de modèles.

  • LOCATION: région de votre projet. (us-central1, europe-west2 ou asia-northeast3, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI. Lorsqu'un point de terminaison d'API régional est utilisé, la région de l'URL du point de terminaison détermine l'emplacement où la requête est traitée. Ce LOCATION dans le chemin d'accès à la ressource est ignoré en cas de conflit.
  • TEXT_PROMPT : le prompt textuel qui guide le modèle pour la génération d'images. Avant la génération des images, ce prompt de base est amélioré avec plus de détails et un langage descriptif à l'aide de l'outil de reformulation de prompt basé sur un LLM.
  • IMAGE_COUNT : entier décrivant le nombre d'images à générer. Les valeurs acceptées sont comprises entre 1 et 4. La valeur par défaut est 4.
  • PROMPT_SETTING : valeur booléenne. true active les prompts améliorés et false les désactive. La valeur par défaut est true.

Méthode HTTP et URL :

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Corps JSON de la requête :

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "enhancePrompt": PROMPT_SETTING
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, et exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Lorsque l'amélioration des prompts est activée, la réponse inclut un champ prompt supplémentaire qui affiche le prompt amélioré et l'image générée qui lui est associée :
  {
    "predictions": [
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_1",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
      },
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_2",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
      }
    ]
  }

Par exemple, l'exemple de réponse suivant concerne une requête avec "sampleCount": 2 et "prompt": "A raccoon wearing formal clothes, wearing a top hat. Oil painting in the style of Vincent Van Gogh.". La réponse renvoie deux objets de prédiction, chacun avec leur prompt amélioré et les octets d'image générés encodés en base64.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh,
        depicting a raccoon adorned in a finely tailored tuxedo, complete with a
        crisp white shirt and a bow tie. The raccoon also sports a classic top
        hat, perched jauntily on its head. The painting uses thick, swirling
        brushstrokes characteristic of van Gogh, with vibrant hues of blue,
        yellow, and green in the background, contrasting with the dark tones of
        the raccoon's attire. The light source is subtly placed, casting a
        dramatic shadow of the raccoon's attire onto the surface it sits upon,
        further enhancing the depth and dimensionality of the composition. The
        overall impression is one of a whimsical and sophisticated character, a
        raccoon elevated to a higher class through its formal attire, rendered
        in van Gogh's iconic style.",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh featuring
        a raccoon in a dapper suit, complete with a black jacket, crisp white
        shirt, and a black bow tie. The raccoon is wearing a black top hat,
        adding a touch of elegance to its ensemble. The painting is rendered
        with characteristic van Gogh brushwork, utilizing thick, impasto strokes
        of color. The background is a swirl of blues, greens, and yellows,
        creating a vibrant yet slightly chaotic atmosphere that contrasts with
        the raccoon's formal attire. The lighting is dramatic, casting sharp
        shadows and highlighting the textures of the fabric and the raccoon's
        fur, enhancing the sense of realism within the fantastical scene. The
        composition focuses on the raccoon's proud posture, highlighting the
        whimsical contrast of a wild animal dressed in formal attire, captured
        in the unique artistic language of van Gogh. ",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Étape suivante