Essayer la génération d'images (Vertex AI Studio)
Essayez Imagen dans un notebook Colab Imagen sur Vertex AI propose un outil de reformulation de prompt basé sur un LLM, également appelé outil de réécriture de prompt. Cet outil vous aide à obtenir des images de sortie de meilleure qualité en ajoutant plus de détails à votre prompt.
Si vous désactivez l'outil de réécriture de prompt, la qualité des images et la fidélité de la sortie au prompt que vous avez fourni peuvent être affectées. Cette fonctionnalité est activée par défaut pour les versions de modèle suivantes :
-
imagen-3.0-generate-002 -
imagen-4.0-generate-001 -
imagen-4.0-fast-generate-001 -
imagen-4.0-ultra-generate-001
Le prompt reformulé n'est envoyé par la réponse de l'API que si le prompt d'origine contient moins de 30 mots.
Utiliser l'outil de réécriture de prompt
Pour utiliser l'outil de réécriture de prompt, procédez comme suit :
Console
Dans la Google Cloud console, accédez à la page Vertex AI > Media Studio.
Cliquez sur Imagen. La page de génération d'images Imagen Media Studio s'affiche.
Dans le panneau Settings (Paramètres), ajustez les options suivantes :
Model (Modèle) : sélectionnez un modèle parmi les options disponibles.
Pour en savoir plus sur les modèles disponibles, consultez la section Modèles Imagen.
Number of results (Nombre de résultats) : ajustez le curseur ou saisissez une valeur comprise entre 1 et 4.
Dans la zone Negative prompt (Prompt négatif), saisissez un prompt décrivant ce que vous ne voulez pas générer dans l'image.
Dans la zone Write your prompt (Écrivez votre prompt), cliquez sur Help me write (M'aider à écrire).
La fenêtre Enhance my prompt (Améliorer mon prompt) s'affiche.
Dans la zone Current prompt (Prompt actuel), écrivez votre prompt, puis cliquez sur Enhance (Améliorer).
Le prompt reformulé s'affiche dans la zone Enhanced prompt (Prompt amélioré). Vous pouvez modifier le prompt amélioré ou l'utiliser tel quel.
Cliquez sur Insert (Insérer) pour utiliser le prompt affiché.
Le prompt est inséré dans la zone Write your prompt (Écrivez votre prompt).
Cliquez sur Générer.
REST
Pour en savoir plus sur l'API Imagen, consultez les ressources suivantes :
- Méthode :
endpoints.predict VisionGenerativeModelInstanceVisionGenerativeModelParamsVisionGenerativeModelResult
Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- MODEL_VERSION : version du modèle de génération d'images à utiliser.
Pour en savoir plus sur les versions et les fonctionnalités des modèles, consultez la section Versions de modèles.
- LOCATION: région de votre projet. (
us-central1,europe-west2ouasia-northeast3, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI. Lorsqu'un point de terminaison d'API régional est utilisé, la région de l'URL du point de terminaison détermine l'emplacement où la requête est traitée. CeLOCATIONdans le chemin d'accès à la ressource est ignoré en cas de conflit. - TEXT_PROMPT : le prompt textuel qui guide le modèle pour la génération d'images. Avant la génération des images, ce prompt de base est amélioré avec plus de détails et un langage descriptif à l'aide de l'outil de reformulation de prompt basé sur un LLM.
-
IMAGE_COUNT : entier décrivant le nombre d'images à
générer. Les valeurs acceptées sont comprises entre
1et4. La valeur par défaut est4. -
PROMPT_SETTING : valeur booléenne.
trueactive les prompts améliorés etfalseles désactive. La valeur par défaut esttrue.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Corps JSON de la requête :
{
"instances": [
{
"prompt": "TEXT_PROMPT"
}
],
"parameters": {
"sampleCount": IMAGE_COUNT,
"enhancePrompt": PROMPT_SETTING
}
}
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json,
et exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
prompt supplémentaire qui affiche le prompt amélioré et l'image générée qui lui est associée :
{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Par exemple, l'exemple de réponse suivant concerne une requête avec
"sampleCount": 2 et "prompt": "A raccoon wearing formal
clothes, wearing a top hat. Oil painting in the style of Vincent Van
Gogh.". La réponse renvoie deux objets de prédiction, chacun avec leur prompt amélioré et les octets d'image générés encodés en base64.
{
"predictions": [
{
"mimeType": "image/png",
"prompt": "An oil painting in the style of Vincent van Gogh,
depicting a raccoon adorned in a finely tailored tuxedo, complete with a
crisp white shirt and a bow tie. The raccoon also sports a classic top
hat, perched jauntily on its head. The painting uses thick, swirling
brushstrokes characteristic of van Gogh, with vibrant hues of blue,
yellow, and green in the background, contrasting with the dark tones of
the raccoon's attire. The light source is subtly placed, casting a
dramatic shadow of the raccoon's attire onto the surface it sits upon,
further enhancing the depth and dimensionality of the composition. The
overall impression is one of a whimsical and sophisticated character, a
raccoon elevated to a higher class through its formal attire, rendered
in van Gogh's iconic style.",
"bytesBase64Encoded": "BASE64_IMG_BYTES"
},
{
"mimeType": "image/png",
"prompt": "An oil painting in the style of Vincent van Gogh featuring
a raccoon in a dapper suit, complete with a black jacket, crisp white
shirt, and a black bow tie. The raccoon is wearing a black top hat,
adding a touch of elegance to its ensemble. The painting is rendered
with characteristic van Gogh brushwork, utilizing thick, impasto strokes
of color. The background is a swirl of blues, greens, and yellows,
creating a vibrant yet slightly chaotic atmosphere that contrasts with
the raccoon's formal attire. The lighting is dramatic, casting sharp
shadows and highlighting the textures of the fabric and the raccoon's
fur, enhancing the sense of realism within the fantastical scene. The
composition focuses on the raccoon's proud posture, highlighting the
whimsical contrast of a wild animal dressed in formal attire, captured
in the unique artistic language of van Gogh. ",
"bytesBase64Encoded": "BASE64_IMG_BYTES"
}
]
}
Étape suivante
- Définir la langue des requêtes textuelles
- Configurer le format d'image
- Omettre du contenu à l'aide d'un prompt négatif
- Générer des images déterministes