Gemini permet d'améliorer la modification d'images et la modification multitour, et est compatible avec des filtres de sécurité mis à jour qui offrent une expérience plus flexible et moins restrictive.
Les modèles Gemini suivants sont compatibles avec la modification d'images :
Cliquer pour développer les modèles compatibles
Pour en savoir plus sur les fonctionnalités des modèles, consultez Modèles Gemini.
Modifier une image
Console
Pour modifier des images :
- Ouvrez Agent Studio > Créer un prompt.
- Cliquez sur Changer de modèle , puis sélectionnez l'un des modèles affichés.
- Dans le panneau Sorties, sélectionnez Image et texte dans le menu déroulant.
- Cliquez sur Insérer un média (), sélectionnez une source dans le menu, puis suivez les instructions de la boîte de dialogue.
- Dans la zone de texte Écrire un prompt , décrivez les modifications que vous souhaitez apporter à l'image.
- Cliquez sur le bouton Prompt ().
Gemini génère une version modifiée de l'image fournie en fonction de votre description. Ce processus prend quelques secondes, mais peut être plus lent en fonction de la capacité.
Python
Installer
pip install --upgrade google-genai
Pour en savoir plus, consultez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Java
Découvrez comment installer ou mettre à jour le Java.
Pour en savoir plus, lisez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Go
Découvrez comment installer ou mettre à jour le Go.
Pour en savoir plus, lisez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Node.js
Installer
npm install @google/genai
Pour en savoir plus, consultez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
REST
Exécutez la commande suivante dans le terminal pour créer ou écraser ce fichier dans le répertoire actuel :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{"fileData": {
"mimeType": "image/jpg",
"fileUri": "FILE_NAME"
}
},
{"text": "Convert this photo to black and white, in a cartoonish style."},
]
},
"generationConfig": {
"imageConfig": {
"aspectRatio": "16:9",
"imageSize": "4K",
"responseModalities": ["TEXT", "IMAGE"],
"imageOutputOptions": {
"mimeType": "image/png"
},
"personGeneration": "allow_all"
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Pour en savoir plus sur les fonctionnalités des modèles, y compris les formats d'image et les résolutions de sortie compatibles, consultez Modèles Gemini.
Gemini génère une image en fonction de votre description. Ce processus prend quelques secondes, mais peut être plus lent en fonction de la capacité.
Modification d'images multitour
La modification multitour vous permet de répondre au modèle avec des modifications après qu'il a affiché une réponse d'image modifiée.
Les modèles Gemini suivants sont compatibles avec la modification multitour :
Cliquer pour développer les modèles compatibles
Nous vous recommandons de limiter la taille totale du fichier de requête à 50 Mo maximum.
Pour tester la modification d'images multitour, consultez les notebooks suivants :
Pour consulter des exemples de code liés à la création et à la modification d'images multitour à l'aide de Gemini 3 Pro Image, consultez Exemple de modification d'images multitour à l'aide de signatures de pensée.
Étape suivante
Pour en savoir plus sur la génération d'images Gemini, consultez les liens suivants :