Gemini 2.5 Flash Image unterstützt verschiedene Arten der Bildbearbeitung.
Bildbearbeitung
Gemini 2.5 Flash Image für die Bildgenerierung (gemini-2.5-flash-image
) unterstützt die Bearbeitung von Bildern zusätzlich zur Generierung. Gemini 2.5 Flash Image unterstützt die verbesserte Bearbeitung von Bildern und die Bearbeitung in mehreren Schritten. Außerdem enthält es aktualisierte Sicherheitsfilter, die eine flexiblere und weniger restriktive Nutzung ermöglichen.
Er unterstützt die folgenden Modalitäten und Funktionen:
Bildbearbeitung (Text-zu-Bild und Bild-zu-Bild)
- Beispiel-Prompt: „Bearbeite dieses Bild so, dass es wie ein Cartoon aussieht.“
- Beispiel-Prompt: [Bild einer Katze] + [Bild eines Kissens] + „Erstelle ein Kreuzstichmuster meiner Katze auf diesem Kissen.“
Bildbearbeitung mit mehreren Antworten (Chat)
- Beispiel-Prompts: [Lade ein Bild eines blauen Autos hoch.] „Mach aus diesem Auto ein Cabrio.“ „Ändere die Farbe jetzt in Gelb.“ „Füge einen Spoiler hinzu.“
Bild bearbeiten
Console
So bearbeiten Sie Bilder:
- Öffnen Sie Vertex AI Studio > Prompt erstellen.
-
Klicken Sie auf Modell wechseln und wählen Sie im Menü
gemini-2.5-flash-image
aus. - Wählen Sie im Bereich Ausgaben im Drop-down-Menü die Option Bild und Text aus.
- Klicken Sie auf Medien einfügen ( ) und wählen Sie eine Quelle aus dem Menü aus. Folgen Sie dann der Anleitung im Dialogfeld.
- Geben Sie im Textbereich Prompt schreiben ein, welche Änderungen Sie am Bild vornehmen möchten.
- Klicken Sie auf die Schaltfläche Prompt ( ).
Gemini generiert anhand Ihrer Beschreibung eine bearbeitete Version des bereitgestellten Bildes. Dieser Vorgang sollte einige Sekunden dauern, kann aber je nach Kapazität vergleichsweise langsam sein.
Python
Installieren
pip install --upgrade google-genai
Weitere Informationen finden Sie in der SDK-Referenzdokumentation.
Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
Informationen zum Installieren oder Aktualisieren von Java
Weitere Informationen finden Sie in der SDK-Referenzdokumentation.
Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Führen Sie den folgenden Befehl im Terminal aus, um diese Datei im aktuellen Verzeichnis zu erstellen oder zu überschreiben:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{"file_data": {
"mime_type": "image/jpg",
"file_uri": "<var>FILE_NAME</var>"
}
},
{"text": "Convert this photo to black and white, in a cartoonish style."},
]
},
"generation_config": {
"response_modalities": ["TEXT", "IMAGE"],
"image_config": {
"aspect_ratio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini generiert ein Bild basierend auf Ihrer Beschreibung. Dieser Vorgang sollte einige Sekunden dauern, kann aber je nach Kapazität vergleichsweise langsam sein.
Multi-Turn-Bildbearbeitung
Gemini 2.5 Flash Image unterstützt auch die verbesserte Multi-Turn-Bearbeitung. Sie können also auf das Modell mit Änderungen reagieren, nachdem Sie eine bearbeitete Bildantwort erhalten haben. So können Sie weiterhin Änderungen am Bild vornehmen.
Die Gesamtgröße der Anfragedatei sollte maximal 50 MB betragen.
Wenn Sie die Bildbearbeitung in mehreren Schritten ausprobieren möchten, können Sie unser Gemini 2.5 Flash Image-Notebook verwenden.