Die Gemini-Bildgenerierung unterliegt den folgenden Einschränkungen:
Für eine optimale Leistung mit Gemini 2.5 Flash Image empfehlen wir die Verwendung der folgenden Sprachen: EN, es-MX, ja-JP, zh-CN oder hi-IN. Für eine optimale Leistung mit Gemini 3 Pro Image sollten Sie die folgenden Sprachen verwenden: ar-EG, de-DE, EN, es-MX, fr-FR, hi-IN, id-ID, it-IT, ja-JP, ko-KR, pt-BR, ru-RU, ua-UA, vi-VN und zh-CN.
Bei der Bildgenerierung werden keine Audio- oder Videoeingaben unterstützt.
Das Modell erstellt möglicherweise nicht genau die Anzahl der Bilder, die Sie anfordern.
Für optimale Ergebnisse mit Gemini 2.5 Flash Image sollten Sie maximal drei Bilder in eine Eingabe einfügen. Für optimale Ergebnisse mit Gemini 3 Pro Image sollten Sie maximal 14 Bilder in eine Eingabe einfügen.
Wenn Sie ein Bild mit Text generieren, generieren Sie zuerst den Text und dann ein Bild mit diesem Text.
Die Bild- oder Texterstellung funktioniert in den folgenden Situationen möglicherweise nicht wie erwartet:
Wenn der Prompt nicht eindeutig ist, generiert das Modell möglicherweise nur Text und kein Bild. Wenn Sie Bilder möchten, müssen Sie in Ihrem Prompt deutlich nach Bildern fragen. Beispiel: „Stelle Bilder zur Verfügung.“
Das Modell kann Text als Bild erstellen. Wenn Sie Text generieren möchten, müssen Sie explizit nach einer Textausgabe fragen. Beispiel: „Erstelle einen narrativen Text mit Illustrationen.“
Das Modell beendet die Generierung von Inhalten möglicherweise, bevor es fertig ist. Wenn das passiert, versuchen Sie es noch einmal oder verwenden Sie einen anderen Prompt.
Wenn ein Prompt potenziell unsicher ist, verarbeitet das Modell die Anfrage möglicherweise nicht und gibt eine Antwort zurück, in der darauf hingewiesen wird, dass es keine unsicheren Bilder erstellen kann. In diesem Fall ist die
FinishReasonSTOP.
Nächste Schritte
Weitere Informationen zur Bildgenerierung mit Gemini finden Sie unter den folgenden Links: