Limitaciones de la generación de imágenes de Gemini

La generación de imágenes con Gemini está sujeta a las siguientes limitaciones:

  • Para obtener el mejor rendimiento con Gemini 2.5 Flash Image, usa los siguientes idiomas: EN, es-MX, ja-JP, zh-CN o hi-IN. Para obtener el mejor rendimiento con Gemini 3 Pro Image, usa los siguientes idiomas: ar-EG, de-DE, EN, es-MX, fr-FR, hi-IN, id-ID, it-IT, ja-JP, ko-KR, pt-BR, ru-RU, ua-UA, vi-VN y zh-CN.

  • La generación de imágenes no admite entradas de audio ni video.

  • Es posible que el modelo no cree la cantidad exacta de imágenes que solicitaste.

  • Para obtener los mejores resultados con Gemini 2.5 Flash Image, incluye un máximo de tres imágenes en una entrada. Para obtener los mejores resultados con Gemini 3 Pro Image, incluye un máximo de 14 imágenes en una entrada.

  • Cuando generes una imagen que contenga texto, primero genera el texto y, luego, genera una imagen con ese texto.

  • Es posible que la generación de imágenes o texto no funcione según lo esperado en las siguientes situaciones:

    • Si la instrucción es ambigua, es posible que el modelo solo cree texto y no imágenes. Si quieres imágenes, pídelas claramente en tu solicitud. Por ejemplo, "proporciona imágenes a medida que avanzas".

    • El modelo podría crear texto como una imagen. Para generar texto, pide específicamente una salida de texto. Por ejemplo, "genera texto narrativo junto con ilustraciones".

    • El modelo podría dejar de generar contenido incluso cuando no haya terminado. Si esto ocurre, vuelve a intentarlo o usa una instrucción diferente.

    • Si una instrucción es potencialmente insegura, es posible que el modelo no procese la solicitud y devuelva una respuesta que indique que no puede crear imágenes inseguras. En este caso, el FinishReason es STOP.

Próximos pasos

Consulta los siguientes vínculos para obtener más información sobre la generación de imágenes con Gemini: