Limitações da geração de imagens do Gemini

A geração de imagens do Gemini está sujeita às seguintes limitações:

  • Para ter o melhor desempenho com a imagem do Gemini 2.5 Flash, use os seguintes idiomas: EN, es-MX, ja-JP, zh-CN ou hi-IN. Para ter a melhor performance com o Gemini 3 Pro Image, use os seguintes idiomas: ar-EG, de-DE, EN, es-MX, fr-FR, hi-IN, id-ID, it-IT, ja-JP, ko-KR, pt-BR, ru-RU, ua-UA, vi-VN e zh-CN

  • A geração de imagens não aceita entradas de áudio ou vídeo.

  • O modelo pode não criar o número exato de imagens que você pediu.

  • Para ter os melhores resultados com o Gemini 2.5 Flash Image, inclua no máximo três imagens em uma entrada. Para ter os melhores resultados com o Gemini 3 Pro Image, inclua no máximo 14 imagens em uma entrada.

  • Ao gerar uma imagem com texto, primeiro gere o texto e depois gere uma imagem com esse texto.

  • A geração de imagens ou texto pode não funcionar como esperado nestas situações:

    • O modelo só vai criar texto e não imagens se o comando for ambíguo. Se você quiser imagens, peça isso de forma clara. Por exemplo, "forneça imagens à medida que avança".

    • O modelo pode criar texto como uma imagem. Para gerar texto, peça especificamente uma saída de texto. Por exemplo, "gere texto narrativo com ilustrações".

    • O modelo pode parar de gerar conteúdo mesmo quando não tiver terminado. Se isso acontecer, tente de novo ou use outro comando.

    • Se um comando for potencialmente não seguro, o modelo poderá não processar a solicitação e retornar uma resposta indicando que não é possível criar imagens não seguras. Nesse caso, o FinishReason é STOP.

A seguir

Consulte os links a seguir para mais informações sobre a geração de imagens do Gemini: