Prácticas recomendadas para la generación de imágenes con Gemini

Para mejorar los resultados de la generación de imágenes, sigue estas prácticas recomendadas:

  • Sé específico: Cuantos más detalles brindes, más control tendrás. Por ejemplo, en lugar de "armadura de fantasía", prueba con "armadura de placas élfica ornamentada, grabada con patrones de hojas de plata, con un cuello alto y hombreras con forma de alas de halcón".

  • Proporciona contexto y la intención: Explica el propósito de la imagen para ayudar al modelo a comprender el contexto. Por ejemplo, "Crea un logotipo para una marca de cuidado de la piel minimalista y de alta gama" funciona mejor que "Crea un logotipo".

  • Itera y define mejor: No esperes obtener una imagen perfecta en el primer intento. Usa instrucciones de seguimiento para realizar pequeños cambios, por ejemplo, "Haz que la iluminación sea más cálida" o "Cambia la expresión del personaje para que sea más seria".

  • Usa instrucciones paso a paso: Para las escenas complejas, divide tu solicitud en pasos. Por ejemplo, "Primero, crea un fondo de un bosque sereno y brumoso al amanecer. Luego, en primer plano, agrega un antiguo altar de piedra cubierto de musgo. Por último, coloca una espada brillante sobre el altar".

  • Describe lo que quieres, no lo que no quieres: En lugar de decir "sin autos", describe la escena de forma positiva diciendo "una calle vacía y desierta sin señales de tráfico".

  • Controlar la cámara: Guía la vista de la cámara. Usa términos fotográficos y cinematográficos para describir la composición, por ejemplo, "toma gran angular", "toma macro" o "perspectiva de ángulo bajo".

  • Instrucciones para generar imágenes: Describe la intención con frases como "crea una imagen de" o "genera una imagen de". De lo contrario, el modelo multimodal podría responder con texto en lugar de la imagen.

  • Pasa Firmas de pensamiento: Cuando uses Gemini 3 Pro Image, te recomendamos que pases firmas de pensamiento al modelo durante la creación y edición de imágenes en varios turnos. Esto te permite conservar el contexto de razonamiento en las interacciones. Para ver muestras de código relacionadas con la edición de imágenes de varios turnos con Gemini 3 Pro Image, consulta Ejemplo de edición de imágenes de varios turnos con firmas de pensamiento.

Próximos pasos

Consulta los siguientes vínculos para obtener más información sobre la generación de imágenes con Gemini: