Gemini 2.5 Flash Image admite varios tipos de edición de imágenes.
Edición de imágenes
Gemini 2.5 Flash Image para la generación de imágenes (gemini-2.5-flash-image
) admite la capacidad de editar imágenes además de generarlas. Gemini 2.5 Flash Image admite la edición mejorada de imágenes y la edición en varios turnos, y contiene filtros de seguridad actualizados que brindan una experiencia del usuario más flexible y menos restrictiva.
Admite las siguientes modalidades y capacidades:
Edición de imágenes (texto a imagen y de imagen a imagen)
- Ejemplo de instrucción: “Edita esta imagen para que parezca una caricatura”.
- Ejemplo de instrucción: [Imagen de un gato] + [Imagen de una almohada] + "Crea un punto de cruz de mi gato en esta almohada".
Edición de imágenes de varios turnos (chat)
- Ejemplos de instrucciones: [Sube una imagen de un auto azul]. "Convierte este auto en un convertible". "Ahora cambia el color a amarillo". “Agrega un spoiler”.
Cómo editar una imagen
Console
Para editar imágenes, haz lo siguiente:
- Abre Vertex AI Studio > Crear instrucción.
-
Haz clic en Cambiar modelo y selecciona
gemini-2.5-flash-image
en el menú. - En el panel Salidas, selecciona Imagen y texto en el menú desplegable.
- Haz clic en Insertar medios ( ) y selecciona una fuente en el menú. Luego, sigue las instrucciones del diálogo.
- Escribe los cambios que quieres realizar en la imagen en el área de texto Escribe una instrucción.
- Haz clic en el botón Instrucción ( ).
Gemini generará una versión editada de la imagen proporcionada según tu descripción. Este proceso debería tardar unos segundos, pero puede ser comparativamente más lento según la capacidad.
Python
Instalar
pip install --upgrade google-genai
Para obtener más información, consulta la documentación de referencia del SDK.
Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
Obtén más información para instalar o actualizar Java.
Para obtener más información, consulta la documentación de referencia del SDK.
Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Ejecuta el siguiente comando en la terminal para crear o reemplazar este archivo en el directorio actual:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{"file_data": {
"mime_type": "image/jpg",
"file_uri": "<var>FILE_NAME</var>"
}
},
{"text": "Convert this photo to black and white, in a cartoonish style."},
]
},
"generation_config": {
"response_modalities": ["TEXT", "IMAGE"],
"image_config": {
"aspect_ratio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini generará una imagen según tu descripción. Este proceso debería tardar unos segundos, pero puede ser comparativamente más lento según la capacidad.
Edición de imágenes de varios turnos
Gemini 2.5 Flash Image también admite una edición de varios turnos mejorada, lo que te permite responder al modelo con cambios después de recibir una respuesta de imagen editada. Esto te permitirá seguir editando la imagen de forma conversacional.
Ten en cuenta que se recomienda limitar el tamaño total del archivo de solicitud a un máximo de 50 MB.
Para probar la edición de imágenes en varios turnos, prueba nuestro notebook de Gemini 2.5 Flash Image.