Genera imágenes a partir de instrucciones de texto con Imagen en Vertex AI

Precaución: Los siguientes modelos de vista previa de Imagen 4 se quitarán el 30 de noviembre de 2025: imagen-4.0-generate-preview-06-06, imagen-4.0-ultra-generate-preview-06-06 y imagen-4.0-fast-generate-preview-06-06. Para evitar interrupciones en el servicio, migra todos los flujos de trabajo que usen modelos de vista previa de Imagen 4 antes del 30 de noviembre de 2025 a los siguientes modelos de Imagen 4 disponibles de forma general: imagen-4.0-generate-001, imagen-4.0-ultra-generate-001 y imagen-4.0-fast-generate-001.

Puedes usar Imagen en Vertex AI para generar imágenes nuevas a partir de una instrucción de texto. Las interfaces compatibles incluyen la consola Google Cloud y la API de Vertex AI.

Si deseas obtener más información sobre cómo escribir mensajes de texto para la generación y edición de imágenes, consulta la guía de instrucciones.

Consulta la tarjeta del modelo de Imagen for Generation

Prueba la generación de imágenes (Vertex AI Studio)

Probar Imagen en Colab

Antes de comenzar

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Configura la autenticación para tu entorno.

Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Python

Para usar las muestras de Python incluidas en esta página en un entorno de desarrollo local, instala e inicializa la gcloud CLI y, luego, configura las credenciales predeterminadas de la aplicación con tus credenciales de usuario.
Para obtener más información, consulta Configura ADC para un entorno de desarrollo local en la documentación de autenticación de Google Cloud .
REST

Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .
Genera imágenes con texto

Puedes generar imágenes nuevas solo con texto descriptivo como entrada. En los siguientes ejemplos, se muestran instrucciones básicas para generar imágenes.

Importante: imagen-4.0-fast-generate-001 puede generar resultados no deseados si la instrucción es compleja y usas instrucciones mejoradas. Para corregir este problema, evita usar Ayúdame a escribir en la consola de Google Cloud o configura enhancePrompt como false.
Console
1. En la consola de Google Cloud , ve a la página Vertex AI > Media Studio.
<a href="https://console.cloud.google.com/vertex-ai/studio/media/generate;tab=image" class="button button-primary" target="console" track-name="consoleLink" track-type="task">Go to Media Studio</a>
1. Haz clic en Imagen. Se mostrará la página de generación de imágenes de Imagen Media Studio.
2. Opcional: En el panel Configuración, establece los siguientes parámetros:
  
  Modelo: Elige un modelo entre las opciones disponibles.
  
  Para obtener más información sobre los modelos disponibles, consulta Modelos de Imagen.
  
  Relación de aspecto: Elige una relación de aspecto entre las opciones disponibles.
  
  Cantidad de resultados: Ajusta el control deslizante o ingresa un valor entre 1 y 4.
  
  Resolución de salida: Elige una resolución entre las opciones disponibles.
3. Opcional: En la sección Opciones avanzadas, selecciona una Región en la que generar tus imágenes.
4. En el cuadro Escribe tu instrucción, ingresa la instrucción de texto que describe las imágenes que se generarán. Por ejemplo, barco pequeño en el agua en la ilustración de acuarela matutina.
  
  Para obtener más información sobre cómo escribir instrucciones eficaces, consulta la Guía de atributos de imágenes e instrucciones.
5. Haz clic en Generar .
Se agrega automáticamente una marca de agua digital a las imágenes generadas. No puedes inhabilitar la marca de agua digital para la generación de imágenes con la consola de Google Cloud .

Puedes seleccionar una imagen para verla en la ventana Detalles de la imagen. Las imágenes con marcas de agua contienen una insignia de marca de agua digital. También puedes verificar de manera explícita una marca de agua de imagen.

^{Detalles de la imagen vista de una imagen con marca de agua
generada con Imagen 2 a partir de la instrucción: pequeño
barco rojo en el agua en la ilustración de acuarela matutina con
colores apagados.}
Python

Instalar
pip install --upgrade google-genai
Para obtener más información, consulta la documentación de referencia del SDK.

Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
En este ejemplo, se llama al método generate_images en ImageGenerationModel y se guardan las imágenes generadas de forma local. Luego, de forma opcional, puedes usar el método show() en un notebook para mostrar las imágenes generadas. Para obtener más información sobre las versiones y las características de los modelos, consulta Modelos de Imagen.
from google import genai from google.genai.types import GenerateImagesConfig client = genai.Client() # TODO(developer): Update and un-comment below line # output_file = "output-image.png" image = client.models.generate_images( model="imagen-4.0-generate-001", prompt="A dog reading a newspaper", config=GenerateImagesConfig( image_size="2K", ), ) image.generated_images[0].image.save(output_file) print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes") # Example response: # Created output image using 1234567 bytes
REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
- REGION: Es la región en la que se encuentra tu proyecto. Para obtener más información sobre las regiones admitidas, consulta Ubicaciones de la IA generativa en Vertex AI.
- PROJECT_ID: Es el Google Cloud ID del proyecto.
- MODEL_VERSION: Es la versión del modelo Imagen que se usará. Para obtener más información sobre los modelos disponibles, consulta Modelos de Imagen.
- TEXT_PROMPT: Es la instrucción de texto que guía qué imágenes genera el modelo. Este campo es obligatorio para la generación y la edición.
- IMAGE_COUNT: Es la cantidad de imágenes que se generarán. El rango de valores aceptado es de 1 a 4.
Método HTTP y URL:
POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict
Cuerpo JSON de la solicitud:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Para enviar tu solicitud, elige una de estas opciones:
curl

Nota: Con el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login, o a través del uso de Cloud Shell, que accede de forma automática a la CLI de gcloud. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Nota: En el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login . Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La siguiente respuesta de muestra es para una solicitud con "sampleCount": 2. La respuesta muestra dos objetos de predicción, con los bytes de imagen generados codificados en base64.
{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Si usas un modelo que admite la mejora de instrucciones, la respuesta incluye un campo prompt adicional con la instrucción mejorada que se usó para la generación:
{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
¿Qué sigue?

Lee artículos sobre Imagen y otros productos de IA generativa en Vertex AI:

Genera imágenes a partir de instrucciones de texto con Imagen en Vertex AI Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Antes de comenzar

Console

Python

REST

Genera imágenes con texto

Console

Python

Instalar

REST

curl

PowerShell

¿Qué sigue?

Genera imágenes a partir de instrucciones de texto con Imagen en Vertex AI