Genera y edita imágenes en Vertex AI

Gemini e Imagen en Vertex AI ofrecen las funciones de IA generativa de imágenes de vanguardia de Google a los desarrolladores de aplicaciones. Con Gemini y Imagen en Vertex AI, los desarrolladores de aplicaciones pueden crear productos de IA de nueva generación que transforman la creatividad de sus usuarios en recursos visuales de alta calidad en segundos.

Prueba la generación de imágenes (Vertex AI Studio)

Probar Imagen en Colab

Con Gemini y Imagen, puedes hacer lo siguiente:

  • Generar imágenes nuevas solo con una instrucción de texto (generación de IA de texto a imagen).
  • Editar o expandir una imagen subida o generada con un área de máscara que definas.
  • Imágenes existentes de alto nivel, generadas o editadas.

Instrucciones para imágenes anteriores

Estas imágenes se generan con el modelo general de generación de imágenes de Imagen 3 (imagen-3.0-generate-002) y las siguientes instrucciones:

  1. Escena de plastilina. Plano medio general de una mujer mayor. Ella viste ropa holgada. Está parada en un jardín exuberante regando las plantas con una regadera naranja
  2. Toma en estilo de cámara réflex digital con el filtro polarizador. Una foto de dos globos aerostáticos sobre las formaciones rocosas únicas de Capadocia, Türkiye. Los colores y los diseños de estos globos contrastan de forma hermosa con los tonos terrosos del paisaje que se ve abajo. Esta toma capta la sensación de aventura que se siente al disfrutar de una experiencia como esta.
  3. Un robot mecánico de madera desgastado y cubierto de enredaderas con flores se encuentra en paz en un campo de flores silvestres altas, con un pequeño pájaro azul descansando en su mano extendida. Caricatura digital, con colores cálidos y líneas suaves. Detrás, se alza un gran acantilado con una cascada.
  4. Vista de la mano de una persona que sostiene una pequeña figura de arcilla de un pájaro y la esculpe con una herramienta de modelado en la otra mano. Puedes ver la bufanda del escultor. Sus manos están cubiertas de de arcilla. Una imagen macro de DSLR que destaca la textura y la artesanía.
  5. Un ramo de flores grande y colorido en un jarrón de vidrio azul antiguo sobre la mesa. En primer plano, se ve una hermosa flor de peonía rodeada de varias otras flores, como rosas, lirios, margaritas, orquídeas, frutas, bayas y hojas verdes. El fondo es gris oscuro. Pintura al óleo en el estilo de la Edad de Oro neerlandesa.
  6. Un solo panel de un cómic en el que se ve a un niño y a su padre en una colina cubierta de césped, mirando el atardecer. Una burbuja de diálogo apunta desde la boca del niño y dice: El sol volverá a salir. Estilo de coloración tenue de finales de la década de 1990

Guía de inicio rápido: Genera imágenes a partir de mensajes de texto con Imagen

Puedes generar imágenes nuevas solo con texto descriptivo como entrada. En los siguientes ejemplos, se muestra un caso simplificado para generar imágenes, pero puedes usar parámetros adicionales para adaptar las imágenes generadas a tus necesidades.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Configura la autenticación para tu entorno.

    Select the tab for how you plan to use the samples on this page:

    Python

    Para usar las muestras de Python de esta página en un entorno de desarrollo local, instala e inicializa gcloud CLI y, luego, configura las credenciales predeterminadas de la aplicación con tus credenciales de usuario.

      Instala Google Cloud CLI.

      Si usas un proveedor de identidad (IdP) externo, primero debes Acceder a gcloud CLI con tu identidad federada.

      If you're using a local shell, then create local authentication credentials for your user account:

      gcloud auth application-default login

      You don't need to do this if you're using Cloud Shell.

      If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.

    Para obtener más información, consulta Configura ADC para un entorno de desarrollo local en la documentación de autenticación de Google Cloud .

    REST

    Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a gcloud CLI.

      Instala Google Cloud CLI.

      Si usas un proveedor de identidad (IdP) externo, primero debes Acceder a gcloud CLI con tu identidad federada.

    Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .

  9. Usa las siguientes muestras para generar una imagen:

    Python

    from google import genai
    from google.genai.types import GenerateImagesConfig
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_file = "output-image.png"
    
    image = client.models.generate_images(
        model="imagen-4.0-generate-001",
        prompt="A dog reading a newspaper",
        config=GenerateImagesConfig(
            image_size="2K",
        ),
    )
    
    image.generated_images[0].image.save(output_file)
    
    print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes")
    # Example response:
    # Created output image using 1234567 bytes
    

    REST

    1. Establece las variables de entorno:

      export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT # Replace with your Google Cloud project
      export GOOGLE_CLOUD_LOCATION=us-central1 # Replace with the appropriate location for your project
                  
    2. Ejecuta lo siguiente:

      curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json; charset=utf-8" \
      "https://${GOOGLE_CLOUD_LOCATION}-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/imagen-4.0-generate-preview-05-20:predict" -d \
      $'{
        "instances": [
          {
            "prompt": "a cat reading a book"
          }
        ],
        "parameters": {
          "sampleCount": 1
        }
      }'
                  

      El modelo devuelve un objeto de bytes de imagen en base64.

    Para obtener más información, consulta la API de Generate images de Imagen.

  10. Versiones del modelo

    Existen varios modelos de generación de imágenes que puedes usar. Para obtener más información, consulta Modelos de Gemini o Modelos de Imagen.

    Probar más ejemplos

    Para obtener una lista completa de los instructivos de notebooks de Jupyter que usan Imagen, consulta el libro de cocina de la IA generativa en Vertex AI.

    Cuándo usar Gemini o Imagen en Vertex AI

    Además de usar las capacidades integradas de generación de imágenes de Gemini, también puedes acceder a Imagen, nuestro modelo especializado de generación de imágenes.

    Atributo Imagen de Gemini Imagen 4
    Ventajas Es la recomendación predeterminada.
    Flexibilidad incomparable, comprensión contextual y edición simple y sin máscaras. Es el único capaz de realizar ediciones conversacionales de varios turnos.
    Mejor calidad y latencia
    Disponibilidad Disponible de manera general Disponible de manera general
    Latencia Mayor. Se requiere más procesamiento para sus capacidades avanzadas. Baja. Optimizado para un rendimiento casi en tiempo real.
    Costo Precios basados en tokens Son rentables para tareas especializadas.
    Tareas recomendadas
    • Generación de imágenes y texto intercalados para combinar imágenes y texto sin problemas
    • Combina elementos creativos de varias imágenes con una sola instrucción.
    • Realiza ediciones muy específicas en las imágenes, modifica elementos individuales con comandos de lenguaje simples y trabaja en una imagen de forma iterativa.
    • Aplica un diseño o una textura específicos de una imagen a otra y conserva la forma y los detalles del sujeto original.
    • La calidad de la imagen, el fotorrealismo, los detalles artísticos o los estilos específicos (por ejemplo, el impresionismo y el anime) son las principales prioridades.
    • Infunde la marca, el estilo o genera logotipos y diseños de productos.
    • Generar ortografía o tipografía avanzadas

    Gemini es el modelo ideal para comenzar a generar imágenes. Elige Imagen 4 Ultra para casos de uso avanzados o cuando necesites la mejor calidad de imagen (ten en cuenta que solo puede generar una imagen a la vez).

    ¿Qué sigue?

    Usa los siguientes vínculos para ver la documentación de la función.

    Crédito de la imagen: Todas las imágenes generadas con Imagen en Vertex AI.