Gerar e editar imagens na Vertex AI

O Gemini e o Imagen na Vertex AI oferecem recursos de IA generativa de imagem de última geração do Google para desenvolvedores de aplicativos. Com o Gemini e o Imagen na Vertex AI, os desenvolvedores de aplicativos podem criar produtos de IA de última geração que transformam a imaginação do usuário em recursos visuais de alta qualidade usando geração de IA, em segundos.

Testar a geração de imagens (Vertex AI Studio)

Testar o Imagen em um Colab

Com o Gemini e o Imagen, você pode fazer o seguinte:

  • Gere novas imagens usando apenas um comando de texto (conversão de texto em imagem de IA).
  • Edite ou expanda uma imagem enviada ou gerada usando uma área de máscara definida por você.
  • Imagens de luxo existentes, geradas ou editadas.

Comandos para imagens anteriores

Essas imagens são geradas usando o modelo geral de geração de imagens do Imagen 3 (imagen-3.0-generate-002) e os seguintes comandos:

  1. Cena de animação com massinha de modelar. Um plano médio de uma mulher idosa. Ela está usando roupas leves. Ela está em um jardim exuberante regando as plantas com um regador laranja
  2. Foto no estilo de uma câmera DSLR com filtro polarizador. Uma foto de dois balões de ar quente sobre as formações rochosas únicas da Capadócia, na Turquia. As cores e os padrões desses balões contrastam lindamente com os tons terrosos da paisagem abaixo. Essa foto captura a sensação de aventura que vem com uma experiência como essa.
  3. Um robô mech de madeira desgastado coberto de trepadeiras floridas fica em paz em um campo de flores silvestres altas, com um pequeno pássaro azul descansando na mão estendida. Desenho digital com cores quentes e linhas suaves. Um grande penhasco com uma cachoeira ao fundo.
  4. Uma mão segurando uma pequena figura de argila de um pássaro e esculpindo com uma ferramenta de modelagem na outra mão. É possível ver o cachecol do escultor. As mãos estão cobertas de pó de argila. Uma imagem macro de DSLR destacando a textura e o acabamento.
  5. Um buquê grande e colorido de flores em um vaso de vidro azul antigo sobre a mesa. Na frente, há uma linda peônia cercada por várias outras flores, como rosas, lírios, margaridas, orquídeas, frutas, bagas e folhas verdes. O fundo é cinza-escuro. Pintura a óleo no estilo da Era de Ouro holandesa.
  6. Um único quadrinho de um menino e o pai dele em uma colina gramada, olhando para o pôr do sol. Um balão de diálogo aponta da boca do menino e diz: O sol vai nascer de novo. Estilo de cores suaves do fim dos anos 1990

Guia de início rápido: gerar imagens com base em solicitações de texto usando o Imagen

Você pode gerar novas imagens usando apenas texto descritivo como entrada. Os exemplos a seguir mostram um caso simplificado de geração de imagens, mas é possível usar parâmetros adicionais para adaptar as imagens geradas às suas necessidades.

  1. Faça login na sua conta do Google Cloud . Se você começou a usar o Google Cloud, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Configure a autenticação do ambiente.

    Selecione a guia para como planeja usar as amostras nesta página:

    Python

    Para usar os exemplos do Python nesta página em um ambiente de desenvolvimento local, instale e inicialize a CLI gcloud e configure o Application Default Credentials com suas credenciais de usuário.

    1. Instale a CLI do Google Cloud.

    2. Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.

    3. Se você estiver usando um shell local, crie credenciais de autenticação local para sua conta de usuário:

      gcloud auth application-default login

      Não é necessário fazer isso se você estiver usando o Cloud Shell.

      Se um erro de autenticação for retornado e você estiver usando um provedor de identidade (IdP) externo, confirme se você fez login na CLI gcloud com sua identidade federada.

    Para mais informações, consulte Configurar o ADC para um ambiente de desenvolvimento local na documentação de autenticação do Google Cloud .

    REST

    Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.

      Instale a CLI do Google Cloud.

      Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.

    Saiba mais em Autenticar para usar REST na documentação de autenticação do Google Cloud .

  9. Use os exemplos a seguir para gerar uma imagem:

    Python

    from google import genai
    from google.genai.types import GenerateImagesConfig
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_file = "output-image.png"
    
    image = client.models.generate_images(
        model="imagen-4.0-generate-001",
        prompt="A dog reading a newspaper",
        config=GenerateImagesConfig(
            image_size="2K",
        ),
    )
    
    image.generated_images[0].image.save(output_file)
    
    print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes")
    # Example response:
    # Created output image using 1234567 bytes
    

    REST

    1. Defina as variáveis de ambiente:

      export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT # Replace with your Google Cloud project
      export GOOGLE_CLOUD_LOCATION=us-central1 # Replace with the appropriate location for your project
                  
    2. Execute o comando a seguir:

      curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json; charset=utf-8" \
      "https://${GOOGLE_CLOUD_LOCATION}-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/imagen-4.0-generate-preview-05-20:predict" -d \
      $'{
        "instances": [
          {
            "prompt": "a cat reading a book"
          }
        ],
        "parameters": {
          "sampleCount": 1
        }
      }'
                  

      O modelo retorna um objeto de bytes de imagem base64.

    Para mais informações, consulte a API Generate images da Imagen.

Quando usar o Gemini ou o Imagen na Vertex AI

Além de usar os recursos integrados de geração de imagens do Gemini, você também pode acessar o Imagen, nosso modelo especializado de geração de imagens.

Atributo Imagem do Gemini Imagen 4
Pontos fortes Recomendação padrão.
Flexibilidade incomparável, compreensão contextual e edição sem máscara. Capacidade única de edição conversacional em vários turnos.
Melhor qualidade/latência
Disponibilidade Disponibilidade geral Disponibilidade geral
Latência Alto. Mais computação é necessária para os recursos avançados. Baixa. Otimizado para desempenho quase em tempo real.
Custo Preços baseados em token. Econômico para tarefas especializadas.
Tarefas recomendadas
  • Geração de texto e imagens intercaladas para combinar texto e imagens de forma integrada.
  • Combinar elementos criativos de várias imagens com um único comando.
  • Faça edições altamente específicas em imagens, modifique elementos individuais com comandos de linguagem e trabalhe de forma iterativa em uma imagem.
  • Aplique um design ou uma textura específica de uma imagem a outra, preservando a forma e os detalhes do assunto original.
  • Qualidade da imagem, fotorrealismo, detalhes artísticos ou estilos específicos (por exemplo, impressionismo e anime) são prioridades máximas.
  • Infundir branding, estilo ou gerar logotipos e designs de produtos.
  • Gerar ortografia ou tipografia avançada.

Recomendamos o Gemini como ponto de partida para gerar imagens. Escolha o Imagen 4 Ultra para casos de uso avançados ou quando você precisar da melhor qualidade de imagem.

Versões do modelo

Há vários modelos de geração de imagens que podem ser usados. Para mais informações, consulte Modelos do Gemini ou Modelos do Imagen.

Testar mais exemplos

Para conferir uma lista completa de tutoriais de notebooks Jupyter usando o Imagen, consulte o manual de IA generativa na Vertex AI.

A seguir

Use os links a seguir para acessar a documentação do recurso.

Crédito da imagem: todas as imagens geradas usando o Imagen na Vertex AI.