API de ampliação da Imagen

Versões de modelo compatíveis

O aumento da resolução do Imagen é compatível com os seguintes modelos:

  • imagen-4.0-upscale-preview

Para mais informações sobre os recursos compatíveis com o modelo, consulte Modelos do Imagen.

Solicitação HTTP

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

Instâncias

Instâncias

Campo de união image.

A imagem que você está aprimorando. É possível fornecer uma string bytesBase64Encoded que codifica uma imagem ou um URI de string gcsUri para um local do bucket do Cloud Storage.

bytesBase64Encoded

string

Uma string de bytes codificada em base64 de uma imagem ou um arquivo de vídeo.

gcsUri

string

Um URI de string para um local de bucket do Cloud Storage.

Parâmetros

Parâmetros
mode

string

Obrigatório. Para solicitações de aumento de resolução, transmita a string "upscale".

storageUri

string

Opcional. Um URI de string para um local de bucket do Cloud Storage usado para armazenar as imagens geradas. Se um bucket do Cloud Storage não for fornecido, os bytes de imagem codificados em base64 serão retornados na resposta.

outputOptions

outputOptions

Opcional. Descreve o formato da imagem de saída em um objeto outputOptions.

upscaleConfig.upscaleFactor

string

O fator de escalonamento da imagem ampliada. Os valores a seguir são aceitos:

  • "x2"
  • "x3"
  • "x4"

Objeto de opções de saída

O objeto outputOptions descreve a saída da imagem.

Parâmetros
outputOptions.mimeType

Opcional: string

O formato de saída da imagem. Os valores a seguir são compatíveis:

  • "image/png": salvar como imagem PNG.
  • "image/jpeg": salve como uma imagem JPEG.

O valor padrão é "image/png".

outputOptions.compressionQuality

Opcional: int

O nível de compactação se o tipo de saída for "image/jpeg". Os valores aceitos são 0- 100. O valor padrão é 75.

Exemplo de solicitação

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

  • REGION: a região em que o projeto está localizado. Para mais informações sobre as regiões com suporte, consulte Locais da IA generativa na Vertex AI.
  • PROJECT_ID: o ID do projeto do Google Cloud .
  • BASE64_SUBJECT_IMAGE: uma imagem codificada em base64 do assunto.
  • ADD_WATERMARK: um valor booleano opcional. Defina como true para ativar imagens com marca-d'água ou false para desativar. O valor padrão é true.
  • GCS_IMAGE_PATH: Um caminho do Cloud Storage para um arquivo de imagem.
  • GCS_OUTPUT_PATH: o caminho do Cloud Storage para armazenar a saída gerada.
  • OUTPUT_MIMETYPE: uma string opcional que define o tipo de arquivo de saída da imagem. Os valores a seguir são aceitos: "image/png" ou "image/jpeg". O padrão é "image/png".
  • COMPRESSION_QUALITY: um valor inteiro opcional que especifica o nível de detalhes que o modelo preserva para imagens JPEG. O seguinte intervalo de valores é aceito: 0 - 100. O valor mais alto especifica um nível de compactação maior. O padrão é 75.
  • UPSCALE_FACTOR: O fator de escalonamento da imagem aprimorada. A resolução final da imagem após a aplicação do fator de ampliação não pode exceder 17 megapixels. São aceitos os seguintes valores:
    • "x2"
    • "x3"
    • "x4"

Método HTTP e URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

Corpo JSON da solicitação:

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando abaixo:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando abaixo:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
A solicitação retorna um objeto de imagem. Neste exemplo, um objeto de imagem é retornado como um objeto de previsão com uma imagem codificada em base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}