API Imagen upscale

Versões de modelos suportadas

O aumento da escala do Imagen é compatível com os seguintes modelos:

  • imagen-4.0-upscale-preview

Para mais informações sobre as funcionalidades suportadas pelo modelo, consulte os modelos do Imagen.

Pedido HTTP

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

Instâncias

Instâncias

Campo de união image.

A imagem que está a redimensionar. Pode fornecer uma string bytesBase64Encoded que codifica uma imagem ou um URI de string gcsUri para uma localização do contentor do Cloud Storage.

bytesBase64Encoded

string

Uma string codificada em base64 de bytes de um ficheiro de imagem ou vídeo.

gcsUri

string

Um URI de string para uma localização de contentor do Cloud Storage.

Parâmetros

Parâmetros
mode

string

Obrigatório. Para pedidos de aumento de escala, transmita a string "upscale".

storageUri

string

Opcional. Um URI de string para uma localização do contentor do Cloud Storage que é usado para armazenar as imagens geradas. Se não for fornecido um contentor do Cloud Storage, são devolvidos bytes de imagem codificados em base64 na resposta.

outputOptions

outputOptions

Opcional. Descreve o formato da imagem de saída num outputOptions objeto.

upscaleConfig.upscaleFactor

string

O fator de escalabilidade da imagem redimensionada. Os seguintes valores são aceites:

  • "x2"
  • "x3"
  • "x4"

Objeto de opções de saída

O objeto outputOptions descreve a saída da imagem.

Parâmetros
outputOptions.mimeType

Opcional: string

O formato de saída da imagem. Os seguintes valores são suportados:

  • "image/png": guarde como uma imagem PNG.
  • "image/jpeg": guarde como imagem JPEG.

O valor predefinido é "image/png".

outputOptions.compressionQuality

Opcional: int

O nível de compressão se o tipo de saída for "image/jpeg". Os valores aceites são 0- 100. O valor predefinido é 75.

Exemplo de pedido

REST

Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:

  • REGION: a região onde o seu projeto está localizado. Para mais informações sobre as regiões suportadas, consulte o artigo Localizações da IA generativa no Vertex AI.
  • PROJECT_ID: o ID do seu projeto Google Cloud .
  • BASE64_SUBJECT_IMAGE: uma imagem com codificação base64 da imagem do objeto.
  • ADD_WATERMARK: um valor booleano opcional. Defina como true para ativar imagens com marca de água ou false para desativar imagens com marca de água. O valor predefinido é true.
  • GCS_IMAGE_PATH: Um caminho do Cloud Storage para um ficheiro de imagem.
  • GCS_OUTPUT_PATH: o caminho do Cloud Storage para armazenar o resultado gerado.
  • OUTPUT_MIMETYPE: uma string opcional que define o tipo de ficheiro de saída da imagem. Os seguintes valores são aceites: "image/png" ou "image/jpeg". A predefinição é "image/png".
  • COMPRESSION_QUALITY: um valor inteiro opcional que especifica o nível de detalhe que o modelo preserva para imagens JPEG. O seguinte intervalo de valores é aceite: 0 - 100. O valor mais elevado especifica um nível de compressão mais elevado. A predefinição é 75.
  • UPSCALE_FACTOR: O fator de escalabilidade da imagem com melhoramento. A resolução de saída final da imagem após a aplicação do fator de aumento não pode exceder 17 megapíxeis. Os seguintes valores são aceites:
    • "x2"
    • "x3"
    • "x4"

Método HTTP e URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

Corpo JSON do pedido:

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Para enviar o seu pedido, escolha uma destas opções:

curl

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
O pedido devolve um objeto de imagem. Neste exemplo, um objeto de imagem é devolvido como um objeto de previsão com uma imagem codificada em base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}