API de ampliação da Imagen

Versões de modelo compatíveis

O aumento da resolução do Imagen é compatível com os seguintes modelos:

imagen-4.0-upscale-preview

Para mais informações sobre os recursos compatíveis com o modelo, consulte Modelos do Imagen.

Solicitação HTTP

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

Instâncias

Instâncias
Campo de união `image`. A imagem que você está aprimorando. É possível fornecer uma string `bytesBase64Encoded` que codifica uma imagem ou um URI de string `gcsUri` para um local do bucket do Cloud Storage.
`bytesBase64Encoded`	`string` Uma string de bytes codificada em base64 de uma imagem ou um arquivo de vídeo.
`gcsUri`	`string` Um URI de string para um local de bucket do Cloud Storage.

Campo de união image.

A imagem que você está aprimorando. É possível fornecer uma string bytesBase64Encoded que codifica uma imagem ou um URI de string gcsUri para um local do bucket do Cloud Storage.

bytesBase64Encoded

string

Uma string de bytes codificada em base64 de uma imagem ou um arquivo de vídeo.

gcsUri

string

Um URI de string para um local de bucket do Cloud Storage.

Parâmetros

Parâmetros
`mode`	`string` Obrigatório. Para solicitações de ampliação, transmita a string `"upscale"`.
`storageUri`	`string` Opcional. Um URI de string para um local de bucket do Cloud Storage usado para armazenar as imagens geradas. Se um bucket do Cloud Storage não for fornecido, os bytes de imagem codificados em base64 serão retornados na resposta.
`outputOptions`	`outputOptions` Opcional. Descreve o formato da imagem de saída em um objeto `outputOptions`.
`upscaleConfig.upscaleFactor`	`string` O fator de escalonamento da imagem ampliada. Os valores a seguir são aceitos: `"x2"` `"x3"` `"x4"`

Objeto de opções de saída

O objeto outputOptions descreve a saída da imagem.

Parâmetros

Parâmetros
`outputOptions.mimeType`	Opcional: `string` O formato de saída da imagem. Os valores a seguir são compatíveis: `"image/png"`: salvar como imagem PNG. `"image/jpeg"`: salve como uma imagem JPEG. O valor padrão é `"image/png"`.
`outputOptions.compressionQuality`	Opcional: `int` O nível de compactação se o tipo de saída for `"image/jpeg"`. Os valores aceitos são `0`- `100`. O valor padrão é `75`.

outputOptions.mimeType

Opcional: string

O formato de saída da imagem. Os valores a seguir são compatíveis:

"image/png": salvar como imagem PNG.
"image/jpeg": salve como uma imagem JPEG.

O valor padrão é "image/png".

outputOptions.compressionQuality

Opcional: int

O nível de compactação se o tipo de saída for "image/jpeg". Os valores aceitos são 0- 100. O valor padrão é 75.

Exemplo de solicitação

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

REGION: a região em que o projeto está localizado. Para mais informações sobre as regiões com suporte, consulte Locais da IA generativa na Vertex AI.
PROJECT_ID: o ID do projeto do Google Cloud .
BASE64_SUBJECT_IMAGE: uma imagem codificada em base64 do assunto.
ADD_WATERMARK: um valor booleano opcional. Defina como true para ativar imagens com marca-d'água ou false para desativar. O valor padrão é true.
GCS_IMAGE_PATH: Um caminho do Cloud Storage para um arquivo de imagem.
GCS_OUTPUT_PATH: o caminho do Cloud Storage para armazenar a saída gerada.
OUTPUT_MIMETYPE: uma string opcional que define o tipo de arquivo de saída da imagem. Os valores a seguir são aceitos: "image/png" ou "image/jpeg". O padrão é "image/png".
COMPRESSION_QUALITY: um valor inteiro opcional que especifica o nível de detalhes que o modelo preserva para imagens JPEG. O seguinte intervalo de valores é aceito: 0 - 100. O valor mais alto especifica um nível de compactação maior. O padrão é 75.
UPSCALE_FACTOR: O fator de escalonamento da imagem aprimorada. A resolução final da imagem após a aplicação do fator de ampliação não pode exceder 17 megapixels. São aceitos os seguintes valores:
- "x2"
- "x3"
- "x4"

Método HTTP e URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

Corpo JSON da solicitação:

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Observação: o comando a seguir pressupõe que você tenha feito login na gcloud CLI com sua conta de usuário executando gcloud init ou gcloud auth login ou usando o Cloud Shell, que faz login automaticamente na gcloud CLI. Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando abaixo:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

Observação: o comando a seguir pressupõe que você fez login na gcloud CLI com sua conta de usuário executando gcloud init ou gcloud auth login. Para saber qual é a conta ativa no momento, execute o comando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando abaixo:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content

A solicitação retorna um objeto de imagem. Neste exemplo, um objeto de imagem é retornado como um objeto de previsão com uma imagem codificada em base64.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

API de ampliação da Imagen Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Versões de modelo compatíveis

Solicitação HTTP

Instâncias

Parâmetros

Objeto de opções de saída

Exemplo de solicitação

REST

curl

PowerShell

API de ampliação da Imagen