API Imagen upscale

Versiones de modelo admitidas

Imagen upscale admite los siguientes modelos:

  • imagen-4.0-upscale-preview

Para obtener más información sobre las funciones que admite el modelo, consulta Modelos de imagen.

Solicitud HTTP

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

Instancias

Instancias

Campo de unión image.

La imagen que quieres ampliar. Puede proporcionar una cadena bytesBase64Encoded que codifique una imagen o una cadena gcsUri URI a una ubicación de segmento de Cloud Storage.

bytesBase64Encoded

string

Una cadena codificada en base64 de bytes de una imagen o un archivo de vídeo.

gcsUri

string

URI de cadena de una ubicación de un segmento de Cloud Storage.

Parámetros

Parámetros
mode

string

Obligatorio. Para las solicitudes de mejora de la calidad, pasa la cadena "upscale".

storageUri

string

Opcional. URI de cadena de una ubicación de un segmento de Cloud Storage que se usa para almacenar las imágenes generadas. Si no se proporciona un segmento de Cloud Storage, se devuelven bytes de imagen codificados en Base64 en la respuesta.

outputOptions

outputOptions

Opcional. Describe el formato de la imagen de salida en un outputOptions objeto.

upscaleConfig.upscaleFactor

string

Factor de escala de la imagen ampliada. Se aceptan los siguientes valores:

  • "x2"
  • "x3"
  • "x4"

Objeto de opciones de salida

El objeto outputOptions describe la salida de la imagen.

Parámetros
outputOptions.mimeType

Opcional: string

El formato de salida de la imagen. Se admiten los siguientes valores:

  • "image/png": guardar como imagen PNG.
  • "image/jpeg": guarda la imagen como JPEG.

El valor predeterminado es "image/png".

outputOptions.compressionQuality

Opcional: int

El nivel de compresión si el tipo de salida es "image/jpeg". Los valores aceptados son 0- 100. El valor predeterminado es 75.

Solicitud de ejemplo

REST

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • REGION: la región en la que se encuentra tu proyecto. Para obtener más información sobre las regiones admitidas, consulta Ubicaciones de la IA generativa en Vertex AI.
  • PROJECT_ID: tu ID de proyecto. Google Cloud
  • BASE64_SUBJECT_IMAGE: una imagen codificada en Base64 de la imagen del sujeto.
  • ADD_WATERMARK: valor booleano opcional. Seleccione true para habilitar las imágenes con marca de agua o false para inhabilitarlas. El valor predeterminado es true.
  • GCS_IMAGE_PATH: Ruta de Cloud Storage a un archivo de imagen.
  • GCS_OUTPUT_PATH: la ruta de Cloud Storage donde se almacenará el resultado generado.
  • OUTPUT_MIMETYPE: cadena opcional que define el tipo de archivo de salida de la imagen. Se aceptan los siguientes valores: "image/png" y "image/jpeg". El valor predeterminado es "image/png".
  • COMPRESSION_QUALITY: valor entero opcional que especifica el nivel de detalle que conserva el modelo en las imágenes JPEG. Se acepta el siguiente intervalo de valores: 0 - 100. Cuanto mayor sea el valor, mayor será el nivel de compresión. El valor predeterminado es 75.
  • UPSCALE_FACTOR: Factor de escala de la imagen ampliada. La resolución de salida final de la imagen después de aplicar el factor de aumento no debe superar los 17 megapíxeles. Se aceptan los siguientes valores:
    • "x2"
    • "x3"
    • "x4"

Método HTTP y URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
La solicitud devuelve un objeto de imagen. En este ejemplo, se devuelve un objeto de imagen como objeto de predicción con una imagen codificada en Base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}