Definir la resolución de salida

Imagen en Vertex AI te permite definir la resolución de salida de las imágenes generadas cuando usas los siguientes modelos de Imagen 4:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Consola

  1. En la Google Cloud consola, ve a la página Vertex AI > Vertex AI Studio .

    Ir a Vertex AI Studio

  2. Haz clic en Generar contenido multimedia.

  3. Haz clic en Imagen.

  4. En la lista Tarea, selecciona Texto a imagen.

  5. En la lista Modelo, selecciona el modelo de Imagen que quieras usar.

  6. En el cuadro Petición, escribe una petición que describa cómo editar la imagen.

  7. Haga clic en chevron_forward Parámetros y, a continuación, ajuste las siguientes opciones:

    • Relación de aspecto: elige una de las opciones disponibles.
    • Número de resultados: ajusta el control deslizante para seleccionar entre 1 y 4 imágenes generadas.
    • Resolución de salida: elige una resolución de salida de entre las opciones disponibles.
  8. Haz clic en Ejecutar.

REST

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • REGION: la región en la que se encuentra tu proyecto. Para obtener más información sobre las regiones admitidas, consulta Ubicaciones de la IA generativa en Vertex AI.
  • TEXT_PROMPT: la petición de texto que se usará para generar imágenes.
  • PROJECT_ID: tu ID de proyecto. Google Cloud
  • MODEL_VERSION: Versión del modelo de Imagen que se va a usar. Se aceptan los siguientes valores al usar sampleImageSize:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: la resolución de la imagen de salida. Se aceptan los siguientes documentos:
    • "1K"
    • "2K"

    El ajuste predeterminado es "1K".

  • IMAGE_COUNT: el número de imágenes que se van a generar. El intervalo de valores aceptado es de 1 a 4.

Método HTTP y URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La solicitud devuelve objetos de imagen. En este ejemplo, se devuelven dos objetos de imagen, con dos objetos de predicción como imágenes codificadas en base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}