Mejora imágenes con Imagen

Puedes usar Imagen en Vertex AI para mejorar la resolución de las imágenes, lo que aumenta su tamaño sin perder calidad.

imagen-4.0-upscale-preview admite el aumento de resolución de imágenes en la versión preliminar.

Antes de comenzar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Configura la autenticación para tu entorno.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a gcloud CLI.

      Instala Google Cloud CLI. Después de instalarla, inicializa Google Cloud CLI ejecutando el siguiente comando:

      gcloud init

      Si usas un proveedor de identidad (IdP) externo, primero debes Acceder a gcloud CLI con tu identidad federada.

    Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .

    Mejora una imagen

    Console

    1. En la consola de Google Cloud , ve a la página Vertex AI > Vertex AI Studio > Generar medios.

      Ir a Generar medios

    2. Haz clic en Imagen. Se mostrará la página de Media Playground.

    3. Haz clic en subir una imagen y, luego, selecciona una imagen para subir.

    4. Haz clic en Exportar imagen y, luego, en También mejorar la imagen.

    5. Elige un factor de ajuste y, luego, haz clic en Exportar.

    Se agrega automáticamente una marca de agua digital a las imágenes mejoradas. No puedes inhabilitar la marca de agua digital para la mejora de imágenes con la consola de Google Cloud .

    REST

    Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

    • REGION: Es la región en la que se encuentra tu proyecto. Para obtener más información sobre las regiones admitidas, consulta IA generativa en ubicaciones de Vertex AI.
    • PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
    • BASE64_SUBJECT_IMAGE: Es una imagen del sujeto codificada en Base64.
    • ADD_WATERMARK: Es un valor booleano opcional. Establécelo en true para habilitar las imágenes con marcas de agua o en false para inhabilitarlas. El valor predeterminado es true.
    • GCS_IMAGE_PATH: Es la ruta de acceso de Cloud Storage a un archivo de imagen.
    • GCS_OUTPUT_PATH: Es la ruta de acceso de Cloud Storage en la que se almacenará el resultado generado.
    • OUTPUT_MIMETYPE: Es una cadena opcional que define el tipo de archivo de salida de la imagen. Se aceptan los siguientes valores: "image/png" o "image/jpeg". El valor predeterminado es "image/png".
    • COMPRESSION_QUALITY: Es un valor entero opcional que especifica el nivel de detalle que conserva el modelo para las imágenes JPEG. Se acepta el siguiente rango de valores: 0 a 100. El valor más alto especifica un nivel de compresión más alto. El valor predeterminado es 75.
    • UPSCALE_FACTOR: Es el factor de escala de la imagen mejorada. La resolución de salida final de la imagen después de aplicar el factor de aumento no debe superar los 17 megapíxeles. Se aceptan los siguientes valores:
      • "x2"
      • "x3"
      • "x4"

    Método HTTP y URL:

    POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

    Cuerpo JSON de la solicitud:

    {
      "instances": [
        {
          "prompt": "Upscale the image",
          "image": {
            // use one of the following to specify the image to upscale
            "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
            "gcsUri": "GCS_IMAGE_PATH"
            // end of base image input options
          },
        }
      ],
      "parameters": {
        "mode": "upscale",
        "storageUri": "GCS_OUTPUT_PATH",
        "outputOptions": {
          "mimeType": "OUTPUT_MIMETYPE",
          "compressionQuality": COMPRESSION_QUALITY
        },
        "upscaleConfig": {
          "upscaleFactor": "UPSCALE_FACTOR"
        }
      }
    }
    

    Para enviar tu solicitud, elige una de estas opciones:

    curl

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

    PowerShell

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
    La solicitud devuelve un objeto de imagen. En este ejemplo, se devuelve un objeto de imagen como un objeto de predicción con una imagen codificada en base64.
    {
      "predictions": [
        {
          "mimeType": "image/png",
          "bytesBase64Encoded": "BASE64_IMG_BYTES"
        }
      ]
    }
    
    
    

    ¿Qué sigue?

    Lee artículos sobre Imagen y otros productos de IA generativa en Vertex AI: