Imagen Upscale API

Unterstützte Modellversionen

Die Imagen-Funktion zum Upscaling unterstützt die folgenden Modelle:

  • imagen-4.0-upscale-preview

Weitere Informationen zu den vom Modell unterstützten Funktionen finden Sie unter Imagen-Modelle.

HTTP-Anfrage

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

Instanzen

Instanzen

Union-Feld image.

Das Bild, dessen Auflösung Sie erhöhen möchten. Sie können entweder einen bytesBase64Encoded-String, der ein Bild codiert, oder einen gcsUri-String-URI für einen Cloud Storage-Bucket-Speicherort angeben.

bytesBase64Encoded

string

Ein Base64-codierter String einer Bild- oder Videodatei.

gcsUri

string

Ein String-URI für einen Cloud Storage-Bucket-Speicherort.

Parameter

Parameter
mode

string

Erforderlich. Übergeben Sie für Upscale-Anfragen den String "upscale".

storageUri

string

Optional. Ein String-URI zu einem Cloud Storage-Bucket-Speicherort, der zum Speichern der generierten Bilder verwendet wird. Wenn kein Cloud Storage-Bucket angegeben wird, werden base64-codierte Bildbyte in der Antwort zurückgegeben.

outputOptions

outputOptions

Optional. Beschreibt das Ausgabebildformat in einem outputOptions-Objekt.

upscaleConfig.upscaleFactor

string

Der Skalierungsfaktor für das hochskalierte Bild. Folgende Werte werden akzeptiert:

  • "x2"
  • "x3"
  • "x4"

Objekt für Ausgabeoptionen

Das outputOptions-Objekt beschreibt die Bildausgabe.

Parameter
outputOptions.mimeType

Optional: string

Das Bildausgabeformat. Folgende Werte werden unterstützt:

  • "image/png": Als PNG-Bild speichern.
  • "image/jpeg": Speichern Sie das Bild als JPEG-Bild.

Der Standardwert ist "image/png".

outputOptions.compressionQuality

Optional: int

Der Komprimierungsgrad, wenn der Ausgabetyp "image/jpeg" ist. Zulässige Werte sind 0100. Der Standardwert ist 75.

Beispielanfrage

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • REGION: Die Region, in der sich Ihr Projekt befindet. Weitere Informationen zu unterstützten Regionen finden Sie unter Generative AI in Vertex AI-Standorten.
  • PROJECT_ID: Ihre Google Cloud Projekt-ID.
  • BASE64_SUBJECT_IMAGE: Ein base64-codiertes Bild des Motivbilds.
  • ADD_WATERMARK: Ein optionaler boolescher Wert. Legen Sie true fest, um Bilder mit Wasserzeichen zu aktivieren, oder false, um sie zu deaktivieren. Der Standardwert ist true.
  • GCS_IMAGE_PATH: Ein Cloud Storage-Pfad zu einer Bilddatei.
  • GCS_OUTPUT_PATH: der Cloud Storage-Pfad, in dem die generierte Ausgabe gespeichert werden soll.
  • OUTPUT_MIMETYPE: Ein optionaler String, der den Ausgabedateityp des Bildes definiert. Folgende Werte werden akzeptiert: "image/png" oder "image/jpeg". Der Standardwert ist "image/png".
  • COMPRESSION_QUALITY: Ein optionaler Ganzzahlwert, der den Detaillierungsgrad angibt, den das Modell für JPEG-Bilder beibehält. Der folgende Wertebereich wird akzeptiert: 0 – 100. Der höhere Wert gibt eine höhere Komprimierungsstufe an. Der Standardwert ist 75.
  • UPSCALE_FACTOR: Der Skalierungsfaktor für das hochskalierte Bild. Die endgültige Ausgaberesolution des Bildes nach Anwendung des Upscaling-Faktors darf 17 Megapixel nicht überschreiten. Folgende Werte sind zulässig:
    • "x2"
    • "x3"
    • "x4"

HTTP-Methode und URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
Die Anfrage gibt ein Bildobjekt zurück. In diesem Beispiel wird ein Bildobjekt als Vorhersageobjekt mit einem base64-codierten Bild zurückgegeben.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}