Imagen アップスケール API

サポートされているモデル バージョン

Imagen アップスケールは、次のモデルをサポートしています。

  • imagen-4.0-upscale-preview

モデルでサポートされている機能の詳細については、Imagen モデルをご覧ください。

HTTP リクエスト

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

インスタンス

インスタンス

共用体フィールド image

アップスケールする画像。イメージをエンコードする bytesBase64Encoded 文字列、または Cloud Storage バケットのロケーションへの gcsUri 文字列 URI のいずれかを指定できます。

bytesBase64Encoded

string

画像ファイルまたは動画ファイルの base64 文字列でエンコードされたバイト。

gcsUri

string

Cloud Storage バケットのロケーションへの文字列 URI。

パラメータ

パラメータ
mode

string

必須。アップスケール リクエストの場合は文字列 "upscale" を渡します。

storageUri

string

省略可。生成された画像を保存するために使用される Cloud Storage バケットの場所への文字列 URI。Cloud Storage バケットが指定されていない場合、レスポンスで base64 エンコードされた画像バイトが返されます。

outputOptions

outputOptions

省略可。outputOptions オブジェクトで出力画像形式を記述します。

upscaleConfig.upscaleFactor

string

アップスケールされた画像のスケーリング ファクタ。指定できる値は次のとおりです。

  • "x2"
  • "x3"
  • "x4"

出力オプション オブジェクト

outputOptions オブジェクトは画像出力を記述します。

パラメータ
outputOptions.mimeType

省略可: string

画像出力形式。次の値を使用できます。

  • "image/png": PNG 画像として保存します。
  • "image/jpeg": JPEG 画像として保存します。

デフォルト値は "image/png" です。

outputOptions.compressionQuality

省略可: int

出力タイプが "image/jpeg" である場合の圧縮レベル。指定できる値は 0100 です。デフォルト値は 75 です。

リクエストの例

REST

リクエストのデータを使用する前に、次のように置き換えます。

  • REGION: プロジェクトが配置されているリージョン。サポートされているリージョンの詳細については、Vertex AI の生成 AI のロケーションをご覧ください。
  • PROJECT_ID: 実際の Google Cloud プロジェクト ID。
  • BASE64_SUBJECT_IMAGE: Base64 でエンコードされた被写体の画像。
  • ADD_WATERMARK: 省略可能なブール値。透かし入りの画像を有効にするには true に、透かし入りの画像を無効にするには false に設定します。デフォルト値は true です。
  • GCS_IMAGE_PATH: 画像ファイルへの Cloud Storage パス。
  • GCS_OUTPUT_PATH: 生成された出力を保存する Cloud Storage パス。
  • OUTPUT_MIMETYPE: 画像の出力ファイル形式を定義する文字列(省略可)。使用できる値は、"image/png" または "image/jpeg" です。デフォルトは "image/png" です。
  • COMPRESSION_QUALITY: モデルが JPEG 画像に対して保持する詳細レベルを指定する省略可能な整数値。指定できる値の範囲は 0100 です。値が大きいほど、圧縮レベルが高くなります。デフォルトは 75 です。
  • UPSCALE_FACTOR: アップスケールされた画像のスケーリング ファクタ。アップスケール係数を適用した後の画像の最終出力解像度が 17 メガピクセルを超えてはなりません。指定できる値は次のとおりです。
    • "x2"
    • "x3"
    • "x4"

HTTP メソッドと URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

リクエストの本文(JSON):

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
リクエストは画像オブジェクトを返します。この例では、画像オブジェクトが base64 でエンコードされた画像を含む予測オブジェクトとして返されます。
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}