Imagen 업스케일 API

지원되는 모델 버전

Imagen 확대는 다음 모델을 지원합니다.

  • imagen-4.0-upscale-preview

모델에서 지원하는 기능에 대한 자세한 내용은 Imagen 모델을 참조하세요.

HTTP 요청

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

인스턴스

인스턴스

통합 필드 image.

확대할 이미지입니다. 이미지를 인코딩하는 bytesBase64Encoded 문자열 또는 Cloud Storage 버킷 위치에 대한 gcsUri 문자열 URI를 제공할 수 있습니다.

bytesBase64Encoded

string

이미지 또는 동영상 파일을 base64로 인코딩한 바이트 문자열입니다.

gcsUri

string

Cloud Storage 버킷 위치의 문자열 URI입니다.

매개변수

매개변수
mode

string

필수 항목입니다. 업스케일 요청의 경우 "upscale" 문자열을 전달합니다.

storageUri

string

선택사항입니다. 생성된 이미지를 저장하는 데 사용되는 Cloud Storage 버킷 위치의 문자열 URI입니다. Cloud Storage 버킷이 제공되지 않으면 base64로 인코딩된 이미지 바이트가 응답으로 반환됩니다.

outputOptions

outputOptions

선택사항입니다. outputOptions 객체의 출력 이미지 형식을 설명합니다.

upscaleConfig.upscaleFactor

string

확대된 이미지의 배율입니다. 허용되는 값은 다음과 같습니다.

  • "x2"
  • "x3"
  • "x4"

출력 옵션 객체

outputOptions 객체는 이미지 출력을 설명합니다.

매개변수
outputOptions.mimeType

선택사항: string

이미지 출력 형식입니다. 다음과 같은 값이 지원됩니다.

  • "image/png": PNG 이미지로 저장
  • "image/jpeg": JPEG 이미지로 저장

기본값은 "image/png"입니다.

outputOptions.compressionQuality

(선택사항) int

출력 유형이 "image/jpeg"인 경우의 압축 수준입니다. 허용되는 값은 0~100입니다. 기본값은 75입니다.

샘플 요청

REST

요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • REGION: 프로젝트가 있는 리전. 지원되는 리전에 대한 자세한 내용은 Vertex AI 위치의 생성형 AI를 참조하세요.
  • PROJECT_ID: Google Cloud 프로젝트 ID입니다.
  • BASE64_SUBJECT_IMAGE: 피사체 이미지의 base64로 인코딩된 이미지입니다.
  • ADD_WATERMARK: 선택적 불리언 값입니다. 워터마크가 추가된 이미지를 사용 설정하려면 true로 설정하고, 워터마크가 추가된 이미지를 사용 중지하려면 false로 설정합니다. 기본값은 true입니다.
  • GCS_IMAGE_PATH: 이미지 파일의 Cloud Storage 경로입니다.
  • GCS_OUTPUT_PATH: 생성된 출력을 저장할 Cloud Storage 경로입니다.
  • OUTPUT_MIMETYPE: 이미지의 출력 파일 형식을 정의하는 선택적 문자열입니다. 허용되는 값은 "image/png" 또는 "image/jpeg"입니다. 기본값은 "image/png"입니다.
  • COMPRESSION_QUALITY: 모델이 JPEG 이미지에 대해 보존하는 세부 수준을 지정하는 선택적 정수 값입니다. 허용되는 값의 범위는 0~100입니다. 값이 클수록 압축 수준이 높아집니다. 기본값은 75입니다.
  • UPSCALE_FACTOR: 확대된 이미지의 배율입니다. 업스케일링 요소를 적용한 후 이미지의 최종 출력 해상도는 17 메가픽셀을 초과해서는 안 됩니다. 허용되는 값은 다음과 같습니다.
    • "x2"
    • "x3"
    • "x4"

HTTP 메서드 및 URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

JSON 요청 본문:

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content
이 요청은 이미지 객체를 반환합니다. 이 예시에서는 base64로 인코딩된 이미지가 포함된 예측 객체로 이미지 객체가 반환됩니다.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}