Imagen 업스케일 API

지원되는 모델 버전

Imagen 확대는 다음 모델을 지원합니다.

imagen-4.0-upscale-preview

모델에서 지원하는 기능에 대한 자세한 내용은 Imagen 모델을 참조하세요.

HTTP 요청

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_ID:predict \

-d '{
  "instances": [
    {
      "prompt": string,
      "image": {
        // Union field can be only one of the following:
        "bytesBase64Encoded": string,
        "gcsUri": string,
        // End of list of possible types for union field.
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": string,
    "outputOptions": {
      "mimeType": string,
      "compressionQuality": integer
    },
    "upscaleConfig": {
      "upscaleFactor": string
    }
  }
}'

인스턴스

인스턴스
통합 필드 `image`. 확대할 이미지입니다. 이미지를 인코딩하는 `bytesBase64Encoded` 문자열 또는 Cloud Storage 버킷 위치에 대한 `gcsUri` 문자열 URI를 제공할 수 있습니다.
`bytesBase64Encoded`	`string` 이미지 또는 동영상 파일을 base64로 인코딩한 바이트 문자열입니다.
`gcsUri`	`string` Cloud Storage 버킷 위치의 문자열 URI입니다.

통합 필드 image.

확대할 이미지입니다. 이미지를 인코딩하는 bytesBase64Encoded 문자열 또는 Cloud Storage 버킷 위치에 대한 gcsUri 문자열 URI를 제공할 수 있습니다.

bytesBase64Encoded

string

이미지 또는 동영상 파일을 base64로 인코딩한 바이트 문자열입니다.

gcsUri

string

Cloud Storage 버킷 위치의 문자열 URI입니다.

매개변수

매개변수
`mode`	`string` 필수 항목입니다. 업스케일 요청의 경우 `"upscale"` 문자열을 전달합니다.
`storageUri`	`string` 선택사항입니다. 생성된 이미지를 저장하는 데 사용되는 Cloud Storage 버킷 위치의 문자열 URI입니다. Cloud Storage 버킷이 제공되지 않으면 base64로 인코딩된 이미지 바이트가 응답으로 반환됩니다.
`outputOptions`	`outputOptions` 선택사항입니다. `outputOptions` 객체의 출력 이미지 형식을 설명합니다.
`upscaleConfig.upscaleFactor`	`string` 확대된 이미지의 배율입니다. 허용되는 값은 다음과 같습니다. `"x2"` `"x3"` `"x4"`

출력 옵션 객체

outputOptions 객체는 이미지 출력을 설명합니다.

매개변수

매개변수
`outputOptions.mimeType`	선택사항: `string` 이미지 출력 형식입니다. 다음과 같은 값이 지원됩니다. `"image/png"`: PNG 이미지로 저장 `"image/jpeg"`: JPEG 이미지로 저장 기본값은 `"image/png"`입니다.
`outputOptions.compressionQuality`	(선택사항) `int` 출력 유형이 `"image/jpeg"`인 경우의 압축 수준입니다. 허용되는 값은 `0`~`100`입니다. 기본값은 `75`입니다.

outputOptions.mimeType

선택사항: string

이미지 출력 형식입니다. 다음과 같은 값이 지원됩니다.

"image/png": PNG 이미지로 저장
"image/jpeg": JPEG 이미지로 저장

기본값은 "image/png"입니다.

outputOptions.compressionQuality

(선택사항) int

출력 유형이 "image/jpeg"인 경우의 압축 수준입니다. 허용되는 값은 0~100입니다. 기본값은 75입니다.

샘플 요청

REST

요청 데이터를 사용하기 전에 다음을 바꿉니다.

REGION: 프로젝트가 있는 리전. 지원되는 리전에 대한 자세한 내용은 Vertex AI 위치의 생성형 AI를 참조하세요.
PROJECT_ID: Google Cloud 프로젝트 ID입니다.
BASE64_SUBJECT_IMAGE: 피사체 이미지의 base64로 인코딩된 이미지입니다.
ADD_WATERMARK: 선택적 불리언 값입니다. 워터마크가 추가된 이미지를 사용 설정하려면 true로 설정하고, 워터마크가 추가된 이미지를 사용 중지하려면 false로 설정합니다. 기본값은 true입니다.
GCS_IMAGE_PATH: 이미지 파일의 Cloud Storage 경로입니다.
GCS_OUTPUT_PATH: 생성된 출력을 저장할 Cloud Storage 경로입니다.
OUTPUT_MIMETYPE: 이미지의 출력 파일 형식을 정의하는 선택적 문자열입니다. 허용되는 값은 "image/png" 또는 "image/jpeg"입니다. 기본값은 "image/png"입니다.
COMPRESSION_QUALITY: 모델이 JPEG 이미지에 대해 보존하는 세부 수준을 지정하는 선택적 정수 값입니다. 허용되는 값의 범위는 0~100입니다. 값이 클수록 압축 수준이 높아집니다. 기본값은 75입니다.
UPSCALE_FACTOR: 확대된 이미지의 배율입니다. 업스케일링 요소를 적용한 후 이미지의 최종 출력 해상도는 17 메가픽셀을 초과해서는 안 됩니다. 허용되는 값은 다음과 같습니다.
- "x2"
- "x3"
- "x4"

HTTP 메서드 및 URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict

JSON 요청 본문:

{
  "instances": [
    {
      "prompt": "Upscale the image",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE"
        "gcsUri": "GCS_IMAGE_PATH"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "mode": "upscale",
    "storageUri": "GCS_OUTPUT_PATH",
    "outputOptions": {
      "mimeType": "OUTPUT_MIMETYPE",
      "compressionQuality": COMPRESSION_QUALITY
    },
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하거나 gcloud CLI에 자동으로 로그인하는 Cloud Shell을 사용하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict"

PowerShell

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-4.0-upscale-preview:predict" | Select-Object -Expand Content

이 요청은 이미지 객체를 반환합니다. 이 예시에서는 base64로 인코딩된 이미지가 포함된 예측 객체로 이미지 객체가 반환됩니다.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Imagen 업스케일 API 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

지원되는 모델 버전

HTTP 요청

인스턴스

매개변수

출력 옵션 객체

샘플 요청

REST

curl

PowerShell

Imagen 업스케일 API