맞춤설정 요청 사항

Vertex AI 기반 Imagen을 사용하면, 텍스트 프롬프트에 지정한 스타일로 이미지의 피사체를 맞춤설정하고 변환하도록 모델에 지시할 수 있습니다.

수정 및 맞춤설정을 위한 Imagen 모델 카드 보기

맞춤설정 프롬프트 작성

Imagen 3 맞춤설정에 사용하는 프롬프트는 생성된 이미지의 품질에 영향을 줄 수 있습니다. 다음 프롬프트 템플릿을 맞춤설정 프롬프트 작성을 위한 시작점으로 사용하세요. 타겟팅된 출력을 얻으려면 여러 요청을 전송해야 할 수 있습니다.

사용 사례 참조 이미지 프롬프트 템플릿 예시
맞춤설정 지시 - 스타일 변환 이미지(1) subject in image [1]를 변환하여 ${STYLE_DESCRIPTION} 스타일로 만들어 줘. ${IMAGE_DESCRIPTION}에 대한 묘사 이미지야. subject in image [1]를 변환하여 느슨한 수채화 기법, 부드러운 색조, 파스텔 색상, 붓 터치, 섬세한 묘사, 깔끔한 배경, 즉흥성, 아날로그 스타일의 그림, 정교하고 세부적인 수채화 이미지 스타일로 만들어 줘. 자랑스러운 여성의 초상화에 대한 묘사 이미지야.

사용자 지시 기반 맞춤설정을 사용한 스타일 변환

다음 코드 샘플을 사용하여 텍스트 프롬프트에 설명된 스타일에 따라 출력 이미지의 스타일을 지정합니다.

REST

요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • PROJECT_ID: Google Cloud 프로젝트 ID
  • LOCATION: 프로젝트의 리전. 예를 들면 us-central1, europe-west2, asia-northeast3입니다. 사용 가능한 리전 목록은 Vertex AI의 생성형 AI 위치를 참조하세요.
  • TEXT_PROMPT: 모델이 생성하는 이미지를 안내하는 텍스트 프롬프트. Imagen 3 맞춤설정을 사용하려면 제공하는 참고 이미지 또는 이미지의 referenceId[$referenceId] 형식으로 포함합니다. 예를 들면 다음과 같습니다.
    • 이미지 [1]의 피사체를 변환하여 디지털 스테인드 글라스 스타일의 이미지 스타일로 만들어 줘
    • 이미지 [1]의 고양이에 빨간색 카우보이 모자를 추가해 줘
    • 이미지 [1]에서 코기 강아지를 삭제해 줘
    • 이미지 [1]의 빨간색 공을 파란색 상자로 변경해 줘
  • "referenceId": 참고 이미지의 ID 또는 동일한 피사체 또는 스타일에 해당하는 일련의 참고 이미지 ID입니다.
  • BASE64_REFERENCE_IMAGE: 이미지 생성을 안내하는 참고 이미지. 이미지는 base64 인코딩 바이트 문자열로 지정되어야 합니다.
  • IMAGE_COUNT: 생성된 이미지의 수입니다. 허용되는 정수 값: 1~4. 기본값: 4.

HTTP 메서드 및 URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

JSON 요청 본문:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_RAW",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
다음은 "sampleCount": 2 요청에 대한 샘플 응답입니다. 응답은 생성된 이미지 바이트를 base64로 인코딩한 두 개의 예측 객체를 반환합니다.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

제품 사용량

Vertex AI 기반 Imagen과 관련된 사용량 표준과 콘텐츠 제한을 보려면 사용 가이드라인을 참조하세요.

모델 버전

사용할 수 있는 이미지 생성 모델에는 여러 가지가 있습니다. 자세한 내용은 Imagen 모델을 참조하세요.

다음 단계

Imagen 및 Vertex AI의 기타 생성형 AI 제품 관련 문서 읽기: