Vertex AI 기반 Imagen을 사용하면, 텍스트 프롬프트에 지정한 스타일로 이미지의 피사체를 맞춤설정하고 변환하도록 모델에 지시할 수 있습니다.
맞춤설정 프롬프트 작성
Imagen 3 맞춤설정에 사용하는 프롬프트는 생성된 이미지의 품질에 영향을 줄 수 있습니다. 다음 프롬프트 템플릿을 맞춤설정 프롬프트 작성을 위한 시작점으로 사용하세요. 타겟팅된 출력을 얻으려면 여러 요청을 전송해야 할 수 있습니다.
사용 사례 | 참조 이미지 | 프롬프트 템플릿 | 예시 |
---|---|---|---|
맞춤설정 지시 - 스타일 변환 | 이미지(1) | subject in image [1]를 변환하여 ${STYLE_DESCRIPTION} 스타일로 만들어 줘. ${IMAGE_DESCRIPTION}에 대한 묘사 이미지야. | subject in image [1]를 변환하여 느슨한 수채화 기법, 부드러운 색조, 파스텔 색상, 붓 터치, 섬세한 묘사, 깔끔한 배경, 즉흥성, 아날로그 스타일의 그림, 정교하고 세부적인 수채화 이미지 스타일로 만들어 줘. 자랑스러운 여성의 초상화에 대한 묘사 이미지야. |
사용자 지시 기반 맞춤설정을 사용한 스타일 변환
다음 코드 샘플을 사용하여 텍스트 프롬프트에 설명된 스타일에 따라 출력 이미지의 스타일을 지정합니다.
REST
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- PROJECT_ID: Google Cloud 프로젝트 ID
- LOCATION: 프로젝트의 리전. 예를 들면
us-central1
,europe-west2
,asia-northeast3
입니다. 사용 가능한 리전 목록은 Vertex AI의 생성형 AI 위치를 참조하세요. - TEXT_PROMPT: 모델이 생성하는 이미지를 안내하는 텍스트 프롬프트. Imagen 3 맞춤설정을 사용하려면 제공하는 참고 이미지 또는 이미지의
referenceId
를 [$referenceId] 형식으로 포함합니다. 예를 들면 다음과 같습니다.- 이미지 [1]의 피사체를 변환하여 디지털 스테인드 글라스 스타일의 이미지 스타일로 만들어 줘
- 이미지 [1]의 고양이에 빨간색 카우보이 모자를 추가해 줘
- 이미지 [1]에서 코기 강아지를 삭제해 줘
- 이미지 [1]의 빨간색 공을 파란색 상자로 변경해 줘
"referenceId"
: 참고 이미지의 ID 또는 동일한 피사체 또는 스타일에 해당하는 일련의 참고 이미지 ID입니다.- BASE64_REFERENCE_IMAGE: 이미지 생성을 안내하는 참고 이미지. 이미지는 base64 인코딩 바이트 문자열로 지정되어야 합니다.
- IMAGE_COUNT: 생성된 이미지의 수입니다. 허용되는 정수 값: 1~4. 기본값: 4.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
JSON 요청 본문:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
"sampleCount": 2
요청에 대한 샘플 응답입니다. 응답은 생성된 이미지 바이트를 base64로 인코딩한 두 개의 예측 객체를 반환합니다.
{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
제품 사용량
Vertex AI 기반 Imagen과 관련된 사용량 표준과 콘텐츠 제한을 보려면 사용 가이드라인을 참조하세요.
모델 버전
사용할 수 있는 이미지 생성 모델에는 여러 가지가 있습니다. 자세한 내용은 Imagen 모델을 참조하세요.
다음 단계
Imagen 및 Vertex AI의 기타 생성형 AI 제품 관련 문서 읽기:
- Vertex AI에서 Imagen 3 시작을 위한 개발자 가이드
- 크리에이터를 위해 제작된 새로운 생성형 미디어 모델 및 도구
- Gemini의 새로운 기능: Imagen 3의 커스텀 젬 및 향상된 이미지 생성
- Google DeepMind: Imagen 3 - 최고 품질의 텍스트 이미지 변환 모델