피사체 맞춤설정

Imagen 3 맞춤설정의 피사체 맞춤설정을 사용하면 제공한 텍스트 프롬프트와 참고 이미지에서 새 이미지를 생성할 수 있습니다. 제공하는 참고 이미지는 새 이미지 생성을 안내합니다.

사용 사례

Imagen 3 맞춤설정은 자유 형식의 프롬프트를 제공하므로 학습된 것보다 더 많은 작업을 할 수 있다는 인상을 줄 수 있습니다. 다음 섹션에서는 Imagen 3 맞춤설정의 의도된 사용 사례와 의도하지 않은 사용 사례를 예시를 들어 설명합니다.

의도한 사용 사례에 Imagen 3 맞춤설정을 사용하는 것이 좋습니다. 이러한 사용 사례에 대해 모델을 학습시켰으므로 좋은 결과를 기대할 수 있기 때문입니다. 반대로 의도한 사용 사례 이외의 작업을 수행하도록 모델을 푸시할 수는 있지만 좋은 결과를 기대할 수는 없습니다.

의도된 사용 사례

다음은 Imagen 3 맞춤설정 피사체 맞춤설정을 위한 사용 사례입니다.

사람 사진에 스타일 지정하기
사람의 사진에 스타일을 지정하고 사람의 얼굴 표정을 유지합니다.
(성공률 낮음) 소파나 쿠키와 같은 제품을 다양한 제품 각도에 따라 다양한 장면에 배치합니다.
정확한 세부정보를 보존하지 않는 제품의 변형 생성
얼굴 표정을 유지하면서 사람의 사진에 스타일을 지정합니다.

의도하지 않은 사용 사례의 예시

다음은 Imagen 3 맞춤설정이 학습되지 않았으며 다음과 같은 경우 좋지 않은 결과를 산출하는 사용 사례의 일부 목록입니다.

두 명 이상의 사람을 서로 다른 장면에 배치하면서 신원을 유지합니다.
두 명 이상의 사람을 서로 다른 장면에 배치하고, 신원을 유지하면서 스타일의 입력으로 예시 이미지를 사용하여 출력 이미지의 스타일을 지정합니다.
신원을 유지하면서 두 명 이상의 사람의 사진에 스타일을 지정합니다.
반려동물의 신원을 유지하면서 다양한 장면에 배치합니다.
반려동물 사진에 스타일을 지정하여 그림으로 변환합니다.
반려동물의 사진에 스타일을 지정하고 그림으로 변환하면서 이미지의 스타일(예: 수채화)을 유지하거나 지정합니다.
반려동물과 사람을 서로 다른 장면에 배치하고, 둘의 신원을 유지합니다.
반려동물과 한 명 이상의 사람이 있는 사진을 스타일을 지정하여 그림으로 변환합니다.
두 제품을 다양한 제품 각도에 따라 다양한 장면에 배치합니다.
쿠키나 소파와 같은 제품을 다양한 제품 각도와 특정 이미지 스타일(예: 특정 색상, 조명 스타일 또는 애니메이션이 있는 사실적인 이미지)에 따라 다양한 장면에 배치합니다.
컨트롤 이미지에 지정된 장면의 특정 구성을 유지하면서 제품을 다른 장면에 배치합니다.
특정 이미지를 입력으로 사용하여(예: 특정 색상, 조명 스타일 또는 애니메이션이 있는 사실적인 이미지) 두 제품을 다양한 제품 각도에 따라 다양한 장면에 배치합니다.
두 제품을 서로 다른 장면에 배치하면서 제어 이미지로 지정된 장면의 특정 구성을 유지합니다.

피사체 맞춤설정 예시

다음 섹션에서는 Imagen 3 맞춤설정 피사체 맞춤설정의 지원되는 사례를 보여줍니다.

사람 맞춤설정

샘플 입력	샘플 출력
참고 이미지¹: 텍스트 프롬프트: 다음 설명과 일치하는 `woman with long hair[1]` 이미지를 생성해 줘: `woman with long hair[1]`의 초상화로 배경이 흐리게 처리된 3D 만화 스타일. 카메라를 향하고 웃는 얼굴을 한 귀엽고 사랑스러운 캐릭터, 파스텔 색조, 고품질, 4K, 걸작, 슈퍼 디테일, 피부 질감, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상

샘플 입력

샘플 출력

참고 이미지¹:
텍스트 프롬프트:
다음 설명과 일치하는 woman with long hair[1] 이미지를 생성해 줘: woman with long hair[1]의 초상화로 배경이 흐리게 처리된 3D 만화 스타일. 카메라를 향하고 웃는 얼굴을 한 귀엽고 사랑스러운 캐릭터, 파스텔 색조, 고품질, 4K, 걸작, 슈퍼 디테일, 피부 질감, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상

¹ 파리에 있는 한 여성의 초상화. 검은색 바지와 흰색 셔츠를 착용하고 있어라는 프롬프트에서 Imagen 3 이미지 생성을 사용하여 생성된 참고 입력 이미지

제품 맞춤설정

샘플 입력	샘플 출력
참고 이미지²: 텍스트 프롬프트: `perfume bottle [1]`의 이미지를 생성해 줘. 단, 색상은 시안색이야.

² 검은색 배경 앞에 있는 향수 병 제품 스타일 이미지 프롬프트에서 Imagen 3 이미지 생성을 사용하여 생성된 참고 입력 이미지

수정 및 맞춤설정을 위한 Imagen 모델 카드 보기

시작하기 전에

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

환경에 대한 인증을 설정하세요.

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

REST

로컬 개발 환경에서 이 페이지의 REST API 샘플을 사용하려면 gcloud CLI에 제공한 사용자 인증 정보를 사용합니다.

Google Cloud CLI를 설치합니다. 설치 후 다음 명령어를 실행하여 Google Cloud CLI를 초기화합니다.

gcloud init

외부 ID 프로바이더(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.

자세한 내용은 Google Cloud 인증 문서의 REST 사용을 위한 인증을 참고하세요.

피사체 맞춤설정

Imagen 3 맞춤설정을 사용할 때 피사체 유형의 참고 이미지를 제공할 수 있습니다. 특히 Imagen 3 맞춤설정을 사용한 퓨샷 프롬프팅은 제품, 사람, 반려동물 등의 피사체를 지원합니다. 선택한 피사체는 생성 요청을 작성하는 방식에 영향을 미칩니다.

Imagen 3 맞춤설정에 사용하는 프롬프트는 생성된 이미지의 품질에 영향을 줄 수 있습니다. 다음 섹션에서는 맞춤설정 요청을 전송하기 위한 권장 프롬프트 템플릿과 샘플을 설명합니다.

사람 맞춤설정

다음 표에서는 인물 맞춤설정 프롬프트를 작성할 때 시작점으로 사용하는 것이 좋은 프롬프트 템플릿을 설명합니다.

사용 사례	참조 이미지	프롬프트 템플릿	예
얼굴 메시 입력을 통한 사람 이미지 스타일 지정	피사체 이미지(1) 얼굴 메시 대조 이미지(1)	`facemesh from the control image [2]`로 `SUBJECT_DESCRIPTION [1]`의 이미지를 생성해 줘. ${PROMPT}	`facemesh from the control image [2]`로 `the person [1]`의 이미지를 생성해 줘. 무표정한 얼굴로 정면을 똑바로 바라보고 있어야 해. 배경은 ...
얼굴 메시 입력을 사용하지 않은 사람 이미지 스타일 지정	피사체 이미지(1-4)	다음 설명과 일치하는 `SUBJECT_DESCRIPTION [1]` 이미지를 만들어 줘: `SUBJECT_DESCRIPTION [1]`의 초상화 ${PROMPT}	다음 설명과 일치하는 `a woman with short hair[1]` 이미지를 만들어 줘: `a woman with short hair[1]`의 초상화, 배경이 흐리게 처리된 3D 만화 스타일. 카메라를 바라보고 있는 귀엽고 사랑스러운 캐릭터, 웃는 얼굴, 파스텔 색조, 고품질, 4K, 걸작, 슈퍼 디테일, 피부 질감, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상
얼굴 메시 입력을 사용하지 않은 사람 이미지 스타일 지정	피사체 이미지(1-4)	다음 설명과 일치하는 `SUBJECT_DESCRIPTION [1]`에 관한 `STYLE_DESCRIPTION [2]` 이미지를 만들어 줘: `SUBJECT_DESCRIPTION [1]`의 초상화 STYLE_PROMPT	다음 설명과 일치하는 `a woman with short hair [1]`의 `3d-cartoon style [2]` 이미지를 만들어 줘: `a woman with short hair [1]`의 초상화, 배경이 흐리게 처리된 3D 만화 스타일. 카메라를 보고 웃는 얼굴을 한 귀엽고 사랑스러운 캐릭터, 파스텔 색조, 고품질, 4K, 걸작, 슈퍼 디테일, 피부 질감, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상
얼굴 메시 입력을 통한 사람 이미지 스타일 지정	피사체 이미지(1-3) 얼굴 메시 대조 이미지(1)	설명과 일치하는 `CONTROL_IMAGE [2]`의 포즈로 `SUBJECT_DESCRIPTION [1]`에 관한 이미지를 만들어 줘: `SUBJECT_DESCRIPTION [1]`의 초상화 ${PROMPT}	다음 설명과 일치하는 `a woman with short hair [1]` 이미지를 만들어 줘: `control image [2]`의 포즈를 취한 `a woman with short hair [1]`의 초상화로 배경이 흐리게 처리된 3D 만화 스타일. 귀엽고 사랑스러운 캐릭터, 웃는 얼굴. 카메라 보기, 파스텔 색조, 고화질, 4K, 걸작, 슈퍼 디테일, 피부결, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상
얼굴 메시 입력을 통한 사람 이미지 스타일 지정	피사체 이미지(1-3) 얼굴 메시 대조 이미지(1)	다음 설명과 일치하는 `CONTROL_IMAGE [2]`의 포즈로 `SUBJECT_DESCRIPTION [1]`에 관한 `STYLE_DESCRIPTION [3]` 이미지를 만들어 줘: `SUBJECT_DESCRIPTION [1]`의 초상화 ${PROMPT}	다음 설명과 일치하는 `control image [2]`의 포즈로 `a woman with short hair [1]`에 관한 `3d-cartoon style [3]` 이미지를 만들어 줘: `a woman with short hair [1]`의 초상화로 배경이 흐리게 처리된 3D 만화 스타일. 귀엽고 사랑스러운 캐릭터, 웃는 얼굴. 카메라 보기, 파스텔 색조, 고화질, 4K, 걸작, 슈퍼 디테일, 피부결, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상

참고 이미지의 얼굴에는 다음 속성이 있어야 합니다.

중앙에 배치되어 전체 이미지의 절반 이상을 차지합니다.
전면 뷰에서 모든 방향(롤, 피치, 요)으로 회전됩니다.
선글라스나 마스크와 같은 물체로 가려지지 않습니다.

다음 샘플을 사용하여 이미지 생성을 안내하는 데 사용되는 사람 참고 이미지가 포함된 맞춤설정 요청을 전송합니다. 얼굴 메시 대조 이미지 유무와 관계없이 이러한 유형의 요청을 전송하여 이미지 생성을 추가로 안내할 수 있습니다.

REST

imagen-3.0-capability-001 모델 요청에 대한 자세한 내용은 imagen-3.0-capability-001 모델 API 참조를 확인하세요.

이 샘플에서는 생성을 안내할 얼굴 메시 대조 영역을 지정하는 방법을 보여줍니다. 하지만 대조 참조 객체("referenceType": "REFERENCE_TYPE_CONTROL")를 생략해도 Imagen에서 얼굴 메시 대조 영역을 자동으로 감지합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: Google Cloud 프로젝트 ID
LOCATION: 프로젝트의 리전. 예를 들면 us-central1, europe-west2, asia-northeast3입니다. 사용 가능한 리전 목록은 Vertex AI의 생성형 AI 위치를 참고하세요.
TEXT_PROMPT: 모델이 생성하는 이미지를 안내하는 텍스트 프롬프트. Imagen 3 맞춤설정을 사용하려면 제공하는 참고 이미지 또는 이미지의 referenceId를 [$referenceId] 형식으로 포함합니다. 예를 들면 다음과 같습니다.
- 다음 텍스트 프롬프트는 "referenceId": 1이 지정된 참고 이미지 2개가 있는 요청에 대한 프롬프트입니다. 두 이미지 모두 "subjectDescription": "man with short hair"의 설명(선택사항)이 있습니다. 또한 "referenceId": 2로 지정된 대조 얼굴 메시 이미지가 있습니다. 다음 설명과 일치하는 대조 이미지 [2]의 포즈를 취한 man with short hair [1]의 이미지를 만들어 줘: 연필 스타일 스케치이고 해칭 기법으로 그린 man with short hair [1]의 전신 초상화, 6B 및 그래파이트 연필로 해칭 기법을 사용해 그린 초상화, 흰색 배경, 연필 그림, 고품질, 연필 획, 카메라를 바라보는 모습, 자연스러운 눈
"referenceId": 참고 이미지의 ID 또는 동일한 피사체 또는 스타일에 해당하는 일련의 참고 이미지 ID입니다. 이 예에서 두 참고 이미지는 동일한 사람에 대한 것이므로 동일한 referenceId(1)를 공유하고 대조 얼굴 메시 이미지에는 고유한 referenceId(2)가 있습니다. 생성된 이미지는 참고 이미지에서 추출된 얼굴 메시의 얼굴 구조를 따르고 다음과 같이 얼굴 모양을 개선합니다. 얼굴 메시 대조는 하나만 지원됩니다.
BASE64_REFERENCE_IMAGE: 이미지 생성을 안내하는 참고 이미지입니다. 이미지는 base64 인코딩 바이트 문자열로 지정되어야 합니다.

SUBJECT_DESCRIPTION: 선택사항. prompt 필드에서 사용할 수 있는 참고 이미지의 텍스트 설명입니다. 예를 들면 다음과 같습니다.

      "prompt": "a full-body portrait of a man with short hair [1] with hatch-cross
      drawing",
      [...],
      "subjectDescription": "man with short hair"

IMAGE_COUNT: 생성 이미지의 수. 허용되는 정수 값: 1~4. 기본값: 4.

HTTP 메서드 및 URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

JSON 요청 본문:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [

        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectDescription": "SUBJECT_DESCRIPTION",
            "subjectType": "SUBJECT_TYPE_PERSON"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectDescription": "SUBJECT_DESCRIPTION",
            "subjectType": "SUBJECT_TYPE_PERSON"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_CONTROL",
          "referenceId": 2,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "controlImageConfig": {
            "controlType": "CONTROL_TYPE_FACE_MESH",
            "enableControlImageComputation": true
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하거나 gcloud CLI에 자동으로 로그인하는 Cloud Shell을 사용하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

다음은 "sampleCount": 2 요청에 대한 샘플 응답입니다. 응답은 생성된 이미지 바이트를 base64로 인코딩한 두 개의 예측 객체를 반환합니다.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Python

from google import genai
from google.genai.types import (
    ControlReferenceConfig,
    ControlReferenceImage,
    EditImageConfig,
    Image,
    SubjectReferenceConfig,
    SubjectReferenceImage,
)

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

# Create subject and control reference images of a photograph stored in Google Cloud Storage
# using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/person.png
subject_reference_image = SubjectReferenceImage(
    reference_id=1,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
    config=SubjectReferenceConfig(
        subject_description="a headshot of a woman",
        subject_type="SUBJECT_TYPE_PERSON",
    ),
)
control_reference_image = ControlReferenceImage(
    reference_id=2,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/person.png"),
    config=ControlReferenceConfig(control_type="CONTROL_TYPE_FACE_MESH"),
)

image = client.models.edit_image(
    model="imagen-3.0-capability-001",
    prompt="""
    a portrait of a woman[1] in the pose of the control image[2]in a watercolor style by a professional artist,
    light and low-contrast stokes, bright pastel colors, a warm atmosphere, clean background, grainy paper,
    bold visible brushstrokes, patchy details
    """,
    reference_images=[subject_reference_image, control_reference_image],
    config=EditImageConfig(
        edit_mode="EDIT_MODE_DEFAULT",
        number_of_images=1,
        safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
        person_generation="ALLOW_ADULT",
        output_gcs_uri=output_gcs_uri,
    ),
)

# Example response:
# gs://your-bucket/your-prefix
print(image.generated_images[0].image.gcs_uri)

제품 맞춤설정

다음 표에서는 제품 맞춤설정 프롬프트를 작성할 때 시작점으로 사용하는 것이 좋은 프롬프트 템플릿을 설명합니다.

참조 이미지	프롬프트 템플릿	예
피사체 이미지(1-4)	다음 설명과 일치하는 `SUBJECT_DESCRIPTION [1]` 이미지를 만들어 줘: ${PROMPT}	다음 설명과 일치하는 `Luxe Elixir hair oil, golden liquid in glass bottle [1]` 이미지를 만들어 줘: 흰색 배경에 `Luxe Elixir hair oil, golden liquid in glass bottle [1]`을 들고 있는 여성의 손을 클로즈업한 밝은 이미지. 여성의 손이 밝게 조명되고 병에 초점이 선명하게 맞춰져 있으며, 피사계 심도가 얕아 배경이 흐리게 처리되어 제품이 강조되어야 해. 조명이 부드럽게 확산되어 병과 손 주위에 은은한 빛을 발하도록 만들어 줘. 제품의 고급스러운 매력이 강조되도록 전반적인 구성은 단순하고 우아해야 해.
피사체 이미지(1-4)	`SUBJECT_DESCRIPTION`의 이미지를 생성해 줘. ${PROMPT}로.	`Seiko watch [1]`의 이미지를 생성해 줘. 파란색으로.

다음 샘플을 사용하여 이미지 생성을 안내하는 데 사용되는 제품 참고 이미지가 포함된 맞춤설정 요청을 전송합니다.

콘솔

Google Cloud 콘솔에서 Vertex AI > Media Studio 페이지로 이동합니다.
Media Studio로 이동
파라미터 창의 모델 섹션에서 아직 선택하지 않은 경우 Imagen 3을 선택합니다.
(선택사항) 1:1(기본값)이 아닌 가로세로 비율을 선택합니다.
(선택사항) 결과 수를 변경합니다.
(선택사항) 부정 프롬프트를 제공하여 모델에 생성하지 말아야 할 항목을 안내합니다.
(선택사항) 고급 옵션을 변경합니다.
텍스트 프롬프트 필드(프롬프트 작성...)에서 참조 추가를 클릭합니다.
1. 참조 추가 창에서 참조 유형을 선택합니다. Subject - product
2. 참고 이미지 섹션에서 업로드를 클릭합니다.
3. 로컬에 저장된 이미지를 선택하고 열기를 클릭합니다.
4. (선택사항) 참고 이미지의 설명을 입력합니다.
5. 완료를 클릭합니다.
6. (선택사항) 참고 이미지를 더 추가하려면 이미지 추가를 클릭하고 다른 이미지를 업로드합니다.
7. 참고 이미지를 모두 추가한 후 참조 추가를 클릭합니다.
  이 창에 추가하는 모든 참고 이미지는 참조 번호가 동일합니다. 텍스트 프롬프트를 추가할 때 이 참조 번호를 사용하세요.
텍스트 프롬프트 필드(프롬프트 작성...)에 참고 이미지의 참조 번호가 포함된 텍스트 프롬프트를 추가합니다. 예를 들면 다음과 같습니다.
1. 밝은 흰색 방, 유리 테이블 위에 놓인 product [1]
2. 멀리 숲이 보이는 탁 트인 들판에 서 있는 animal [1]
3. film noir style [2]의 도시 거리에 있는 person [1]의 흑백 인물 사진

REST

imagen-3.0-capability-001 모델 요청에 대한 자세한 내용은 imagen-3.0-capability-001 모델 API 참조를 확인하세요.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: Google Cloud 프로젝트 ID
LOCATION: 프로젝트의 리전. 예를 들면 us-central1, europe-west2, asia-northeast3입니다. 사용 가능한 리전 목록은 Vertex AI의 생성형 AI 위치를 참고하세요.
TEXT_PROMPT: 모델이 생성하는 이미지를 안내하는 텍스트 프롬프트. Imagen 3 맞춤설정을 사용하려면 제공하는 참고 이미지 또는 이미지의 referenceId를 [$referenceId] 형식으로 포함합니다. 예를 들면 다음과 같습니다.
- 다음 설명과 일치하는 Luxe Elixir hair oil, golden liquid in glass bottle [1] 이미지를 만들어 줘: 흰색 배경에 Luxe Elixir hair oil, golden liquid in glass bottle [1]를 들고 있는 여성의 손을 클로즈업한 밝은 이미지. 여성의 손이 밝게 조명되고 병에 초점이 선명하게 맞춰져 있으며, 피사계 심도가 얕아 배경이 흐리게 처리되어 제품이 강조되어야 해.
"referenceId": 참고 이미지의 ID 또는 동일한 피사체 또는 스타일에 해당하는 일련의 참고 이미지 ID입니다. 이 예에서 두 참고 이미지는 동일한 제품에 대한 것이므로 동일한 referenceId(1)를 공유합니다.
BASE64_REFERENCE_IMAGE: 이미지 생성을 안내하는 참고 이미지입니다. 이미지는 base64 인코딩 바이트 문자열로 지정되어야 합니다.

SUBJECT_DESCRIPTION: 선택사항. prompt 필드에서 사용할 수 있는 참고 이미지의 텍스트 설명입니다. 예를 들면 다음과 같습니다.

      "prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1]
       against a pure white background.",
      [...],
      "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"

IMAGE_COUNT: 생성 이미지의 수. 허용되는 정수 값: 1~4. 기본값: 4.

HTTP 메서드 및 URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

JSON 요청 본문:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectType": "SUBJECT_TYPE_PRODUCT",
            "subjectDescription": "SUBJECT_DESCRIPTION"
          }
        },
        {
          "referenceType": "REFERENCE_TYPE_SUBJECT",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          },
          "subjectImageConfig": {
            "subjectType": "SUBJECT_TYPE_PRODUCT",
            "subjectDescription": "SUBJECT_DESCRIPTION"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

다음은 "sampleCount": 2 요청에 대한 샘플 응답입니다. 응답은 생성된 이미지 바이트를 base64로 인코딩한 두 개의 예측 객체를 반환합니다.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

제품 사용량

Vertex AI 기반 Imagen과 관련된 사용량 표준과 콘텐츠 제한을 보려면 사용 가이드라인을 참고하세요.

모델 버전

사용할 수 있는 이미지 생성 모델에는 여러 가지가 있습니다. 자세한 내용은 Imagen 모델을 참고하세요.

다음 단계

Imagen 및 Vertex AI의 기타 생성형 AI 제품 관련 문서 읽기:

피사체 맞춤설정 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

사용 사례

의도된 사용 사례

의도하지 않은 사용 사례의 예시

피사체 맞춤설정 예시

사람 맞춤설정

제품 맞춤설정

시작하기 전에

Console

REST

피사체 맞춤설정

사람 맞춤설정

REST

curl

PowerShell

Python

제품 맞춤설정

콘솔

REST

curl

PowerShell

제품 사용량

모델 버전

다음 단계

피사체 맞춤설정