Imagen 3 のカスタマイズのスタイル カスタマイズ機能を使用すると、入力したテキスト プロンプトと参照画像から新しい画像を生成できます。その際、参照画像が新しい画像生成のガイドとなります。
ユースケース
Imagen 3 のカスタマイズでは、フリースタイル プロンプトを使用できます。これにより、トレーニングされた以上のことができるという印象を与える可能性があります。以降のセクションでは、Imagen 3 のカスタマイズの想定されるユースケースと、想定外のユースケースの例について説明します。
Imagen 3 のカスタマイズは、想定されたユースケースで使用することをおすすめします。これらのユースケースでモデルをトレーニングしており、優れた結果が得られることが期待されるためです。逆に、想定したユースケース以外のことをモデルに実行させようとしても、良い結果は期待できません。
想定されるユースケース
以下は、Imagen 3 のカスタマイズのスタイル カスタマイズ機能を想定したユースケースです。
- 参照画像で指定された特定のスタイルに沿って、テキスト入力から画像を生成する。
- 人物の写真を加工する。
- 人物の写真を加工しつつ、その人の表情はそのまま保つ。
想定しないユースケースの例
Imagen 3 カスタマイズがトレーニングされていないため、結果が不十分になるユースケースの例を以下に示します。
テキストと参照画像を使用して画像を生成し、参照画像から生成された構図をある程度制御できるようにする。
特定の表情をした人物が写っている参照画像から、その人物の画像を生成する。
2 人の人物を別のシーンに配置し、その人物のアイデンティティを保持しながら、参照画像を使用して出力画像のスタイル(油絵など)を指定する。
ペットの写真をスタイライズして絵に変換しつつ、画像の構図を保持または指定する。
クッキーやソファなどの商品を、さまざまな角度で、特定の画像スタイル(特定の色、照明スタイル、アニメーションを使用したフォトリアリスティックなど)に沿って、さまざまなシーンに配置する。
スタイルのカスタマイズの例
次の図は、Imagen 3 カスタマイズ スタイルのカスタマイズの例を示しています。
入力例 | 出力例: |
---|---|
|
![]() |
1 「シンプルなモザイク」というプロンプトから Imagen 3 の画像生成を使用して生成された参照入力画像。
編集とカスタマイズ用 Imagen のモデルカードを表示する
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
環境の認証を設定します。
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。
Google Cloud CLI をインストールします。 インストール後、次のコマンドを実行して Google Cloud CLI を初期化します。
gcloud init
外部 ID プロバイダ(IdP)を使用している場合は、まず連携 ID を使用して gcloud CLI にログインする必要があります。
詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。
スタイルのカスタマイズ
Imagen 3 のカスタマイズを使用する際、スタイルの種類を示す参照画像を指定できます。選択したスタイルは、生成リクエストをどのように作成するかに影響します。
Imagen 3 のカスタマイズで使用するプロンプトは、生成される画像の品質に影響する可能性があります。以降のセクションでは、カスタマイズ リクエストを送信する際の推奨プロンプト テンプレートとサンプルについて説明します。
ユースケース 参照画像 プロンプト テンプレート 例 オブジェクト スタイル サブジェクト画像(1~4) キャプション IMAGE_DESCRIPTION に基づいて、STYLE_DESCRIPTION [1] で画像を生成します。 キャプション a sign saying have a great day に基づいて、neon sign style [1] で画像を生成します。 フェイス メッシュ入力なしの人物画像のスタイル化 被写体画像(1~4) SUBJECT_DESCRIPTION [1] に関する画像を説明に合うように作成してください。 「SUBJECT_DESCRIPTION [1] のポートレート。${PROMPT}。」 a woman with short hair[1] に関する画像を説明に合うように作成してください。「背景がぼかされた 3D アニメスタイルの a woman with short hair[1] のポートレート。かわいらしいキャラクター、笑顔、カメラを見ている、パステルカラーのトーン、高画質、4K、傑作、超詳細、肌の質感、テクスチャ マッピング、柔らかい影、柔らかいリアルな照明、鮮やかな色 フェイス メッシュ入力による人物画像のスタイル化 被写体画像(1~3)
フェイス メッシュ制御画像(1)SUBJECT_DESCRIPTION [1] に関する画像を CONTROL_IMAGE [2] のポーズで説明に合うように作成してください。「SUBJECT_DESCRIPTION [1] のポートレイト。${PROMPT}。」 a woman with short hair [1] に関する画像を control image [2] のポーズで説明に合うように作成してください。「背景がぼやけた 3D アニメスタイルの a woman with short hair [1] のポートレート。かわいらしいキャラクター、笑顔。カメラ、パステル調の色合い、高画質、4K、傑作、超詳細、肌の質感、テクスチャ マッピング、ソフトな影、ソフトでリアルな照明、鮮やかな色 REST
imagen-3.0-capability-001
モデル リクエストの詳細については、imagen-3.0-capability-001
モデル API リファレンスをご覧ください。リクエストのデータを使用する前に、次のように置き換えます。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- LOCATION: プロジェクトのリージョン。たとえば、
us-central1
、europe-west2
、asia-northeast3
です。使用可能なリージョンの一覧については、Vertex AI の生成 AI のロケーションをご覧ください。 - TEXT_PROMPT: 生成する画像をモデルに指示するテキスト プロンプト。Imagen 3 カスタマイズを使用するには、指定する参照画像の
referenceId
を [$referenceId] 形式で配置します。例:- 次のテキスト プロンプトは、
"referenceId": 1
を含む単一の参照画像と、オプションで"styleDescription": "glowing style"
の説明を含むリクエスト用です。 次のキャプションに基づいて、glowing style [1]で画像を生成してください。「山の中にある教会」
- 次のテキスト プロンプトは、
"referenceId"
: 参照画像の ID、あるいは同じ被写体またはスタイルに対応する一連の参照画像の ID。この例では、単一の参照画像のreferenceId
は(1
)です。- BASE64_REFERENCE_IMAGE: 画像生成のガイドとなる参照画像。画像は base64 でエンコードされたバイト文字列として指定する必要があります。
- STYLE_DESCRIPTION: 省略可。
prompt
フィールドで使用できる参照画像のテキストによる説明。次に例を示します。"prompt": "Generate an image in glowing style [1] based on the following caption: A church in the mountain.", [...], "styleImageConfig": { "styleDescription": "glowing style" }
- IMAGE_COUNT: 生成される画像の数。 指定できるのは整数値(1~4)です。デフォルト値: 4。
HTTP メソッドと URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
リクエストの本文(JSON):
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_STYLE", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "styleImageConfig": { "styleDescription": "STYLE_DESCRIPTION" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
リクエストを送信するには、次のいずれかのオプションを選択します。
curl
リクエスト本文を
request.json
という名前のファイルに保存して、次のコマンドを実行します。curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
リクエスト本文を
request.json
という名前のファイルに保存して、次のコマンドを実行します。$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
を含むリクエストに対するものです。レスポンスは、生成された画像のバイトを base64 でエンコードした 2 つの予測オブジェクトを返します。{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Python
プロダクトの使用
Vertex AI の Imagen に関連する使用基準とコンテンツ制限については、使用上のガイドラインをご覧ください。
モデル バージョン
使用できる画像生成モデルは複数あります。詳細については、Imagen モデルをご覧ください。
次のステップ
Imagen や Vertex AI のその他の生成 AI プロダクトに関する次の記事を読む。
- Vertex AI で Imagen 3 を使い始めるためのデベロッパー ガイド
- クリエイターとともにクリエイターのために構築された、新しい生成メディアのモデルとツール
- Gemini の新機能: カスタム Gem と Imagen 3 による画像生成の改善
- Google DeepMind: Imagen 3 - 最も高い品質水準の Text-to-Image モデル
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-10-19 UTC。