Vertex AI で画像の生成と編集を行う

Vertex AI の Gemini と Imagen は、Google の最先端の画像生成 AI 機能をアプリケーションデベロッパーに提供します。Vertex AI の Gemini と Imagen を使用すると、アプリケーションデベロッパーは、AI 生成ツールを用いてユーザーの想像力を高品質のビジュアルアセットに変換する次世代の AI プロダクトを数秒で構築できます。

画像生成を試す（Vertex AI Studio）

Colab で Imagen を試す

Gemini と Imagen を使用すると、次のことができます。

テキストプロンプトのみを使用して新しい画像を生成する（テキストから画像の AI 生成）。
自分で定義したマスク領域を使用して、アップロードまたは生成された画像を編集または拡張する。
既存の画像、生成画像、編集された画像をアップスケールする。

前の画像のプロンプト

これらの画像は、一般的な Imagen 3 画像生成モデル（imagen-3.0-generate-002）と次のプロンプトを使用して生成されます。

粘土アニメーションのシーン。高齢女性を中程度のワイドショットで撮影。女性は流れるような衣装を着ています。緑豊かな庭に立って、オレンジ色のじょうろで植物に水をあげています
偏光フィルタを使用してデジタル一眼レフカメラのスタイルで撮影。トルコのカッパドキアのユニークなフォーメーションの岩の上に浮かぶ 2 つの熱気球の写真。風船の色と模様が、下にある風景の土色と美しくコントラストしています。このショットは、そのような体験を楽しむ冒険心を捉えています。
花のつるで覆われた風化した木製のメカロボットが、背の高い野花の咲く野原に静かに立っています。その伸ばした手に小さな青い鳥が止まっています。温かみのある色と柔らかな線のデジタルアニメーション。滝のある大きな崖が後ろにそびえ立っています。
粘土でできた鳥のフィギュアを片方に持ち、もう片方でモデリングツールを使って彫刻している人の手。彫刻家のスカーフが見えます。手には粘土の粉が付いています。質感と職人技を強調したマクロデジタル一眼レフ画像。
テーブルの上に置かれた古い青いガラスの花瓶に、色とりどりの大きな花束が飾られています。前面には、バラ、ユリ、デイジー、蘭、果物、ベリー、緑の葉などのさまざまな花に囲まれた美しい牡丹の花が 1 つあります。背景はダークグレーです。オランダ黄金時代のスタイルの油絵。
草地の丘の上で夕焼けを見つめる少年と父親を描いた漫画本の一コマ。少年の口から出ている吹き出しに「太陽はまた昇る」と書かれています。1990 年代後半の落ち着いた色彩スタイル

クイックスタート: Imagen を使用してテキストプロンプトから画像を生成する

記述テキストのみを入力として使用し、新しい画像を生成できます。次のサンプルは、画像を生成する簡略化されたケースを示していますが、追加のパラメータを使用して、生成された画像をニーズに合わせて調整することもできます。

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

環境の認証を設定します。

Select the tab for how you plan to use the samples on this page:
Python

ローカル開発環境でこのページの Python サンプルを使用するには、gcloud CLI をインストールして初期化し、ユーザー認証情報を使用してアプリケーションのデフォルト認証情報を設定します。
詳細については、 Google Cloud 認証ドキュメントのローカル開発環境の ADC の設定をご覧ください。
REST

このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。
詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。

次のサンプルを使用して画像を生成します。

Python

from google import genai
from google.genai.types import GenerateImagesConfig

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_file = "output-image.png"

image = client.models.generate_images(
    model="imagen-4.0-generate-001",
    prompt="A dog reading a newspaper",
    config=GenerateImagesConfig(
        image_size="2K",
    ),
)

image.generated_images[0].image.save(output_file)

print(f"Created output image using {len(image.generated_images[0].image.image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

REST

環境変数を設定します。

export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT # Replace with your Google Cloud project
export GOOGLE_CLOUD_LOCATION=us-central1 # Replace with the appropriate location for your project

以下のコマンドを実行します。

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
"https://${GOOGLE_CLOUD_LOCATION}-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/imagen-4.0-generate-preview-05-20:predict" -d \
$'{
  "instances": [
    {
      "prompt": "a cat reading a book"
    }
  ],
  "parameters": {
    "sampleCount": 1
  }
}'

モデルは base64 画像バイトオブジェクトを返します。

詳細については、Imagen の Generate images API をご覧ください。

モデルバージョン

使用できる画像生成モデルは複数あります。詳細については、Gemini モデルまたは Imagen モデルをご覧ください。

その他の例を試す

Imagen を使用した Jupyter ノートブックのチュートリアルの一覧については、Vertex AI の生成 AI に関する Cookbook をご覧ください。

Vertex AI で Gemini または Imagen を使用する場合

Gemini の組み込みの画像生成機能を使用するだけでなく、Google の特別な画像生成モデルである Imagen にもアクセスできます。

属性	Gemini の画像	Imagen 4
強み	デフォルトの推奨事項。比類のない柔軟性、コンテキストの理解、シンプルでマスクフリーの編集。マルチターンの会話型編集を独自に実行できます。	最高品質 / レイテンシ
可用性	一般提供	一般提供
レイテンシ	比較的長い。高度な機能にはより多くの計算が必要です。	低。ほぼリアルタイムのパフォーマンス向けに最適化。
費用	トークンベースの料金。	特殊なタスクに費用対効果が高い。
推奨されるタスク	テキストと画像をシームレスにブレンドする、インターリーブされたテキストと画像の生成。複数の画像のクリエイティブ要素を 1 つのプロンプトで組み合わせる。画像に非常に具体的な編集を加えたり、簡単な言語コマンドで個々の要素を変更したり、画像を繰り返し操作する。元の被写体の形やディテールを保持しながら、ある画像の特定のデザインや質感を別の画像に適用する。	画質、フォトリアリズム、芸術的なディテール、特定のスタイル（印象派やアニメなど）を最優先する。ブランディングやスタイルを注入したり、ロゴや商品のデザインを生成する。高度なスペルやタイポグラフィを生成する。

Gemini は、初めて画像生成を行う際に最適なモデルです。高度なユースケースや、最高の画質が必要な場合は、Imagen 4 Ultra を選択します（ただし、一度に 1 枚の画像しか生成できません）。

次のステップ

次のリンクを使用して、機能のドキュメントをご覧ください。

プロンプトガイド

画像を生成するための効果的なプロンプトの作成方法をご確認ください。

入門: 画像を生成する

Vertex AI で Imagen を使用して画像を生成する方法を学習します。

リファレンス: 画像を生成する

Imagen の画像生成リクエストを送信する際のオプションフィールドと必須フィールドについて学びます。

画像クレジット: Vertex AI で Imagen を使用して生成されたすべての画像。

Vertex AI で画像の生成と編集を行う コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

前の画像のプロンプト

クイックスタート: Imagen を使用してテキスト プロンプトから画像を生成する

Python

REST

Python

REST

モデル バージョン

その他の例を試す

Vertex AI で Gemini または Imagen を使用する場合

次のステップ

Vertex AI で画像の生成と編集を行う

クイックスタート: Imagen を使用してテキストプロンプトから画像を生成する

モデルバージョン