Gemini 2.5 Flash Image(gemini-2.5-flash-image)では画像の編集とマルチターン編集が改善され、より柔軟で制限の少ないユーザー エクスペリエンスを提供するように更新された安全フィルターが含まれています。
モデルの機能の詳細については、Gemini モデルをご覧ください。
画像を編集する
コンソール
画像を編集するには、次の操作を行います。
- [Vertex AI Studio] > [プロンプトを作成] を開きます。
-
[モデルの切り替え] をクリックし、メニューから次のいずれかのモデルを選択します。
gemini-2.5-flash-imagegemini-3-pro-image-preview
- [出力] パネルで、プルダウン メニューから [画像とテキスト] を選択します。
- [メディアを挿入]()をクリックし、メニューからソースを選択して、ダイアログの指示に沿って操作します。
- [プロンプトを入力] テキスト領域に、画像に加える編集内容を入力します。
- [プロンプト]()ボタンをクリックします。
Gemini は、入力された説明に基づいて、提供された画像の編集バージョンを生成します。このプロセスには数秒かかりますが、容量によっては比較的遅くなることがあります。
Python
インストール
pip install --upgrade google-genai
詳しくは、SDK リファレンス ドキュメントをご覧ください。
Vertex AI で Gen AI SDK を使用するための環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
Java をインストールまたは更新します。
詳しくは、SDK リファレンス ドキュメントをご覧ください。
Vertex AI で Gen AI SDK を使用するための環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Go
Go をインストールまたは更新する方法について学びます。
詳しくは、SDK リファレンス ドキュメントをご覧ください。
Vertex AI で Gen AI SDK を使用するための環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
インストール
npm install @google/genai
詳しくは、SDK リファレンス ドキュメントをご覧ください。
Vertex AI で Gen AI SDK を使用するための環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
ターミナルで次のコマンドを実行して、このファイルを現在のディレクトリに作成または上書きします。
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{"fileData": {
"mimeType": "image/jpg",
"fileUri": "FILE_NAME"
}
},
{"text": "Convert this photo to black and white, in a cartoonish style."},
]
},
"generationConfig": {
"responseModalities": ["TEXT", "IMAGE"],
"imageConfig": {
"aspectRatio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 2.5 Flash Image は、1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9 のアスペクト比に対応しています。
Gemini は、説明に基づいて画像を生成します。このプロセスには数秒かかりますが、容量によっては比較的遅くなることがあります。
マルチターンの画像編集
Gemini 2.5 Flash Image と Gemini 3 Pro Image では、マルチターンの編集の改善もサポートされています。これにより、編集された画像レスポンスを受け取った後に、変更内容をモデルに送信できます。
リクエスト ファイル全体のサイズは、最大 50 MB に制限することをおすすめします。
マルチターンの画像編集を試すには、次のノートブックをご覧ください。
Gemini 3 Pro Image を使用したマルチターンの画像作成と編集に関連するコードサンプルについては、思考シグネチャを使用したマルチターン画像編集の例をご覧ください。
次のステップ
Gemini の画像生成について詳しくは、以下のリンクをご覧ください。