Gemini 2.5 Flash Image 支持多种类型的图片修改。
图片修改
Gemini 2.5 Flash Image 的图片生成功能 (gemini-2.5-flash-image
) 除了支持生成图片外,还支持修改图片。Gemini 2.5 Flash Image 支持改进的图片修改和多轮修改,并包含更新的安全过滤器,可提供更灵活、限制更少的用户体验。
它支持以下模态和功能:
图片修改(文本和图片转图片)
- 提示示例:“修改此图片,使其看起来像卡通图片”
- 提示示例:[猫的图片] + [枕头的图片] +“请在这只枕头上制作一张我的猫的十字绣图案。”
多轮图片修改(聊天)
- 提示示例:[上传一张蓝色汽车的图片。]“把这辆车变成敞篷车。”“现在将颜色更改为黄色。” “Add a spoiler.”
修改图片
控制台
如需修改图片,请执行以下操作:
- 依次打开 Vertex AI Studio > 创建提示。
-
点击切换模型,然后从菜单中选择
gemini-2.5-flash-image
。 - 在输出面板中,从下拉菜单中选择图片和文本。
- 点击插入媒体 ( ),并从菜单中选择一个来源,然后按照对话框中的说明操作。
- 在编写提示文本区域中,写下您想对图片进行的修改。
- 点击提示 ( ) 按钮。
Gemini 将根据您的说明生成所提供图片的修改版本。此过程应需要几秒钟,但可能会相对较慢,具体取决于容量。
Python
安装
pip install --upgrade google-genai
如需了解详情,请参阅 SDK 参考文档。
设置环境变量以将 Gen AI SDK 与 Vertex AI 搭配使用:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
了解如何安装或更新 Java。
如需了解详情,请参阅 SDK 参考文档。
设置环境变量以将 Gen AI SDK 与 Vertex AI 搭配使用:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
在终端中运行以下命令,在当前目录中创建或覆盖此文件:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{"file_data": {
"mime_type": "image/jpg",
"file_uri": "<var>FILE_NAME</var>"
}
},
{"text": "Convert this photo to black and white, in a cartoonish style."},
]
},
"generation_config": {
"response_modalities": ["TEXT", "IMAGE"],
"image_config": {
"aspect_ratio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 将根据您的说明生成图片。此过程应需要几秒钟,但可能会相对较慢,具体取决于容量。
多轮图片修改
Gemini 2.5 Flash Image 还支持改进的多轮修改,让您在收到修改后的图片回答后,可以向模型提供更改意见。这使您可以继续以对话方式修改图片。
请注意,建议将整个请求文件的大小限制为 50MB 以内。
如需测试多轮图片修改,请试用我们的 Gemini 2.5 Flash Image 笔记本。