Gemini 2.5 Flash Image 支援多種圖像編輯類型。
圖像編輯
Gemini 2.5 Flash Image 可生成及編輯圖片 (gemini-2.5-flash-image
)。Gemini 2.5 Flash Image 支援更完善的圖像編輯和多輪編輯功能,並提供更新的安全篩選器,讓使用者體驗更靈活、限制更少。
支援的模態和功能如下:
圖片編輯 (文字和圖片轉為圖片)
- 範例提示:「將這張圖片編輯成卡通風格」
- 範例提示:[貓咪圖片] + [枕頭圖片] +「在這顆枕頭上製作我貓咪的十字繡。」
多輪圖像編輯 (對話)
- 提示範例:[上傳藍色汽車的圖片。] 「把這輛車變成敞篷車。」「Now change the color to yellow.」(現在將顏色改為黃色) 「新增劇透內容。」
編輯圖片
控制台
如要編輯圖片,請按照下列步驟操作:
- 開啟 Vertex AI Studio > 建立提示詞。
-
按一下「切換模型」,然後從選單中選取
gemini-2.5-flash-image
。 - 在「輸出」面板中,從下拉式選單選取「圖片和文字」。
- 按一下「插入媒體」圖示 ( ),然後從選單中選取來源,並按照對話方塊的指示操作。
- 在「撰寫提示」 文字區域中,寫下要對圖片進行的編輯。
- 按一下「提示」 ( ) 按鈕。
Gemini 會根據你的描述,生成所提供圖片的編輯版本。這項程序應該只需要幾秒鐘,但視容量而定,速度可能會相對較慢。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
瞭解如何安裝或更新 Java。
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
在終端機中執行下列指令,在目前目錄中建立或覆寫這個檔案:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{"file_data": {
"mime_type": "image/jpg",
"file_uri": "<var>FILE_NAME</var>"
}
},
{"text": "Convert this photo to black and white, in a cartoonish style."},
]
},
"generation_config": {
"response_modalities": ["TEXT", "IMAGE"],
"image_config": {
"aspect_ratio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 會根據你的描述生成圖片。這項程序應該只需要幾秒鐘,但視容量而定,可能需要較長的時間。
多輪圖像編輯
Gemini 2.5 Flash Image 也支援改良的多輪編輯功能,讓您在收到編輯過的回覆圖片後,可以向模型回覆變更。這樣一來,你就能繼續透過對話編輯圖片。
請注意,建議將整個要求檔案大小限制在 50MB 以下。
如要測試多輪圖像編輯功能,請試用 Gemini 2.5 Flash Image 筆記本。