Gemini 2.5 Flash Image 支援生成多種模態的回覆,包括文字和圖片。
圖像生成
Gemini 2.5 Flash Image (gemini-2.5-flash-image
) 除了文字,也支援生成圖片。這項功能可擴充 Gemini 的能力,包括:
- 透過自然語言對話反覆生成圖像,並在調整圖像時維持一致性和情境脈絡。
- 生成圖像,並以高品質呈現長篇文字。
- 生成文字和圖片夾雜的內容。舉例來說,單一回合的網誌文章包含文字和圖片。先前,這需要將多個模型串連在一起。
- 運用 Gemini 的世界知識和推理能力生成圖片。
Gemini 2.5 Flash Image 公開實驗版可生成 1024 像素的圖片,支援生成人物圖像,並提供更新的安全性篩選器,帶來更彈性且限制較少的使用者體驗。
支援的模態和功能如下:
文字轉圖像
- 範例提示:「生成艾菲爾鐵塔的圖片,背景要有煙火。」
文字轉圖像 (文字算繪)
- 提示範例:「生成一張電影風格的照片,照片中有一棟大型建築,建築正面投射出巨型文字:「Gemini 2.5 現在可以生成長篇文字」」
文字轉圖像和文字 (交錯)
- 範例提示:「Generate an illustrated recipe for a paella. 在生成食譜的同時建立圖像。」
- 提示範例:「生成以 3D 卡通動畫風格呈現的小狗故事。為每個場景生成圖片
圖片和文字轉為圖片和文字 (交錯)
- 範例提示: (附上已擺放家具的房間圖片)「我的空間適合擺放哪些其他顏色的沙發?可以更新圖片嗎?」
生成符合當地語言習慣的圖像
- 範例提示:「生成早餐圖片。」
最佳做法
如要提升圖像生成結果的品質,請遵循下列最佳做法:
具體說明:提供越多詳細資訊,生成結果就越貼近需求。舉例來說,請改用「華麗的精靈板甲,刻有銀葉圖案,高領和肩甲形狀像獵鷹翅膀」,而非「奇幻盔甲」。
提供背景資訊和意圖:說明圖片的用途,幫助模型瞭解背景資訊。舉例來說,「為高檔極簡護膚品牌設計標誌」的效果會比「設計標誌」更好。
反覆測試及修正:第一次嘗試時,請不要期待能生成完美的圖片。使用後續提示進行微調,例如「將光線調暖」或「將角色的表情改得更嚴肅」。
使用逐步操作說明:如果是複雜的場景,請將要求分成多個步驟。例如:「首先,請在黎明時分生成寧靜的霧中森林背景。接著,在前景中加入長滿青苔的古老石祭壇。最後,將一把發光的劍放在祭壇上。」
描述你想要的內容,而不是不想要的內容:請正面描述場景,例如「空蕩蕩的街道,沒有任何交通跡象」,而不是說「沒有車輛」。
控制攝影機:引導攝影機視角。使用攝影和電影術語描述構圖,例如「廣角拍攝」、「微距拍攝」或「低角度透視」。
圖片提示:使用「製作…的圖片」或「生成…的圖片」等詞組描述意圖。否則多模態模型可能會以文字而非圖片回覆。
限制:
為獲得最佳成效,請使用下列語言:英文、西班牙文 (墨西哥)、日文、中文 (中國)、印地文。
圖像生成功能不支援音訊或影片輸入內容。
模型可能不會生成您要求的確切圖片數量。
為獲得最佳結果,輸入內容最多可包含三張圖片。
生成含有文字的圖片時,請先生成文字,然後再生成含有該文字的圖片。
在下列情況下,圖片或文字生成功能可能無法正常運作:
模型可能只會生成文字。如要生成圖片,請在要求中明確提出。例如「提供圖片」。
模型可能會將文字做為圖片建立。如要生成文字,請明確要求文字輸出。例如「生成敘事文字和插圖」。
即使模型尚未完成生成內容,也可能會停止。如果發生這種情況,請再試一次或改用其他提示。
如果提示可能含有不當內容,模型可能不會處理要求,並傳回無法建立不當圖片的回應。在本例中,
FinishReason
是STOP
。
生成圖像
以下章節將說明如何使用 Vertex AI Studio 或 API 生成圖片。
如需提示詞的指南和最佳做法,請參閱「設計多模態提示」。
控制台
如要使用圖像生成功能,請按照下列步驟操作:
- 開啟 Vertex AI Studio > 建立提示詞。
-
按一下「切換模型」,然後從選單中選取
gemini-2.5-flash-image
。 - 在「輸出」面板中,從下拉式選單選取「圖片和文字」。
- 在「撰寫提示」文字區域中,描述要生成的圖片。
- 按一下「提示」 ( ) 按鈕。
Gemini 會根據你的描述生成圖片。這項程序應可在幾秒內完成,但視容量而定,速度可能會較慢。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
安裝
npm install @google/genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
瞭解如何安裝或更新 Java。
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
在終端機中執行下列指令,在目前目錄中建立或覆寫這個檔案:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": { "text": "Create a tutorial explaining how to make a peanut butter and jelly sandwich in three easy steps."},
},
"generation_config": {
"response_modalities": ["TEXT", "IMAGE"],
"image_config": {
"aspect_ratio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 會根據你的描述生成圖片。這項程序應該只需要幾秒鐘,但視容量而定,可能需要較長的時間。
生成圖像與文字交雜的內容
Gemini 2.5 Flash Image 可在文字回覆中穿插生成圖片。舉例來說,您可以生成食譜中每個步驟的圖片,搭配該步驟的文字,不必另外向模型提出要求。
控制台
如要生成圖像與文字交雜的回覆,請按照下列步驟操作:
- 開啟 Vertex AI Studio > 建立提示詞。
-
按一下「切換模型」,然後從選單中選取
gemini-2.5-flash-image
。 - 在「輸出」面板中,從下拉式選單選取「圖片和文字」。
- 在「撰寫提示」文字區域中,輸入要生成的圖片說明。舉例來說,「製作教學影片,說明如何用簡單三步驟製作花生醬和果醬三明治。針對每個步驟,提供標題 (附上步驟編號)、說明,並生成圖片,每張圖片的長寬比為 1:1。"
- 按一下「提示」 ( ) 按鈕。
Gemini 會根據你的描述生成回覆。這項程序應該只需要幾秒鐘,但視容量而定,可能需要較長的時間。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
瞭解如何安裝或更新 Java。
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
在終端機中執行下列指令,在目前目錄中建立或覆寫這個檔案:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": { "text": "Create a tutorial explaining how to make a peanut butter and jelly sandwich in three easy steps. For each step, provide a title with the number of the step, an explanation, and also generate an image, generate each image in a 1:1 aspect ratio."},
},
"generation_config": {
"response_modalities": ["TEXT", "IMAGE"],
"image_config": {
"aspect_ratio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 會根據你的描述生成圖片。這項程序應該只需要幾秒鐘,但視容量而定,可能需要較長的時間。
生成符合當地語言習慣的圖像
Gemini 2.5 Flash Image 在提供文字或圖片回覆時,也可能會加入你的位置資訊。舉例來說,您可以生成各類地點或體驗的圖片,這些圖片會將您目前的位置納入考量,而不必向模型指定位置。
控制台
如要生成符合當地語言習慣的圖像,請按照下列步驟操作:
- 開啟 Vertex AI Studio > 建立提示詞。
-
按一下「切換模型」,然後從選單中選取
gemini-2.5-flash-image
。 - 在「輸出」面板中,從下拉式選單選取「圖片和文字」。
- 在「撰寫提示」文字區域中,輸入要生成的圖片說明。例如:「Generate a photo of a typical breakfast.」(生成一張典型早餐的相片。)
- 按一下「提示」 ( ) 按鈕。
Gemini 會根據你的描述生成回覆。這項程序應該只需要幾秒鐘,但視容量而定,可能需要較長的時間。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
瞭解如何安裝或更新 Java。
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
在終端機中執行下列指令,在目前目錄中建立或覆寫這個檔案:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": { "text": "Generate a photo of a typical breakfast."},
},
"generation_config": {
"response_modalities": ["TEXT", "IMAGE"],
"image_config": {
"aspect_ratio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 會根據你的描述生成圖片。這項程序應該只需要幾秒鐘,但視容量而定,可能需要較長的時間。