你可以使用 Gemini 根據文字提示詞生成圖像。支援的介面包括 Google Cloud 控制台和 Agent Platform API。
下列 Gemini 模型支援生成圖像:
按一下即可展開支援的機型
如要進一步瞭解 Gemini 模型的功能,請參閱「Gemini 模型」。
生成圖像
以下說明如何使用 Agent Studio 或 API 生成圖片。
如要進一步瞭解提示詞的最佳做法,請參閱「設計多模態提示詞」。
控制台
如要使用 Gemini 生成圖像,請按照下列步驟操作:
- 開啟 Agent Studio > 建立提示。
- 按一下「切換模型」,然後選取顯示的模型。
- 在「輸出」面板中,從下拉式選單選取「圖片和文字」。
- 在「撰寫提示」文字區域中,輸入要生成的圖片說明。
- 按一下「提示」 () 按鈕。
Gemini 會根據您的描述生成圖片。這項程序需要幾秒鐘,但視容量而定,速度可能會相對較慢。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Go
瞭解如何安裝或更新 Go。
詳情請參閱 SDK 參考文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Node.js
安裝
npm install @google/genai
詳情請參閱 SDK 參考文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Java
瞭解如何安裝或更新 Java。
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
REST
在終端機中執行下列指令,在目前目錄中建立或覆寫這個檔案:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{
"text": "Create a tutorial explaining how to make a peanut butter and jelly sandwich in three easy steps."
}
]
},
"generationConfig": {
"responseModalities": ["TEXT", "IMAGE"],
"imageConfig": {
"aspectRatio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 會根據您的描述生成圖片。這項程序只需要幾秒鐘,但視容量而定,速度可能會比較慢。
生成圖像與文字交雜的內容
你可以使用 Gemini 生成穿插文字回覆的圖片。舉例來說,你可以為生成的食譜中的每個步驟生成圖片,不必分別向模型提出要求。
下列 Gemini 模型支援生成圖像與文字交雜的內容:
按一下即可展開支援的機型
控制台
如要生成圖像與文字回應交雜的內容,請按照下列步驟操作:
- 開啟 Agent Studio > Create prompt。
- 按一下「切換模型」,然後選取顯示的模型。
- 在「輸出」面板中,從下拉式選單選取「圖片和文字」。
- 在「撰寫提示」文字區域中,輸入要生成的圖片說明。例如:「製作教學課程,說明如何用簡單的三個步驟製作花生醬和果醬三明治。請為每個步驟提供標題 (附上步驟編號)、說明,並生成圖片,每張圖片的長寬比為 1:1。"
- 按一下「提示」 () 按鈕。
Gemini 會根據說明生成回覆。這項程序只需要幾秒鐘,但視容量而定,速度可能會比較慢。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Java
瞭解如何安裝或更新 Java。
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Go
瞭解如何安裝或更新 Go。
詳情請參閱 SDK 參考文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
Node.js
安裝
npm install @google/genai
詳情請參閱 SDK 參考文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_ENTERPRISE=True
REST
在終端機中執行下列指令,在目前目錄中建立或覆寫這個檔案:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://${API_ENDPOINT}:generateContent \
-d '{
"contents": {
"role": "USER",
"parts": [
{
"text": "Generate an illustrated recipe for a paella. Create images to
go alongside the text as you generate the recipe."
}
]
},
"generationConfig": {
"responseModalities": ["TEXT", "IMAGE"],
"imageConfig": {
"aspectRatio": "16:9",
},
},
"safetySettings": {
"method": "PROBABILITY",
"category": "HARM_CATEGORY_DANGEROUS_CONTENT",
"threshold": "BLOCK_MEDIUM_AND_ABOVE"
},
}' 2>/dev/null >response.json
Gemini 會根據您的描述生成圖片。這項程序只需要幾秒鐘,但視容量而定,速度可能會比較慢。
後續步驟
如要進一步瞭解 Gemini 圖像生成功能,請參閱下列連結: