Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

支援的模型

下表列出支援佈建輸送量的模型、每個生成式 AI 擴充單元 (GSU) 的處理量，以及每個模型的消耗率。

Google 模型

注意：自 2026 年 6 月 1 日起，gemini-2.0-flash-001和 gemini-2.0-flash-lite-001將停止服務，不再提供使用。這包括提供模型和佈建輸送量。請改用 Gemini 3.1 Flash-Lite、Gemma 4 或更新近的 Gemini 版本。

佈建輸送量僅支援您使用特定模型 ID (而非模型別名)，直接從專案呼叫的模型。如要使用「佈建輸送量」對模型發出 API 呼叫，您必須使用特定模型版本 ID (例如 gemini-2.0-flash-001)，而非模型版本別名。

雖然「佈建輸送量」可確保模型要求容量，但不會納入或略過您可能使用的其他工具配額，例如建立基準。視工作負載大小而定，您可能需要另外要求這些工具的額外配額。

此外，透過其他 Gemini Enterprise Agent Platform 產品 (例如 Vertex AI Agents 和 Agent Search) 呼叫的模型，不支援佈建輸送量。舉例來說，如果您在使用 Agent Search 時對 Gemini 2.0 Flash 進行 API 呼叫，則 Gemini 2.0 Flash 的佈建輸送量訂單無法保證 Agent Search 進行的呼叫。

佈建輸送量不支援批次預測呼叫。

下表列出支援佈建輸送量的 Google 模型，以及這些模型的輸送量、購買增量和消耗率。每秒處理量是指每秒所有要求中的提示輸入和生成輸出。

如要瞭解工作負載所需的詞元數量，請參閱 SDK 分詞器或 countTokens API 的相關說明。

型號	每 GSU 的每秒總處理量	單位	最低 GSU 購買增量	燃盡率
Gemini 3 Pro Image 最新支援版本：`gemini-3-pro-image`	500	權杖	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸出回覆文字權杖 = 6 個權杖 1 個輸出推論文字權杖 = 6 個權杖 1 個輸出圖片權杖 = 60 個權杖
Gemini 3.1 Flash Image 最新支援版本：`gemini-3.1-flash-image`	2015	權杖	1	1 個輸入文字詞元 = 1 個詞元 1 個輸入圖片詞元 = 1 個詞元 1 個輸入影片詞元 = 1 個詞元 1 個輸出回覆文字詞元 = 6 個詞元 1 個輸出推論文字詞元 = 6 個詞元 1 個輸出圖片詞元 = 120 個詞元
Gemini 3.5 Flash 最新支援版本：`gemini-3.5-flash`	675	權杖	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸入影片權杖 = 1 個權杖 1 個輸入音訊權杖 = 1 個權杖 1 個輸入文字快取權杖 = 0.1 個權杖 1 個輸入圖片快取權杖 = 0.1 個權杖 1 個輸入影片快取權杖 = 0.1 個權杖 1 個輸入音訊快取權杖 = 0.1 個權杖 1 個輸出文字權杖 = 6 個權杖
Gemini 3.1 Flash-Lite 最新支援版本：`gemini-3.1-flash-lite`	4030	權杖	1	1 個輸入文字詞元 = 1 個詞元 1 個輸入圖片詞元 = 1 個詞元 1 個輸入影片詞元 = 1 個詞元 1 個輸入音訊詞元 = 2 個詞元 1 個輸入文字快取詞元 = 0.1 個詞元 1 個輸入圖片快取詞元 = 0.1 個詞元 1 個輸入影片快取詞元 = 0.1 個詞元 1 個輸入音訊快取詞元 = 0.2 個詞元 1 個輸出回覆文字詞元 = 6 個詞元 1 個輸出推論文字詞元 = 6 個詞元
Gemini 3.1 Flash Image 最新支援版本：`gemini-3.1-flash-image-preview` (預覽版)	2015	權杖	1	1 個輸入文字詞元 = 1 個詞元 1 個輸入圖片詞元 = 1 個詞元 1 個輸出文字詞元 = 6 個詞元 1 個輸出圖片詞元 = 120 個詞元
Gemini 3.1 Pro 最新支援版本：`gemini-3.1-pro-preview` (預覽版)	500	權杖	1	輸入權杖數小於或等於 200,000 個： 1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸入影片權杖 = 1 個權杖 1 個輸入音訊權杖 = 1 個權杖 1 個輸入快取權杖 = 0.1 個權杖 1 個輸出回應文字權杖 = 6 個權杖 1 個輸出推論文字權杖 = 6 個權杖輸入權杖數大於 200,000 個： 1 個輸入文字權杖 = 2 個權杖 1 個輸入圖片權杖 = 2 個權杖 1 個輸入影片權杖 = 2 個權杖 1 個輸入音訊權杖 = 2 個權杖 1 個輸入快取權杖 = 0.2 個權杖 1 個輸出回應文字權杖 = 9 個權杖 1 個輸出推論文字權杖 = 9 個權杖
Gemini 3 Flash 最新支援版本：`gemini-3-flash-preview` (預覽版)	2015	權杖	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸入影片權杖 = 1 個權杖 1 個輸入音訊權杖 = 2 個權杖 1 個輸入文字、圖片、影片快取權杖 = 0.1 個權杖 1 個輸入音訊快取權杖 = 0.2 個權杖 1 個輸出回應文字權杖 = 6 個權杖 1 個輸出推論文字權杖 = 6 個權杖
Gemini 3 Pro Image 最新支援版本：`gemini-3-pro-image-preview` (預覽版)	500	權杖	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸出文字權杖 = 6 個權杖 1 個輸出思考權杖 = 6 個權杖 1 個輸出圖片權杖 = 60 個權杖
Gemini 2.5 Pro 最新支援版本：`gemini-2.5-pro`	650	權杖	1	輸入內容權杖數不超過 200,000 個： 1 個輸入內容文字詞元 = 1 個詞元 1 個輸入內容圖片詞元 = 1 個詞元 1 個輸入內容影片詞元 = 1 個詞元 1 個輸入內容音訊詞元 = 1 個詞元 1 個輸出回應文字詞元 = 8 個詞元 1 個輸出推論文字詞元 = 8 個詞元輸入內容權杖數超過 200,000 個： 1 個輸入內容文字詞元 = 2 個詞元 1 個輸入內容圖片詞元 = 2 個詞元 1 個輸入內容影片詞元 = 2 個詞元 1 個輸入內容音訊詞元 = 2 個詞元 1 個輸出回應文字詞元 = 12 個詞元 1 個輸出推論文字詞元 = 12 個詞元
Gemini 2.5 Flash Image 最新支援版本：`gemini-2.5-flash-image`	2,690	權杖	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸出文字權杖 = 9 個權杖 1 個輸出圖片權杖 = 100 個權杖
Gemini 2.5 Flash 最新支援版本：`gemini-2.5-flash`	2690	權杖	1	1 個輸入文字詞元 = 1 個詞元 1 個輸入圖片詞元 = 1 個詞元 1 個輸入影片詞元 = 1 個詞元 1 個輸入音訊詞元 = 4 個詞元 1 個輸出回應文字詞元 = 9 個詞元 1 個輸出推論文字詞元 = 9 個詞元
Gemini 2.5 Flash-Lite 最新支援版本 (GA)：`gemini-2.5-flash-lite` 最新支援版本 (預覽版)：`gemini-2.5-flash-lite-preview-09-2025`	8,070	權杖	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸入影片權杖 = 1 個權杖 1 個輸入音訊權杖 = 3 個權杖 1 個輸出回應文字權杖 = 4 個權杖 1 個輸出推論文字權杖 = 4 個權杖
Gemini 2.5 Flash，搭配 Gemini Live API 原生音訊最新支援版本：`gemini-live-2.5-flash-native-audio`	1,620	權杖	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入音訊權杖 = 6 個權杖 1 個輸入影片權杖 = 6 個權杖 1 個輸入圖片權杖 = 6 個權杖 1 個輸入工作階段記憶體權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖 1 個輸出音訊權杖 = 24 個權杖
Veo 3.1 Lite Generate 最新支援版本：`veo-3.1-lite-generate-001`	0.0350	影片秒數 (720p)	1	1 秒的輸出影片 (720p) = 1 秒的輸出影片
		影片和音訊秒數 (720p)	1	1 秒的 720p 輸出影片 + 音訊 = 1.75 秒的輸出影片
		影片秒數 (1080p)	1	1 秒 (1080p) 輸出影片 = 1.75 秒 (720p) 輸出影片
		音訊和影片秒數 (1080p)	1	1 秒 (1080p) 的輸出影片 + 音訊 = 2.33 秒 (720p) 的輸出影片
Veo 3.1 最新支援版本：`veo-3.1-generate-001`	0.0040	影片秒數	1	1 秒輸出影片 = 1 秒輸出影片
Veo 3.1 最新支援版本：`veo-3.1-generate-001`	0.0040	影片和音訊秒數	1	1 秒輸出影片 + 音訊 = 2 秒輸出影片
Veo 3.1 Fast 最新支援版本：`veo-3.1-fast-generate-001`	0.01	影片秒數 (720p)	1	1 秒的輸出影片 (720p) = 1 秒的輸出影片
		影片和音訊秒數 (720p)	1	1 秒的 720p 輸出影片 + 音訊 = 1.30 秒的輸出影片
		影片秒數 (1080p)	1	1 秒 1080p 輸出影片 = 1.30 秒 720p 輸出影片
		音訊和影片秒數 (1080p)	1	1 秒的 1080p 輸出影片 + 音訊 = 1.60 秒的 720p 輸出影片
		影片秒數 (4K)	1	1 秒 (4K) 輸出影片 = 3.40 秒 (720p) 輸出影片
		影片和音訊秒數 (4K)	1	1 秒的 4K 輸出影片和音訊 = 4 秒的 720p 輸出影片
Veo 3 最新支援版本：`veo-3.0-generate-001`	0.0040	影片秒數	1	1 秒輸出影片 = 1 秒輸出影片
Veo 3 最新支援版本：`veo-3.0-generate-001`	0.0040	影片和音訊秒數	1	1 秒輸出影片 + 音訊 = 2 秒輸出影片
Veo 3 Fast 最新支援版本：`veo-3.0-fast-generate-001`	0.01	影片秒數 (720p)	1	1 秒的輸出影片 (720p) = 1 秒的輸出影片
		影片和音訊秒數 (720p)	1	1 秒的 720p 輸出影片 + 音訊 = 1.30 秒的輸出影片
		影片秒數 (1080p)	1	1 秒 1080p 輸出影片 = 1.30 秒 720p 輸出影片
		音訊和影片秒數 (1080p)	1	1 秒的 1080p 輸出影片 + 音訊 = 1.60 秒的 720p 輸出影片

如要瞭解模型的功能和輸入/輸出限制，請參閱模型說明文件。

要求存取權：模型 gemini-live-2.5-flash 屬於私人正式發布版。如要瞭解如何取得這個版本，請參閱存取權要求頁面。

新機型推出後，你隨時可以升級。如要瞭解模型供應情形和停用日期，請參閱「Google 模型」。

如要進一步瞭解支援的地區，請參閱「適用地區」。

合作夥伴模型

下表列出支援佈建輸送量的合作夥伴模型的處理量、購買增量和消耗率。Claude 模型的處理量以每秒權杖數計算，定義為每秒所有要求中輸入和輸出權杖的總數。

型號	每個 GSU 的處理量 (每秒權杖數)	最低 GSU 購買量	GSU 購買增量	燃盡率
Anthropic 的 Claude Opus 4.8	210	35	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Opus 4.7	210	35	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Sonnet 4.6	350	25	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Opus 4.6	210	35	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Opus 4.5	210	35	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Sonnet 4.5	350	25	1	輸入的權杖少於 20 萬個： 1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖輸入的權杖大於或等於 20 萬個： 1 個輸入權杖 = 2 個權杖 1 個輸出權杖 = 7.5 個權杖 1 個快取寫入 5 分鐘權杖 = 2.5 個權杖 1 個快取寫入 1 小時權杖 = 4 個權杖 1 個快取命中權杖 = 0.2 個權杖
Anthropic 的 Claude Opus 4.1	70	35	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Haiku 4.5	1,050	8	1	輸入權杖少於 200,000 個： 1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Opus 4	70	35	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude Sonnet 4	350	25	1	輸入的權杖少於 20 萬個： 1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖輸入的權杖大於或等於 20 萬個： 1 個輸入權杖 = 2 個權杖 1 個輸出權杖 = 7.5 個權杖 1 個快取寫入 5 分鐘權杖 = 2.5 個權杖 1 個快取寫入 1 小時權杖 = 4 個權杖 1 個快取命中權杖 = 0.2 個權杖
Anthropic 的 Claude 3.7 Sonnet (已淘汰)	350	25	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 公尺權杖 = 1.25 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude 3.5 Sonnet v2 (已淘汰)	350	25	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 公尺權杖 = 1.25 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude 3.5 Haiku (已淘汰)	2,000	10	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude 3 Opus	70	35	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 公尺權杖 = 1.25 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude 3 Haiku (已淘汰)	4,200	5	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 分鐘權杖 = 1.25 個權杖 1 個快取寫入 1 小時權杖 = 2 個權杖 1 個快取命中權杖 = 0.1 個權杖
Anthropic 的 Claude 3.5 Sonnet (已淘汰)	350	25	1	1 個輸入權杖 = 1 個權杖 1 個輸出權杖 = 5 個權杖 1 個快取寫入 5 公尺權杖 = 1.25 個權杖 1 個快取命中權杖 = 0.1 個權杖

如要瞭解支援的地點，請參閱「Anthropic Claude 區域支援情形」。如要為 Anthropic 模型訂購佈建輸送量，請與您的Google Cloud 帳戶代表聯絡。

開放式模型

下表列出支援佈建總處理量的開放模型的總處理量、購買增量和消耗率。

型號	每個 GSU 的處理量 (每秒權杖數)	最低 GSU 購買量	GSU 購買增量	燃盡率
DeepSeek-OCR 最新支援版本：`deepseek-ocr-maas`	3,360	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
DeepSeek-V3.2 DeepSeek-V3.2 最新支援版本：`deepseek-v3.2-maas`	1,680	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
Gemma 4 26B A4B IT 最新支援版本：`gemma-4-26b-a4b-it-maas` 這個模型支援的預先佈建輸送量會以與 Google 模型相同的 SKU 計費，但須遵守開放模型功能。	6,725	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
Kimi K2 Thinking 最新支援版本：`kimi-k2-thinking-maas`	1,680	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
Llama 3.3 70B 最新支援版本：`llama-3.3-70b-instruct-maas`	1,400	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 1 個權杖
Llama 4 Maverick 17B-128E 最新支援版本：`llama-4-maverick-17b-128e-instruct-maas`	2,800	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
Llama 4 Scout 17B-16E 最新支援版本：`llama-4-scout-17b-16e-instruct-maas`	4,035	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸入圖片權杖 = 1 個權杖 1 個輸出文字權杖 = 3 個權杖
MiniMax M2 最新支援版本：`minimax-m2-maas`	3,360	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
OpenAI gpt-oss 120B 最新支援版本：`gpt-oss-120b-maas`	11,205	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
OpenAI gpt-oss 20B 最新支援版本：`gpt-oss-20b-maas`	14,405	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
Qwen3 235B 最新支援版本：`qwen3-235b-a22b-instruct-2507-maas`	4,035	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
Qwen3 Coder 最新支援版本：`qwen3-coder-480b-a35b-instruct-maas`	1,010	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
Qwen3-Next-80B Instruct 最新支援版本：`qwen3-next-80b-a3b-instruct-maas`	6,725	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 8 個權杖
Qwen3-Next-80B Thinking 最新支援版本：`qwen3-next-80b-a3b-thinking-maas`	6,725	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 8 個權杖
GLM 4.7 最新支援版本：`glm-4.7-maas`	1,685	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 4 個權杖
GLM 5 最新支援版本：`glm-5-maas`	1,010	1	1	1 個輸入文字權杖 = 1 個權杖 1 個輸出文字權杖 = 3 個權杖

Google 和開放模型提供的功能

下表列出 Google 模型和開放模型搭配佈建輸送量時可用的功能：

功能	Google 模型	開放式模型 (預覽版)
透過 Google Cloud 控制台訂購	是	是
支援全域端點	請參閱「全球端點模型支援」。	請參閱「全球端點模型支援」。
支援監督式微調模型	是	否
支援使用 API 金鑰	是	否
整合隱含脈絡快取功能	是	不適用
整合明確的脈絡快取功能	是	不適用
機器學習處理	適用於特定區域。詳情請參閱「單一區域佈建輸送量」。	不適用
可用的訂單條款	1 週、1 個月、3 個月和 1 年	1 週、1 個月、3 個月和 1 年
從控制台變更訂單	是	否
訂單狀態：待審、已核准、有效、已過期	是	是
預設情況下，超出配額的用量會溢出至即付即用方案	是	是
API 標頭控制項：使用「專用」只使用佈建的輸送量，或使用「共用」只使用即付即用	是	是
監控：指標、資訊主頁和快訊	是	是

支援全球端點模型

佈建輸送量支援 Google 模型和開放模型的全球端點。

預設情況下，超出佈建輸送量配額的流量會使用全域端點。

如要將佈建輸送量指派給模型的全域端點，請在下達佈建輸送量訂單時選取 global 做為區域。

支援全球端點的 Google 模型

下表列出「佈建輸送量」支援全域端點的 Google 模型：

型號	最新支援的模型版本
Gemini 3 Pro 圖片	`gemini-3-pro-image`
Gemini 3.1 Flash Image	`gemini-3.1-flash-image`
Gemini 3.5 Flash	`gemini-3.5-flash`
Gemini 3.1 Flash-Lite	`gemini-3.1-flash-lite`
Gemini 3.1 Flash Image 預先發布版	`gemini-3.1-flash-image-preview`
Gemini 3.1 Pro 預先發布版	`gemini-3.1-pro-preview`
Gemini 3 Flash 預先發布版	`gemini-3-flash-preview`
Gemini 3 Pro 圖片預先發布版	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash 預先發布版	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite 預先發布版	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash Image	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`

支援全域端點的開放原始碼模型

下表列出可透過全球端點使用佈建輸送量的開放模型：

型號	最新支援的模型版本
DeepSeek-OCR	`deepseek-ocr-maas`
DeepSeek-V3.2	`deepseek-v3.2-maas`
Kimi K2 思考型	`kimi-k2-thinking-maas`
MiniMax M2	`minimax-m2-maas`
OpenAI gpt-oss 120B	`gpt-oss-120b-maas`
Qwen3-Next-80B Instruct	`qwen3-next-80b-a3b-instruct-maas`
Qwen3-Next-80B Thinking	`qwen3-next-80b-a3b-thinking-maas`
GLM 4.7	`glm-4.7-maas`
GLM 5	`glm-5-maas`

支援監督式微調模型

如果 Google 模型支援監督式微調，則支援下列項目：

佈建輸送量可套用至基礎模型，以及這些基礎模型的監督式微調版本。
監督式微調模型端點和對應的基礎模型會計入相同的佈建輸送量配額。

舉例來說，為特定專案的 gemini-2.0-flash-lite-001 購買的佈建輸送量，會優先處理從該專案中建立的 gemini-2.0-flash-lite-001 監督式微調版本提出的要求。請使用適當的標頭來控管流量行為。

後續步驟

計算佈建輸送量需求。

支援的模型 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

Google 模型

合作夥伴模型

開放式模型

Google 和開放模型提供的功能

支援全球端點模型

支援全球端點的 Google 模型

支援全域端點的開放原始碼模型

支援監督式微調模型

後續步驟

支援的模型