Vertex AI 說明文件不再更新
Vertex AI 的服務現已併入 Gemini Enterprise Agent Platform。如要查看最新資訊,請參閱 Agent Platform 說明文件。
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
佈建輸送量總覽
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
本頁說明佈建輸送量,以及何時應使用佈建輸送量。
佈建輸送量簡介
「佈建的處理量」是固定費用的固定期限訂閱方案,提供多種期限長度,可為 Vertex AI 上的支援生成式 AI 模型預留處理量。如要預留處理量,您必須指定模型和模型執行的可用位置。
使用佈建輸送量的時機
如果下列任一考量因素適用於您的用途,請考慮使用佈建輸送量:
- 您要建構即時生成式 AI 製作應用程式,例如聊天機器人和代理程式。
- 重要工作負載一律需要高處理量。輸送量測量取決於模型。
- 您希望為應用程式使用者提供一致且可預測的體驗。
- 您希望支付固定月費或週費,並控管超額費用,以確定生成式 AI 費用。
「已佈建的處理量」是使用生成式 AI 模型的方式之一。如要瞭解所有用量方案,請參閱「用量方案」。
後續步驟
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2026-06-03 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2026-06-03 (世界標準時間)。"],[],[]]