已佈建的處理量總覽

本頁說明佈建輸送量,以及何時應使用佈建輸送量。

佈建輸送量簡介

「佈建的處理量」是固定費用的固定期限訂閱方案,提供多種期限長度,可為 Vertex AI 上的支援生成式 AI 模型預留處理量。如要預留處理量,您必須指定模型和模型執行的可用位置

使用佈建輸送量的時機

如果下列任一考量因素適用於您的用途,請考慮使用佈建輸送量:

  • 您要建構即時生成式 AI 製作應用程式,例如聊天機器人和代理程式。
  • 重要工作負載一律需要高處理量。輸送量測量取決於模型。
  • 您希望為應用程式使用者提供一致且可預測的體驗。
  • 您希望支付固定月費或週費,並控管超額費用,以確定生成式 AI 費用。

「已佈建的處理量」是使用生成式 AI 模型的方式之一。如要瞭解所有用量方案,請參閱「用量方案」。

後續步驟