單一可用區佈建輸送量可讓您在只有一個可用區的特定區域預留輸送量。在需要機器學習處理的用途中,這項選項可為 Gemini 模型提供可預測的效能。
如要查看支援的機型和地區清單,請參閱「部署作業和端點」。如需支援機器學習處理的區域和模型清單,請參閱「機器學習處理」一文。
單一區域佈建輸送量的功能
本節將說明單一可用區佈建輸送量的主要功能:
價格和單位與標準佈建輸送量一致: 單一區域佈建輸送量使用的輸送量評估標準 (GSUs)、 價格和條款,與標準佈建輸送量相同。
單一可用區佈建輸送量支援區域內機器學習處理作業:所有要求都會在購買的區域中處理,包括超過購買輸送量額度的流量。這類流量會以該區域的緩衝區容量,按照隨用隨付費率計費。
您可控管超出用量:您可以使用與標準佈建輸送量相同的標頭,控管溢出流量。
監控訂單:您可以使用現有的佈建的處理量監控功能,監控單一可用區的佈建處理量訂單。
限制
單一可用區佈建輸送量有下列限制:
單一可用區佈建的處理量並非涵蓋服務,因此不適用於 Vertex AI 上的 Gemini 線上推論服務水準協議。
在沒有 ML 處理的區域,單一可用區佈建輸送量的延遲時間可能高於標準佈建輸送量或隨用隨付。
購買單一可用區佈建的處理量
如需購買單一區域佈建輸送量方面的協助,請與您的帳戶代表 Google Cloud 聯絡。