Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

使用專屬公開端點進行線上推論

專屬公開端點是線上推論的公開端點，這項功能有以下優點：

因此，建議您採用專屬公開端點，做為提供 Gemini Enterprise Agent Platform 線上推論的最佳做法。

詳情請參閱「選擇端點類型」。

建立專屬公開端點，並將模型部署至該端點

您可以使用Google Cloud 控制台建立專屬端點，並將模型部署至該端點。詳情請參閱「使用 Google Cloud 控制台部署模型」。

您也可以使用 Gemini Enterprise API 建立專屬公開端點，並將模型部署至該端點，方法如下：

專屬端點支援 HTTP 和 gRPC 通訊協定。如果是 gRPC 要求，必須加入 x-vertex-ai-endpoint-id 標頭，才能正確識別端點。支援的 API 如下：

您可以使用 Python 適用的 Agent Platform SDK，將線上推論要求傳送至專屬公開端點。詳情請參閱「將線上推論要求傳送至專屬公開端點」。