Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

オンライン推論に専用パブリックエンドポイントを使用する

「専用パブリックエンドポイント」は、オンライン推論用のパブリックエンドポイントです。このエンドポイントには次のようなメリットがあります。

このような理由から、Gemini Enterprise Agent Platform オンライン推論のサービス提供には、ベストプラクティスとして専用パブリックエンドポイントをおすすめします。

専用パブリックエンドポイントを作成してモデルをデプロイする

Google Cloud コンソールを使用して、専用エンドポイントを作成し、モデルをデプロイできます。詳細については、コンソールを使用してモデルをデプロイする Google Cloud をご覧ください。

次のように Gemini Enterprise API を使用して、専用パブリックエンドポイントを作成し、モデルをデプロイすることもできます。

専用エンドポイントは、HTTP と gRPC の両方の通信プロトコルをサポートしています。gRPC リクエストの場合、エンドポイントを適切に識別するには、x-vertex-ai-endpoint-id ヘッダーを含める必要があります。次の API がサポートされています。

Agent Platform SDK for Python を使用して、専用パブリックエンドポイントにオンライン推論リクエストを送信できます。詳細については、専用パブリックエンドポイントにオンライン推論リクエストを送信するをご覧ください。

チューニングされた Gemini モデルのデプロイはサポートされていません。
VPC Service Controls はサポートされていません。代わりに Private Service Connect エンドポイントを使用してください。