エンドポイントのタイプを選択する

オンライン推論用にモデルをデプロイするには、エンドポイントが必要です。エンドポイントは次のタイプに分類できます。

パブリックエンドポイントには、公共のインターネット経由でアクセスできます。プライベートネットワークインフラストラクチャが不要なため、使いやすくなっています。パブリックエンドポイントには、専用と共有の 2 種類があります。専用パブリックエンドポイントは、共有パブリックエンドポイントよりも高速なエンドポイントであり、本番環境の隔離、より大きなペイロードサイズのサポート、より長いリクエストタイムアウトを提供します。また、専用パブリックエンドポイントに推論リクエストを送信すると、他のユーザーのトラフィックから分離されます。このような理由から、専用のパブリックエンドポイントをベストプラクティスとしておすすめします。
Private Service Connect を使用する専用プライベートエンドポイントは、オンプレミスとGoogle Cloudの間のプライベート通信に安全な接続を提供します。これらは、Private Service Connect API を使用して Google API トラフィックを制御するために使用できます。これらはベストプラクティスとして推奨されます。
プライベートエンドポイントは、モデルへの安全な接続も提供し、オンプレミスとGoogle Cloudの間のプライベート通信にも使用できます。VPC ネットワークピアリング接続を介してプライベートサービスアクセスを使用します。

エンドポイントへのモデルのデプロイの詳細については、エンドポイントにモデルをデプロイするをご覧ください。

次の表に、Vertex AI オンライン推論のサービングでサポートされているエンドポイントタイプを比較します。

	専用パブリックエンドポイント（推奨）	共有パブリックエンドポイント	Private Service Connect を使用する専用プライベートエンドポイント（推奨）	プライベートエンドポイント
目的	デフォルトのネットワーキングエクスペリエンス。公共のインターネットからのリクエストの送信を有効にします。	デフォルトのネットワーキングエクスペリエンス。公共のインターネットからのリクエストの送信を有効にします。	本番環境のエンタープライズアプリケーションに推奨されます。リクエストとレスポンスが非公開でルーティングされるようにすることで、ネットワークレイテンシとセキュリティを向上させます。	本番環境のエンタープライズアプリケーションに推奨されます。リクエストとレスポンスが非公開でルーティングされるようにすることで、ネットワークレイテンシとセキュリティを向上させます。
ネットワーキングアクセス	専用のネットワーキングプレーンを使用する公共のインターネット	共有ネットワーキングプレーンを使用する公共のインターネット	Private Service Connect エンドポイントを使用するプライベートネットワーキング	プライベートサービスアクセス（VPC ネットワークピアリング）を使用するプライベートネットワーキング
VPC Service Controls	サポートされていません。代わりに専用プライベートエンドポイントを使用してください。	対応	対応	対応
料金	Vertex AI Inference	Vertex AI Inference	Vertex AI Inference + Private Service Connect エンドポイント	Vertex AI Inference + プライベートサービスアクセス（「Private Service Connect エンドポイント（転送ルール）を使用して、公開済みのサービスにアクセスする」をご覧ください）
ネットワーク遅延	最適化	最適化なし	最適化	最適化
転送データの暗号化	CA 署名付き証明書を使用した TLS	CA 署名付き証明書を使用した TLS	自己署名証明書を使用した TLS（省略可）	なし
推論のタイムアウト	構成可能（最大 1 時間）	60 秒	構成可能（最大 1 時間）	60 秒
ペイロードサイズの上限	10 MB	1.5 MB	10 MB	10 MB
QPM の割り当て	無制限	30,000	無制限	無制限
プロトコルサポート	HTTP または gRPC	HTTP	HTTP または gRPC	HTTP
ストリーミングのサポート	はい（SSE）	いいえ	はい（SSE）	いいえ
トラフィック分割	はい	はい	はい	いいえ
リクエストとレスポンスのロギング	はい	はい	はい	いいえ
アクセスロギング	はい	はい	はい	いいえ
チューニングされた Gemini モデルのデプロイ	いいえ	はい	いいえ	いいえ
AutoML モデルと説明可能性	いいえ	はい	いいえ	いいえ
サポートされているクライアントライブラリ	Vertex AI SDK for Python	Vertex AI クライアントライブラリ、Vertex AI SDK for Python	Vertex AI SDK for Python	Vertex AI SDK for Python

次のステップ

エンドポイントにモデルをデプロイする方法を確認する。

エンドポイントのタイプを選択する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

次のステップ

エンドポイントのタイプを選択する