Model Garden からパートナーモデルをデプロイする

Model Garden を使用すると、一部のパートナーモデル（プレビュー）をセルフデプロイできます。セルフデプロイモデルはサーバーレスではありません。セルフデプロイモデルを使用する前に、Vertex AI にデプロイする必要があります。これらのモデルは、Google Cloud プロジェクトと VPC ネットワーク内では安全にデプロイされます。セルフデプロイモデルの詳細については、セルフデプロイモデルのドキュメントをご覧ください。

セルフデプロイ可能なパートナーモデルを購入する

Vertex AI でセルフデプロイ可能なパートナーモデルをデプロイするには、まず Google Cloud Marketplace で購入する必要があります。セルフデプロイパートナーモデルを購入する手順は、次のとおりです。

Model Garden に移動します。

Model Garden に移動
[モデルコレクション] で、[セルフデプロイ可能なパートナーモデル] をクリックしてモデルのリストをフィルタします。
購入するパートナーモデルのモデルカードをクリックします。
[営業担当へのお問い合わせ] をクリックします。
フォームに必要事項を入力して、リクエストを送信します。

これらの手順を完了すると、購入手続きを完了するために Google Cloud 営業担当者から連絡があります。

モデルをデプロイする

セルフデプロイ可能なパートナーモデルを購入したら、ワンクリックデプロイを使用して Vertex AI エンドポイントにデプロイできます。このプロセスでは、必要な設定を事前に構成するとデプロイが簡素化されます。

ワンクリックデプロイは、 Google Cloud コンソールまたは Vertex AI SDK for Python を使用して実行できます。

コンソール

Google Cloud コンソールでパートナーモデルをデプロイする手順は次のとおりです。

Model Garden に移動します。

Model Garden に移動
使用するパートナーモデルのモデルカードを見つけてクリックします。
[モデルをデプロイ] をクリックします。
プロンプトに従ってデプロイ設定を構成します。
[デプロイ] をクリックします。

Python

次のサンプルは、Vertex AI SDK for Python を使用してパートナーモデルをデプロイする方法を示しています。プレースホルダの値を具体的な情報に置き換えます。

import vertexai
from vertexai import model_garden

vertexai.init(project="PROJECT_ID", location="LOCATION")

# Replace with the actual partner model ID from Model Garden
model = model_garden.OpenModel("PARTNER_MODEL_ID")
endpoint = model.deploy(
  accept_eula=True,
  machine_type="MACHINE_TYPE",  # e.g., "a3-ultragpu-8g"
  accelerator_type="ACCELERATOR_TYPE",  # e.g., "NVIDIA_H200_141GB"
  accelerator_count=ACCELERATOR_COUNT,  # e.g., 8
  serving_container_image_uri="SERVING_CONTAINER_IMAGE_URI",
  endpoint_display_name="ENDPOINT_DISPLAY_NAME",
  model_display_name="MODEL_DISPLAY_NAME",
  use_dedicated_endpoint=True,
)
print(f"Model deployed to endpoint: {endpoint.resource_name}")

Model Garden からパートナー モデルをデプロイする コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

セルフデプロイ可能なパートナー モデルを購入する

モデルをデプロイする

コンソール

Python

次のステップ

Model Garden からパートナーモデルをデプロイする

セルフデプロイ可能なパートナーモデルを購入する