Model Garden では、オープンモデル、パートナー モデル、カスタムモデルをセルフデプロイし、Vertex AI でサービングできます。サーバーレスで手動でのデプロイを必要としない Model as a Service(MaaS)とは異なり、セルフデプロイされたモデルはお客様の Google Cloud プロジェクトと VPC ネットワーク内で安全に実行され、お客様はデプロイ環境を完全に制御できます。
オープンモデルをセルフデプロイする
オープンモデルは、マルチモーダル処理に優れた Gemma モデルなど、さまざまな AI タスクで事前トレーニング済みの機能を提供します。これらのモデルは無料で使用でき、ライセンス条項に従う限り、その出力を自由に公開できます。Vertex AI では、オープン ウェイト モデルとオープンソース モデルの両方を提供しています。
Vertex AI でオープンモデルを使用する場合は、インフラストラクチャに Vertex AI を使用します。オープンモデルは、PyTorch や Jax などの他のインフラストラクチャ プロダクトでも使用できます。
オープンウェイト モデル
オープンモデルの多くは、オープン ウェイトの大規模言語モデル(LLM)とみなされます。オープン ウェイト モデルは、オープン ウェイトのないモデルよりも透明性が高くなります。モデルの重みとは、モデルのニューラル ネットワーク アーキテクチャに格納された数値のことで、モデルのトレーニングに使用されたデータから学習されたパターンと関係性を表します。オープン ウェイト モデルでは、事前にトレーニングされたパラメータ(重み)が公開されます。オープン ウェイト モデルは推論やチューニングに使用できます。元のデータセット、モデル アーキテクチャ、トレーニング コードなどの詳細は、必ずしも提供されません。
オープンソース モデル
オープンモデルはオープンソースの AI モデルとは異なります。オープンモデルでは、学習したパターンの重みとコア数値表現は公開されることが多いものの、ソースコード全体やトレーニングの詳細は必ずしも提供されません。それに対して、オープンソース モデルでは通常、トレーニング スクリプトやトレーニング データを含むコードベース全体が一般公開されます。重みが提供されていると、AI モデルの透明性が高まり、モデルを自分で構築しなくても、その機能を理解できます。
セルフデプロイ パートナー モデル
Model Garden では、プロプライエタリ モデルをセルフデプロイ オプションとして提供しているパートナーからモデル ライセンスを購入して管理できます。これらのモデルには、Cloud Marketplace からアクセスできます。ライセンスを取得した後、オンデマンド ハードウェアにデプロイするか、既存の Compute Engine の予約と確約利用割引を使用して費用を管理するかを選択できます。セルフデプロイ パートナー モデルでは、モデルの使用量と、使用した Vertex AI 基盤インフラストラクチャの両方に対して課金されます。
セルフデプロイ パートナー モデルの使用をリクエストするには:
- Model Garden コンソールに移動します。
- 関連するパートナー モデルを見つけます。
- [有効にする] をクリックし、表示されたフォームに記入して必要な商用利用ライセンスを取得します。
パートナー モデルのデプロイと使用の詳細については、パートナー モデルをデプロイして予測リクエストを行うをご覧ください。
考慮事項
セルフデプロイ パートナー モデルを使用する場合は、次の点に注意してください。
- 重みのエクスポート: 一部のオープンモデルとは異なり、セルフデプロイ パートナー モデルの重みをエクスポートすることはできません。
- エンドポイント タイプ: これらのデプロイでは、共有パブリック エンドポイント タイプのみがサポートされています。
Vertex AI におけるセルフデプロイ モデルの詳細
- カスタムの重みの詳細については、カスタムの重みを使用してモデルをデプロイするをご覧ください。
- Model Garden のさらに詳しい内容については、Model Garden の概要をご覧ください。
- モデルのデプロイの詳細については、Model Garden でモデルを使用するをご覧ください。
- Gemma オープンモデルを使用する
- Llama のオープンモデルを使用する
- Hugging Face オープンモデルを使用する