Vertex AI は、オープンモデルのキュレーション リストをマネージド モデルとしてサポートしています。これらのオープンモデルは、Vertex AI で Model as a Service(MaaS)として使用でき、マネージド API として提供されます。マネージド オープンモデルを使用する場合、リクエストは引き続き Vertex AI エンドポイントに送信されます。マネージド オープン モデルはサーバーレスであるため、インフラストラクチャのプロビジョニングや管理は必要ありません。
マネージド オープンモデルは Model Garden で見つけることができます。Model Garden を使用してモデルをデプロイすることもできます。詳細については、Model Garden で AI モデルを確認するをご覧ください。
オープンモデルを使用する前に、オープンモデルへのユーザー アクセス権を付与する必要があります。
オープンモデル
Vertex AI Model Garden(MaaS)では次のオープンモデルがマネージド API として提供されます。
モデル名 | モダリティ | 説明 | クイックスタート |
---|---|---|---|
gpt-oss 120B | 言語 | 推論タスクで高いパフォーマンスを発揮する 120B モデル。 | モデルカード |
gpt-oss 20B | 言語 | 消費者やエッジ用ハードウェア上での効率とデプロイに最適化された 20B モデル。 | モデルカード |
Qwen3-Next-80B の思考 | 言語、コード | 複雑な問題解決と深い推論に特化した Qwen3-Next モデル ファミリーのモデル。 | モデルカード |
Qwen3-Next-80B Instruct | 言語、コード | 特定のコマンドに従うことに特化した Qwen3-Next ファミリーのモデル。 | モデルカード |
Qwen3 Coder | 言語、コード | 高度なソフトウェア開発タスク用に開発されたオープンウェイト モデル。 | モデルカード |
Qwen3 235B | 言語 | 体系的な推論と迅速な会話を切り替える「ハイブリッド思考」機能を備えたオープンウェイト モデル。 | モデルカード |
DeepSeek-V3.1 | 言語 | 思考モードと非思考モードの両方をサポートする DeepSeek のハイブリッド モデル。 | モデルカード |
DeepSeek R1(0528) | 言語 | DeepSeek の DeepSeek R1 モデルの最新バージョン。 | モデルカード |
Llama 4 Maverick 17B-128E | 言語、ビジョン | コーディング、推論、画像処理の機能を備えた、最大かつ最高性能の Llama 4 モデル。Llama 4 Maverick 17B-128E は、Mixture of Experts(MoE)アーキテクチャと早期融合を使用するマルチモーダル モデルです。 | モデルカード |
Llama 4 Scout 17B-16E | 言語、ビジョン | Llama 4 Scout 17B-16E は、そのサイズクラスで最先端の結果を提供し、複数のベンチマークで以前の Llama 世代や他のオープンモデルや独自のモデルを上回っています。Llama 4 Scout 17B-16E は、Mixture-of-Experts(MoE)アーキテクチャと早期融合を使用するマルチモーダル モデルです。 | モデルカード |
Llama 3.3 | 言語 | Llama 3.3 は、テキストのみの 70B 指示用にチューニングされたモデルです。テキストのみのアプリケーションに使用すると、Llama 3.1 70B と Llama 3.2 90B と比較してパフォーマンスが向上します。また、一部のアプリケーションでは、Llama 3.3 70B のパフォーマンスが Llama 3.1 405B に近づきます。 | モデルカード |
Llama 3.2(プレビュー) | 言語、ビジョン | チャートやグラフの分析、画像キャプションなど、画像推論をサポートできる中規模の 90B マルチモーダル モデル。 | モデルカード |
Llama 3.1 | 言語 |
多言語の会話のユースケース用に最適化された多言語 LLM のコレクション。一般的な業界ベンチマークでは、利用可能なオープンソース チャットモデルやクローズド チャットモデルの多くを上回るパフォーマンスを発揮します。 Llama 3.1 405B は一般提供(GA)されています。 Llama 3.1 8B と Llama 3.1 70B はプレビュー版です。 |
モデルカード |
Vertex AI Model Garden(MaaS)では次のオープン エンベディング モデルがマネージド API として提供されます。
モデル名 | 説明 | 出力のディメンション | シーケンスの最大長 | サポートされているテキスト言語 | クイックスタート |
---|---|---|---|---|---|
multilingual-e5-small | E5 ファミリーのテキスト エンベディング モデルの一部。Small バリアントには 12 個のレイヤが含まれています。 | 最大 384 | 512 トークン | サポートされている言語 | モデルカード |
multilingual-e5-large | E5 ファミリーのテキスト エンベディング モデルの一部。Large バリアントには 24 レイヤが含まれています。 | 最大 1,024 | 512 トークン | サポートされている言語 | モデルカード |
オープンモデルの規制遵守
Vertex AI を使用してオープンモデルをマネージド API として使用する場合も、Vertex AI の生成 AI の認定は引き続き適用されます。モデル自体について詳しくお知りになりたい場合は、それぞれのモデルカードで詳細情報を確認するか、それぞれのモデルのパブリッシャーにお問い合わせください。
データは、Vertex AI のオープンモデル用に選択されたリージョンまたはマルチリージョン内に保存されますが、データ処理のリージョン化は異なる場合があります。オープンモデルのデータ処理に関するコミットメントの詳細なリストについては、オープンモデルのデータ所在地をご覧ください。
オープンモデルを含む Vertex AI API を使用する場合、お客様のプロンプトとモデルのレスポンスは第三者と共有されません。Google は、お客様の指示に従ってのみお客様データを処理します。詳細については、Cloud のデータ処理に関する追加条項をご覧ください。
次のステップ
- オープンモデルを使用する前に、ユーザーにオープンモデルへのアクセス権を付与します。
- オープンモデル API を呼び出す方法を確認する。