MaaS 用の Vertex AI オープンモデル

Vertex AI は、オープンモデルのキュレーション リストをマネージド モデルとしてサポートしています。これらのオープンモデルは、Vertex AI で Model as a Service(MaaS)として使用でき、マネージド API として提供されます。マネージド オープンモデルを使用する場合、リクエストは引き続き Vertex AI エンドポイントに送信されます。マネージド オープンモデルはサーバーレスであるため、インフラストラクチャのプロビジョニングや管理は必要ありません。

マネージド オープンモデルは Model Garden で見つけることができます。Model Garden を使用してモデルをデプロイすることもできます。詳細については、Model Garden で AI モデルを探すをご覧ください。

オープンモデルを使用する前に、オープンモデルへのユーザー アクセス権を付与する必要があります。

オープンモデル

Vertex AI Model Garden(MaaS)では次のオープンモデルがマネージド API として提供されます。

モデル名 モダリティ 説明 クイックスタート
DeepSeek-OCR 言語、ビジョン 複雑なドキュメントを分析して理解する包括的な光学式文字認識(OCR)モデル。難しい OCR タスクに優れています。 モデルカード
DeepSeek R1(0528) 言語 DeepSeek の DeepSeek R1 モデルの最新バージョン。 モデルカード
DeepSeek-V3.1 言語 思考モードと非思考モードの両方をサポートする DeepSeek のハイブリッド モデル。 モデルカード
gpt-oss 120B 言語 推論タスクで高いパフォーマンスを発揮する 120B モデル。 モデルカード
gpt-oss 20B 言語 消費者やエッジ用ハードウェア上での効率とデプロイに最適化された 20B モデル。 モデルカード
Kimi K2 思考モード 言語 ステップごとに推論し、ツールを使用して複雑な問題を解決するオープンソースの思考モード エージェント モデル。 モデルカード
Llama 3.1 言語

多言語の会話のユースケース用に最適化された多言語 LLM のコレクション。一般的な業界ベンチマークでは、利用可能なオープンソース チャットモデルやクローズド チャットモデルの多くを上回るパフォーマンスを発揮します。

Llama 3.1 405B は一般提供(GA)されています。

Llama 3.1 8B と Llama 3.1 70B はプレビュー版です。

モデルカード
Llama 3.2(プレビュー 言語、ビジョン チャートやグラフの分析、画像キャプションなど、画像推論をサポートできる中規模の 90B マルチモーダル モデル。 モデルカード
Llama 3.3 言語 Llama 3.3 は、テキストのみの 70B 指示用にチューニングされたモデルです。テキストのみのアプリケーションに使用すると、Llama 3.1 70B と Llama 3.2 90B と比較してパフォーマンスが向上します。また、一部のアプリケーションでは、Llama 3.3 70B のパフォーマンスが Llama 3.1 405B に近づきます。 モデルカード
Llama 4 Maverick 17B-128E 言語、ビジョン コーディング、推論、画像処理の機能を備えた、最大かつ最高性能の Llama 4 モデル。Llama 4 Maverick 17B-128E は、Mixture of Experts(MoE)アーキテクチャと早期融合を使用するマルチモーダル モデルです。 モデルカード
Llama 4 Scout 17B-16E 言語、ビジョン Llama 4 Scout 17B-16E は、そのサイズクラスで最先端の結果を提供し、複数のベンチマークで以前の Llama 世代や他のオープンモデルや独自のモデルを上回っています。Llama 4 Scout 17B-16E は、Mixture-of-Experts(MoE)アーキテクチャと早期融合を使用するマルチモーダル モデルです。 モデルカード
MiniMax M2 言語、コード エージェント タスクとコード関連タスク向けに設計されており、複雑なツール呼び出しタスクの計画と実行に優れた機能を発揮します。 モデルカード
Qwen3 235B 言語 体系的な推論と迅速な会話を切り替える「ハイブリッド思考」機能を備えたオープンウェイト モデル。 モデルカード
Qwen3 Coder 言語、コード 高度なソフトウェア開発タスク用に開発されたオープンウェイト モデル。 モデルカード
Qwen3-Next-80B Instruct 言語、コード 特定のコマンドに従うことに特化した Qwen3-Next ファミリーのモデル。 モデルカード
Qwen3-Next-80B Thinking 言語、コード 複雑な問題解決と深い推論に特化した Qwen3-Next モデル ファミリーのモデル。 モデルカード

Vertex AI Model Garden(MaaS)では次のオープン エンベディング モデルがマネージド API として提供されます。

モデル名 説明 出力のサイズ シーケンスの最大長 サポートされているテキスト言語 クイックスタート
multilingual-e5-small E5 ファミリーのテキスト エンベディング モデルの一部。Small バリアントには 12 個のレイヤが含まれています。 最大 384 512 トークン サポートされている言語 モデルカード
multilingual-e5-large E5 ファミリーのテキスト エンベディング モデルの一部。Large バリアントには 24 レイヤが含まれています。 最大 1,024 512 トークン サポートされている言語 モデルカード

オープンモデルの規制遵守

Vertex AI を使用してオープンモデルをマネージド API として使用する場合も、Vertex AI の生成 AI認定は引き続き適用されます。モデル自体について詳しくお知りになりたい場合は、それぞれのモデルカードで詳細情報を確認するか、それぞれのモデルのパブリッシャーにお問い合わせください。

データは、Vertex AI のオープンモデル用に選択されたリージョンまたはマルチリージョン内に保存されますが、データ処理のリージョン化は異なる場合があります。オープンモデルのデータ処理に関するコミットメントの詳細なリストについては、オープンモデルのデータ所在地をご覧ください。

オープンモデルを含む Vertex AI API を使用する場合、お客様のプロンプトとモデルのレスポンスは第三者と共有されません。Google は、お客様の指示によってのみ顧客データを処理します。詳細については、Cloud のデータ処理に関する追加条項をご覧ください。

次のステップ