MaaS 用の Vertex AI マネージド モデル

Vertex AI は、パートナー モデルとオープンモデルのキュレートされたリストをマネージド モデルとしてサポートしています。これらのモデルは、Vertex AI で Model as a Service(MaaS)として使用でき、マネージド API として提供されます。マネージド モデルを使用する場合、リクエストは引き続き Vertex AI エンドポイントに送信されます。マネージド モデルはサーバーレスであるため、インフラストラクチャのプロビジョニングや管理は必要ありません。

マネージド モデルは Model Garden で見つけることができます。Model Garden を使用してモデルをデプロイすることもできます。詳細については、Model Garden で AI モデルを確認するをご覧ください。

パートナーのモデル

Vertex AI Model Garden(MaaS)では次のパートナー モデルがマネージド API として提供されます。

モデル名 モダリティ 説明 クイックスタート
Claude 4.5 Sonnet 言語、ビジョン コーディング、コンピュータの使用、サイバーセキュリティ、スプレッドシートなどのオフィス ファイルの操作機能を備えた、現実世界のエージェントを強化する Anthropic の中規模モデル。 モデルカード
Claude Opus 4.1 言語、ビジョン コーディングの業界リーダー。集中した作業と数千ものステップを必要とする長時間実行タスクで持続的なパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。フロンティア エージェントのプロダクトや機能の強化に最適です。 モデルカード
Claude Haiku 4.5 言語、ビジョン Claude Haiku 4.5 は、幅広いユースケースで最先端に近いパフォーマンスを実現し、無料のプロダクトや大量のユーザー エクスペリエンスを支える適切な速度とコストを備えた、世界で最も優れたコーディング モデルの 1 つとして際立っています。 モデルカード
Claude Opus 4 言語、ビジョン Claude Opus 4 は、集中的な作業と数千ものステップを必要とする長時間にわたるタスクで安定したパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。 モデルカード
Claude Sonnet 4 言語、ビジョン コーディング、詳細な調査、エージェントなど、大量のユースケースのために優れたインテリジェンスを備えた Anthropic の中規模モデル。 モデルカード
Anthropic の Claude 3.7 Sonnet 言語、ビジョン コーディングと AI エージェントの強化に最適な業界をリードするモデル。思考が強化された最初の Claude モデル。 モデルカード
Anthropic の Claude 3.5 Sonnet v2 言語、ビジョン アップグレードされた Claude 3.5 Sonnet は、現実世界のソフトウェア エンジニアリング タスクとエージェント機能向けの最先端モデルです。Claude 3.5 Sonnet は、前のモデルと同じ価格とスピードでこれらの進歩を実現しています。 モデルカード
Anthropic の Claude 3.5 Haiku 言語、ビジョン Anthropic の最速かつ最も費用対効果の高い次世代モデルである Claude 3.5 Haiku は、スピードとコスト パフォーマンスが重視されるユースケースに最適です。 モデルカード
Anthropic の Claude 3 Haiku 言語 Anthropic で最も高速なビジョンとテキストのモデルです。基本的なクエリにほぼ瞬時に応答し、人間のやり取りに近いシームレスな AI エクスペリエンスを実現します。 モデルカード
Anthropic の Claude 3.5 Sonnet 言語 Anthropic の Claude 3.5 Sonnet は、Anthropic の幅広い評価において Claude 3 Opus を上回っています。また、そのスピードと料金は Anthropic の中間モデルである Claude 3 Sonnet と同じです。 モデルカード
Jamba 1.5 Large(プレビュー 言語 AI21 Labs の Jamba 1.5 Large は、同サイズクラスの他のモデルと比較して、優れた品質のレスポンス、高いスループット、競争力のある価格を実現するように設計されています。 モデルカード
Jamba 1.5 Mini(プレビュー 言語 AI21 Labs の Jamba 1.5 Mini は、品質、スループット、低コストのバランスが取れています。 モデルカード
Mistral Medium 3 言語 Mistral Medium 3 は、プログラミング、数学的推論、長いドキュメントの理解、要約、会話など、幅広いタスク向けに設計された汎用モデルです。 モデルカード
Mistral OCR(25.05) 言語、ビジョン Mistral OCR(25.05)は、ドキュメントの理解のための光学式文字認識 API です。モデルは、メディア、テキスト、表、数式などのドキュメントの各要素を理解します。 モデルカード
Mistral Small 3.1(25.03) 言語 Mistral Small 3.1(25.03)は、マルチモーダル機能と拡張されたコンテキスト長を備えた Mistral の Small モデルの最新バージョンです。 モデルカード
Mistral Large(24.11) 言語 Mistral Large(24.11)は Mistral Large(24.07)モデルの次期バージョンで、推論機能と関数呼び出し機能が強化されています。 モデルカード
Codestral 2 言語、コード Codestral 2 は、高精度の Fill-in-the-Middle(FIM)補完専用に構築された Mistral のコード生成特化モデルです。このモデルにより、デベロッパーは共有された指示と補完の API エンドポイントを通じたコードの記述と操作が可能になります。 モデルカード
Codestral(25.01) コード Fill-in-the-Middle やコード補完など、コード生成向けに設計された最先端モデルです。 モデルカード

オープンモデル

Vertex AI Model Garden(MaaS)では次のオープンモデルがマネージド API として提供されます。

モデル名 モダリティ 説明 クイックスタート
gpt-oss 120B 言語 推論タスクで高いパフォーマンスを発揮する 120B モデル。 モデルカード
gpt-oss 20B 言語 消費者やエッジ用ハードウェア上での効率とデプロイに最適化された 20B モデル。 モデルカード
Qwen3-Next-80B の思考 言語、コード 複雑な問題解決と深い推論に特化した Qwen3-Next モデル ファミリーのモデル。 モデルカード
Qwen3-Next-80B Instruct 言語、コード 特定のコマンドに従うことに特化した Qwen3-Next ファミリーのモデル。 モデルカード
Qwen3 Coder 言語、コード 高度なソフトウェア開発タスク用に開発されたオープンウェイト モデル。 モデルカード
Qwen3 235B 言語 体系的な推論と迅速な会話を切り替える「ハイブリッド思考」機能を備えたオープンウェイト モデル。 モデルカード
DeepSeek-V3.1 言語 思考モードと非思考モードの両方をサポートする DeepSeek のハイブリッド モデル。 モデルカード
DeepSeek R1(0528) 言語 DeepSeek の DeepSeek R1 モデルの最新バージョン。 モデルカード
Llama 4 Maverick 17B-128E 言語、ビジョン コーディング、推論、画像処理の機能を備えた、最大かつ最高性能の Llama 4 モデル。Llama 4 Maverick 17B-128E は、Mixture of Experts(MoE)アーキテクチャと早期融合を使用するマルチモーダル モデルです。 モデルカード
Llama 4 Scout 17B-16E 言語、ビジョン Llama 4 Scout 17B-16E は、そのサイズクラスで最先端の結果を提供し、複数のベンチマークで以前の Llama 世代や他のオープンモデルや独自のモデルを上回っています。Llama 4 Scout 17B-16E は、Mixture-of-Experts(MoE)アーキテクチャと早期融合を使用するマルチモーダル モデルです。 モデルカード
Llama 3.3 言語 Llama 3.3 は、テキストのみの 70B 指示用にチューニングされたモデルです。テキストのみのアプリケーションに使用すると、Llama 3.1 70B と Llama 3.2 90B と比較してパフォーマンスが向上します。また、一部のアプリケーションでは、Llama 3.3 70B のパフォーマンスが Llama 3.1 405B に近づきます。 モデルカード
Llama 3.2(プレビュー 言語、ビジョン チャートやグラフの分析、画像キャプションなど、画像推論をサポートできる中規模の 90B マルチモーダル モデル。 モデルカード
Llama 3.1 言語

多言語の会話のユースケース用に最適化された多言語 LLM のコレクション。一般的な業界ベンチマークでは、利用可能なオープンソース チャットモデルやクローズド チャットモデルの多くを上回るパフォーマンスを発揮します。

Llama 3.1 405B は一般提供(GA)されています。

Llama 3.1 8B と Llama 3.1 70B はプレビュー版です。

モデルカード

次のステップ