MaaS 用の Vertex AI パートナー モデル

Vertex AI は、Google パートナーが開発したモデルのキュレーション リストをサポートしています。パートナー モデルは、Vertex AI で Model as a Service(MaaS)として使用でき、マネージド API として提供されます。パートナー モデルを使用する場合、リクエストは引き続き Vertex AI エンドポイントに送信されます。パートナー モデルはサーバーレスであるため、インフラストラクチャのプロビジョニングや管理は必要ありません。

パートナー モデルは Model Garden で見つけることができます。Model Garden を使用してモデルをデプロイすることもできます。詳細については、Model Garden で AI モデルを確認するをご覧ください。利用可能なパートナー モデルの詳細は、Model Garden のモデルカードで確認できます。このガイドでは、Vertex AI で MaaS として機能するサードパーティ モデルのみを説明します。

Anthropic の Claude モデルと Mistral モデルは、Vertex AI で使用できるサードパーティのマネージド モデルの例です。

パートナーのモデル

Vertex AI Model Garden(MaaS)では次のパートナー モデルがマネージド API として提供されます。

モデル名 モダリティ 説明 クイックスタート
Claude Opus 4.5 言語、ビジョン Claude Opus 4.5 は、Anthropic の非常にインテリジェントなモデルの次世代版です。コーディング、エージェント、コンピュータ使用、エンタープライズ ワークフローにおいて業界をリードしています。 モデルカード
Claude Sonnet 4.5 言語、ビジョン コーディング、コンピュータの使用、サイバーセキュリティ、スプレッドシートなどのオフィス ファイルの操作機能を備えた、現実世界のエージェントを強化する Anthropic の中規模モデル。 モデルカード
Claude Opus 4.1 言語、ビジョン コーディングの業界リーダー。集中した作業と数千ものステップを必要とする長時間実行タスクで持続的なパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。フロンティア エージェントのプロダクトや機能の強化に最適です。 モデルカード
Claude Haiku 4.5 言語、ビジョン Claude Haiku 4.5 は、幅広いユースケースで最先端に近いパフォーマンスを実現し、無料のプロダクトや大量のユーザー エクスペリエンスを支える適切な速度とコストを備えた、世界で最も優れたコーディング モデルの 1 つとして際立っています。 モデルカード
Claude Opus 4 言語、ビジョン Claude Opus 4 は、集中的な作業と数千ものステップを必要とする長時間にわたるタスクで安定したパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。 モデルカード
Claude Sonnet 4 言語、ビジョン コーディング、詳細な調査、エージェントなど、大量のユースケースのために優れたインテリジェンスを備えた Anthropic の中規模モデル。 モデルカード
Anthropic の Claude 3.5 Sonnet v2 言語、ビジョン アップグレードされた Claude 3.5 Sonnet は、現実世界のソフトウェア エンジニアリング タスクとエージェント機能向けの最先端モデルです。Claude 3.5 Sonnet は、前のモデルと同じ価格とスピードでこれらの進歩を実現しています。 モデルカード
Anthropic の Claude 3.5 Haiku 言語、ビジョン Anthropic の最速かつ最も費用対効果の高い次世代モデルである Claude 3.5 Haiku は、スピードとコスト パフォーマンスが重視されるユースケースに最適です。 モデルカード
Anthropic の Claude 3 Haiku 言語 Anthropic で最も高速なビジョンとテキストのモデルです。基本的なクエリにほぼ瞬時に応答し、人間のやり取りに近いシームレスな AI エクスペリエンスを実現します。 モデルカード
Anthropic の Claude 3.5 Sonnet 言語 Anthropic の Claude 3.5 Sonnet は、Anthropic の幅広い評価において Claude 3 Opus を上回っています。また、そのスピードと料金は Anthropic の中間モデルである Claude 3 Sonnet と同じです。 モデルカード
Jamba 1.5 Large(プレビュー 言語 AI21 Labs の Jamba 1.5 Large は、同サイズクラスの他のモデルと比較して、優れた品質のレスポンス、高いスループット、競争力のある価格を実現するように設計されています。 モデルカード
Jamba 1.5 Mini(プレビュー 言語 AI21 Labs の Jamba 1.5 Mini は、品質、スループット、低コストのバランスが取れています。 モデルカード
Mistral Medium 3 言語 Mistral Medium 3 は、プログラミング、数学的推論、長いドキュメントの理解、要約、会話など、幅広いタスク向けに設計された汎用モデルです。 モデルカード
Mistral OCR(25.05) 言語、ビジョン Mistral OCR(25.05)は、ドキュメントの理解のための光学式文字認識 API です。モデルは、メディア、テキスト、表、数式などのドキュメントの各要素を理解します。 モデルカード
Mistral Small 3.1(25.03) 言語 Mistral Small 3.1(25.03)は、マルチモーダル機能と拡張されたコンテキスト長を備えた Mistral の Small モデルの最新バージョンです。 モデルカード
Mistral Large(24.11) 言語 Mistral Large(24.11)は Mistral Large(24.07)モデルの次期バージョンで、推論機能と関数呼び出し機能が強化されています。 モデルカード
Codestral 2 言語、コード Codestral 2 は、高精度の Fill-in-the-Middle(FIM)補完専用に構築された Mistral のコード生成特化モデルです。このモデルにより、デベロッパーは共有された指示と補完の API エンドポイントを通じたコードの記述と操作が可能になります。 モデルカード
Codestral(25.01) コード Fill-in-the-Middle やコード補完など、コード生成向けに設計された最先端モデルです。 モデルカード

容量保証付きの Vertex AI パートナー モデルの料金

Google は、一部のパートナー モデル向けにプロビジョンド スループットを提供しており、これにより、固定料金でモデルのスループット容量を確保できます。利用者は、スループット容量と、その容量を確保するリージョンを選択できます。プロビジョンド スループットのリクエストは、標準の従量課金制リクエストよりも優先されるため、可用性が向上します。システムが過負荷状態でも、そのスループットが確保したスループット容量内であれば、リクエストは完了できます。詳細やサービスへの登録については、営業担当者にお問い合わせください

リージョナル エンドポイントとグローバル エンドポイント

リージョナル エンドポイントの場合、リクエストは指定されたリージョンから処理されます。データ所在地に関する要件がある場合や、モデルがグローバル エンドポイントをサポートしていない場合は、リージョナル エンドポイントを使用します。

グローバル エンドポイントを使用すると、Google は使用モデルでサポートされている任意のリージョンからリクエストを処理して提供できます。これにより、場合によってはレイテンシが高くなることがあります。グローバル エンドポイントは、全体的な可用性を高め、エラーを減らすうえで役立ちます。

リージョン エンドポイントとグローバル エンドポイントでは料金が異なります。グローバル エンドポイントの割り当てとサポートされているモデルの機能は、リージョナル エンドポイントと異なる場合があります。詳細については、関連するサードパーティ モデルのページをご覧ください。

グローバル エンドポイントを指定する

グローバル エンドポイントを使用するには、リージョンを global に設定します。

たとえば、curl コマンドのリクエスト URL は次の形式を使用します。 https://aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/global/publishers/PUBLISHER_NAME/models/MODEL_NAME

Vertex AI SDK の場合、リージョナル エンドポイントがデフォルトです。グローバル エンドポイントを使用するには、リージョンを GLOBAL に設定します。

サポートされているモデル

グローバル エンドポイントは、次のモデルで使用できます。

グローバル API エンドポイントの使用を制限する

リージョナル エンドポイントの使用を強制するには、constraints/gcp.restrictEndpointUsage 組織のポリシーの制約を使用して、グローバル API エンドポイントへのリクエストをブロックします。詳細については、エンドポイントの使用の制限をご覧ください。

ユーザーにパートナー モデルへのアクセス権を付与する

パートナー モデルを有効にしてプロンプト リクエストを実行するには、 Google Cloud管理者が必要な権限を設定し、組織のポリシーで必要な API の使用が許可されていることを確認する必要があります。

パートナー モデルの使用に必要な権限を設定する

パートナー モデルを使用するには、次のロールと権限が必要です。

  • Consumer Procurement Entitlement 管理者 Identity and Access Management(IAM)ロールが必要です。このロールを付与されたユーザーなら誰でも、Model Garden でパートナー モデルを有効にできます。

  • aiplatform.endpoints.predict 権限が必要です。この権限は、Vertex AI ユーザー IAM ロールに含まれています。詳細については、Vertex AI ユーザーアクセス制御をご覧ください。

コンソール

  1. Consumer Procurement Entitlement 管理者 IAM ロールをユーザーに付与するには、[IAM] ページに移動します。

    [IAM] に移動

  2. [プリンシパル] 列で、Anthropic Claude モデルへのアクセスを有効にするユーザー プリンシパルを見つけて、その行の [プリンシパルを編集] をクリックします。

  3. 権限の編集ペインで、[ 別のロールを追加] をクリックします。

  4. [ロールを選択] で、[Consumer Procurement Entitlement 管理者] を選択します。

  5. 権限の編集ペインで、[ 別のロールを追加] をクリックします。

  6. [ロールを選択] で、[Vertex AI ユーザー] を選択します。

  7. [保存] をクリックします。

gcloud

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. Model Garden でパートナー モデルを有効にするために必要な Consumer Procurement Entitlement 管理者のロールを付与します。

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/consumerprocurement.entitlementManager
    
  3. プロンプト リクエストを行うために必要な aiplatform.endpoints.predict 権限を含む Vertex AI ユーザーロールを付与します。

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/aiplatform.user
    

    PRINCIPAL は、プリンシパルの ID に置き換えます。ID の形式は user|group|serviceAccount:email または domain:domain です(例: user:cloudysanfrancisco@gmail.comgroup:admins@example.comserviceAccount:test123@example.domain.comdomain:example.domain.com)。

    以下を含むポリシー バインディングのリストが出力されます。

    -   members:
      -   user:PRINCIPAL
      role: roles/roles/consumerprocurement.entitlementManager
    

    詳細については、単一のロールを付与するgcloud projects add-iam-policy-binding をご覧ください。

パートナー モデルへのアクセスに関する組織のポリシーを設定する

パートナー モデルを有効にするには、組織のポリシーで次の API を許可する必要があります。Cloud Commerce Consumer Procurement API - cloudcommerceconsumerprocurement.googleapis.com

組織でサービスの使用を制限するように組織のポリシーを設定している場合、組織管理者は組織のポリシーを設定することで、cloudcommerceconsumerprocurement.googleapis.com が許可されていることを確認する必要があります。

また、Model Garden でのモデルの使用を制限する組織のポリシーがある場合は、ポリシーでパートナー モデルへのアクセスを許可する必要があります。詳細については、モデルへのアクセスを制御するをご覧ください。

パートナー モデルの規制遵守

Vertex AI を使用してパートナー モデルをマネージド API として使用する場合も、Vertex AI の生成 AI認定は引き続き適用されます。モデル自体について詳しくお知りになりたい場合は、それぞれのモデルカードで詳細情報を確認するか、それぞれのモデルのパブリッシャーにお問い合わせください。

データは、Vertex AI のパートナー モデル用に選択されたリージョンまたはマルチリージョン内に保存されますが、データ処理のリージョン化は異なる場合があります。パートナー モデルのデータ処理に関するコミットメントの詳細なリストについては、パートナー モデルのデータ所在地をご覧ください。

パートナー モデルを含む Vertex AI API を使用する場合、お客様のプロンプトとモデルのレスポンスは第三者と共有されません。Google は、お客様の指示に従ってのみお客様データを処理します。詳細については、Cloud のデータ処理に関する追加条項をご覧ください。