Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

MaaS 用の Gemini Enterprise Agent Platform プラットフォームパートナーモデル

Gemini Enterprise Agent Platform は、Google パートナーが開発したモデルに対してキュレートされたリストをサポートしています。パートナーモデルは、 Gemini Enterprise Agent Platform で Model as a Service（MaaS）として使用でき、マネージド API として提供されます。パートナーモデルを使用する場合、リクエストは引き続き Gemini Enterprise Agent Platform エンドポイントに送信されます。パートナーモデルはサーバーレスであるため、インフラストラクチャのプロビジョニングや管理は必要ありません。

パートナーモデルは Model Garden で見つけることができます。Model Garden を使用してモデルをデプロイすることもできます。詳細については、Model Garden で AI モデルを確認するをご覧ください。利用可能なパートナーモデルの詳細は、Model Garden のモデルカードで確認できます。このガイドでは、Gemini Enterprise Agent Platform で MaaS として機能するサードパーティモデルのみを説明します。

Anthropic の Claude モデルと Mistral モデルは、Gemini Enterprise Agent Platform で使用できるサードパーティのマネージドモデルの例です。

パートナーのモデル

Gemini Enterprise Agent Platform Model Garden（MaaS）では次のパートナーモデルがマネージド API として提供されます。

モデル名	モダリティ	説明	クイックスタート
Grok 4.3（プレビュー）	言語	xAI の高性能モデル。	モデルカード
Grok 4.20（推論）（プレビュー）	言語	Grok 4.20（推論）は、xAI の高性能モデルで、業界をリードする低いハルシネーション率を特長としています。ドキュメント理解タスクと長期エージェントツール呼び出しに優れています。	モデルカード
Grok 4.20（非推論）（プレビュー）	言語	Grok 4.20（非推論）は、xAI の高性能非思考モデルで、業界をリードする低いハルシネーション率を特長としています。カスタマーサポートや分類など、レイテンシの影響を受けやすいユースケースに優れています。	モデルカード
Grok 4.1 Fast（推論）（プレビュー）	言語	Grok 4.1 Fast（推論）は、xAI の最も費用対効果の高いモデルで、強力なツール呼び出し機能と効率的なナレッジベース合成機能を備えています。ウェブデータと内部ナレッジベースツールを含む検索タスクに優れています。	モデルカード
Grok 4.1 Fast（非推論）（プレビュー）	言語	Grok 4.1 Fast（非推論）は、xAI の最も費用対効果の高い非思考モデルで、低レイテンシのパフォーマンスに最適化されています。要約や分類など、大量のタスクに優れています。	モデルカード
Claude Opus 4.8	言語、ビジョン	Claude Opus 4.8 は、コーディングとエージェント向けに構築された高インテリジェンスの Opus モデルで、エンタープライズワークフローの推論が強化されています。	モデルカード
Claude Opus 4.7	言語、ビジョン	Claude Opus 4.7 は、Anthropic の高インテリジェンスモデルであり、コーディング、エージェント、コンピュータ使用、エンタープライズワークフローにおいて業界をリードしています。	モデルカード
Claude Sonnet 4.6	言語、ビジョン	Claude Sonnet 4.6 は、コーディング、エージェント、エンタープライズワークフロー向けに構築された、最先端のインテリジェンスを大規模に提供します。	モデルカード
Claude Opus 4.6	言語、ビジョン	Claude Opus 4.6 は、Anthropic の高インテリジェンスモデルであり、コーディング、エージェント、コンピュータ使用、エンタープライズワークフローにおいて業界をリードしています。	モデルカード
Claude Opus 4.5	言語、ビジョン	Claude Opus 4.5 は、Anthropic の高インテリジェンスモデルであり、コーディング、エージェント、コンピュータ使用、エンタープライズワークフローにおいて業界をリードしています。	モデルカード
Claude Sonnet 4.5	言語、ビジョン	コーディング、コンピュータの使用、サイバーセキュリティ、スプレッドシートなどのオフィスファイルの操作機能を備えた、現実世界のエージェントを強化する Anthropic の中規模モデル。	モデルカード
Claude Opus 4.1	言語、ビジョン	コーディングの業界リーダー。集中した作業と数千ものステップを必要とする長時間実行タスクで持続的なパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。フロンティアエージェントのプロダクトや機能の強化に最適です。	モデルカード
Claude Haiku 4.5	言語、ビジョン	Claude Haiku 4.5 は、幅広いユースケースで最先端に近いパフォーマンスを実現し、無料のプロダクトや大量のユーザーエクスペリエンスを支える適切な速度とコストを備えた、世界で最も優れたコーディングモデルの 1 つとして際立っています。	モデルカード
Claude Opus 4	言語、ビジョン	Claude Opus 4 は、集中的な作業と数千ものステップを必要とする長時間にわたるタスクで安定したパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。	モデルカード
Claude Sonnet 4	言語、ビジョン	コーディング、詳細な調査、エージェントなど、大量のユースケースのために優れたインテリジェンスを備えた Anthropic の中規模モデル。	モデルカード
Anthropic の Claude 3.5 Sonnet v2	言語、ビジョン	Claude 3.5 Sonnet は現実世界のソフトウェアエンジニアリングタスクとエージェント機能向けの高性能モデルです。Claude 3.5 Sonnet は、前のモデルと同じ価格とスピードでこれらの進歩を実現しています。	モデルカード
Anthropic の Claude 3.5 Sonnet	言語	Anthropic の Claude 3.5 Sonnet は、Anthropic の幅広い評価において Claude 3 Opus を上回っています。また、そのスピードと料金は Anthropic の中間モデルである Claude 3 Sonnet と同じです。	モデルカード
Jamba 1.5 Large（プレビュー）	言語	AI21 Labs の Jamba 1.5 Large は、同サイズクラスの他のモデルと比較して、優れた品質のレスポンス、高いスループット、競争力のある価格を実現するように設計されています。	モデルカード
Jamba 1.5 Mini（プレビュー）	言語	AI21 Labs の Jamba 1.5 Mini は、品質、スループット、低コストのバランスが取れています。	モデルカード
Mistral Medium 3	言語	Mistral Medium 3 は、プログラミング、数学的推論、長いドキュメントの理解、要約、会話など、幅広いタスク向けに設計された汎用モデルです。	モデルカード
Mistral OCR（25.05）	言語、ビジョン	Mistral OCR（25.05）は、ドキュメントの理解のための光学式文字認識 API です。モデルは、メディア、テキスト、表、数式などのドキュメントの各要素を理解します。	モデルカード
Mistral Small 3.1（25.03）	言語	Mistral Small 3.1（25.03）は、マルチモーダル機能と拡張されたコンテキスト長を備えた Mistral の Small モデルのバージョンです。	モデルカード
Codestral 2	言語、コード	Codestral 2 は、高精度の Fill-in-the-Middle（FIM）補完専用に構築された Mistral のコード生成特化モデルです。このモデルにより、デベロッパーは共有された指示と補完の API エンドポイントを通じたコードの記述と操作が可能になります。	モデルカード

Gen AI Evaluation Service を使用してパートナーモデルを評価する

Gen AI Evaluation Service は、Anthropic モデルや Llama モデルなどのパートナーモデルの評価をサポートしています。パートナーモデルの評価は Model Garden でサポートされているため、パートナーモデルに対して評価を実行する前にモデルを有効にする必要があります。

詳細については、コンソールで評価を行うをご覧ください。

容量保証付きの Gemini Enterprise Agent Platform パートナーモデルの料金

Google は、一部のパートナーモデル向けにプロビジョンドスループットを提供しており、これにより、固定料金でモデルのスループット容量を確保できます。利用者は、スループット容量と、その容量を確保するリージョンを選択できます。プロビジョンドスループットのリクエストは、標準の従量課金制リクエストよりも優先されるため、可用性が向上します。システムが過負荷状態でも、そのスループットが確保したスループット容量内であれば、リクエストは完了できます。詳細やサービスへの登録については、営業担当者にお問い合わせください。

リージョナルエンドポイント、グローバルエンドポイント、マルチリージョンエンドポイント

リージョナルエンドポイントの場合、リクエストは指定されたリージョンから処理されます。データ所在地に関する要件がある場合や、モデルがグローバルエンドポイントをサポートしていない場合は、リージョナルエンドポイントを使用します。

グローバルエンドポイントを使用すると、Google は使用モデルでサポートされている任意のリージョンからリクエストを処理して提供できます。これにより、場合によってはレイテンシが高くなることがあります。グローバルエンドポイントは、全体的な可用性を高め、エラーを減らすのに役立ちます。

マルチリージョンエンドポイントを使用すると、米国などの広範な地域内でデータ所在地を維持しながら、パートナーモデルに高可用性でアクセスできます。

選択するエンドポイントのタイプによって料金が異なります。割り当てと機能の詳細については、関連するサードパーティモデルのページをご覧ください。

グローバルエンドポイント

グローバルエンドポイントを使用するには、リージョンを global に設定します。

たとえば、curl コマンドのリクエスト URL は次の形式を使用します: https://aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/global/publishers/PUBLISHER_NAME/models/MODEL_NAME

Agent Platform SDK の場合、リージョナルエンドポイントがデフォルトです。グローバルエンドポイントを使用するには、リージョンを GLOBAL に設定します。

グローバルエンドポイントでサポートされているモデル

グローバルエンドポイントは、次のモデルで使用できます。

グローバル API エンドポイントの使用を制限する

リージョナルエンドポイントの使用を強制するには、constraints/gcp.restrictEndpointUsage 組織のポリシーの制約を使用して、グローバル API エンドポイントへのリクエストをブロックします。詳細については、エンドポイントの使用を制限するをご覧ください。

マルチリージョンエンドポイント

マルチリージョンエンドポイントを使用すると、米国や欧州連合などの広範な地域内でデータ所在地を維持しながら、パートナーモデルに高可用性でアクセスできます。

使用するマルチリージョンに対応するタブを選択します。

米国

米国のマルチリージョンエンドポイントを使用するには、エンドポイント URL を aiplatform.us.rep.googleapis.com に設定します。

curl コマンドのリクエスト URL は次の形式を使用します: https://aiplatform.us.rep.googleapis.com/v1/projects/PROJECT_ID/locations/us/publishers/anthropic/models/MODEL_NAME

EU

EU のマルチリージョンエンドポイントを使用するには、エンドポイント URL を aiplatform.eu.rep.googleapis.com に設定します。

curl コマンドのリクエスト URL は次の形式を使用します。 https://aiplatform.eu.rep.googleapis.com/v1/projects/PROJECT_ID/locations/eu/publishers/anthropic/models/MODEL_NAME

MODEL_NAME 形式の詳細については、Anthropic のドキュメントをご覧ください。

マルチリージョンエンドポイントでサポートされているモデル:

次のモデルがサポートされています。該当する場合は、バージョン日付を含む完全なモデル ID を使用してください。

モデル	API モデル ID
`claude-opus-4-8`	`claude-opus-4-8`
`claude-opus-4-7`	`claude-opus-4-7`

リクエスト例

curl を使用してマルチリージョンエンドポイントを呼び出す方法は次のとおりです。

export PROJECT_ID="YOUR_PROJECT_ID"
# Example using claude-opus-4-7

# Option 1: US Region
export LOCATION="us"
export ENDPOINT="aiplatform.us.rep.googleapis.com"

# Option 2: EU Region
# export LOCATION="eu"
# export ENDPOINT="aiplatform.eu.rep.googleapis.com"

export MODEL_ID="claude-opus-4-7"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${ENDPOINT}/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:rawPredict" \
  -d '{
    "max_tokens": 300,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "Why is the sky blue?"
          }
        ]
      }
    ],
    "anthropic_version": "vertex-2023-10-16"
  }'

マルチリージョン割り当て:

専用のマルチリージョン割り当てが適用されます。これらのデフォルトの割り当て値は、 Google Cloud コンソールで確認して増加をリクエストできます。

米国の割り当ての例:
- UsOnlinePredictionInputTokensPerMinutePerBaseModel
- UsOnlinePredictionOutputTokensPerMinutePerBaseModel
- UsOnlinePredictionRequestsPerMinPerProjectPerBaseModel
- UsOnlinePredictionWebSearchRequestsPerProjectPerPublisher
EU の割り当ての例:
- EuOnlinePredictionInputTokensPerMinutePerBaseModel
- EuOnlinePredictionOutputTokensPerMinutePerBaseModel
- EuOnlinePredictionRequestsPerMinPerProjectPerBaseModel
- EuOnlinePredictionWebSearchRequestsPerProjectPerPublisher

ユーザーにパートナーモデルへのアクセス権を付与する

パートナーモデルを有効にしてプロンプトリクエストを実行するには、 Google Cloud管理者が必要な権限を設定し、組織のポリシーで必要な API の使用が許可されていることを確認する必要があります。

パートナーモデルの使用に必要な権限を設定する

パートナーモデルを使用するには、次のロールと権限が必要です。

Consumer Procurement Entitlement 管理者 Identity and Access Management（IAM）ロールが必要です。このロールを付与されたユーザーなら誰でも、Model Garden でパートナーモデルを有効にできます。
aiplatform.endpoints.predict 権限が必要です。この権限は、Agent Platform ユーザー IAM ロールに含まれています。詳細については、Gemini Enterprise Agent Platform ユーザーとアクセス制御をご覧ください。

コンソール

Consumer Procurement Entitlement 管理者 IAM ロールをユーザーに付与するには、[IAM] ページに移動します。

[IAM] に移動
[プリンシパル] 列で、Anthropic Claude モデルへのアクセスを有効にするユーザープリンシパルを見つけて、その行の [プリンシパルを編集] をクリックします。
権限の編集ペインで、[ 別のロールを追加] をクリックします。
[ロールを選択] で、[Consumer Procurement Entitlement 管理者] を選択します。
[編集権限] ペインで、 [別のロールを追加] をクリックします。
[ロールを選択] で、[Agent Platform ユーザー] を選択します。
[保存] をクリックします。

gcloud

コンソールで Cloud Shell をアクティブにします。 Google Cloud

Cloud Shell をアクティブにする
Model Garden でパートナーモデルを有効にするために必要な Consumer Procurement Entitlement 管理者のロールを付与します。
```
gcloud projects add-iam-policy-binding  PROJECT_ID \
--member=PRINCIPAL --role=roles/consumerprocurement.entitlementManager
```
プロンプトリクエストを行うために必要な aiplatform.endpoints.predict 権限を含む Agent Platform ユーザーロールを付与します。
```
gcloud projects add-iam-policy-binding  PROJECT_ID \
--member=PRINCIPAL --role=roles/aiplatform.user
```
PRINCIPAL は、プリンシパルの ID に置き換えます。ID の形式は user|group|serviceAccount:email または domain:domain です（例: user:cloudysanfrancisco@gmail.com、group:admins@example.com、serviceAccount:test123@example.domain.com、domain:example.domain.com）。

以下を含むポリシーバインディングのリストが出力されます。
```
-   members:
  -   user:PRINCIPAL
  role: roles/roles/consumerprocurement.entitlementManager
```
詳細については、単一のロールを付与すると gcloud projects add-iam-policy-binding をご覧ください。

パートナーモデルへのアクセスに関する組織のポリシーを設定する

パートナーモデルを有効にするには、組織のポリシーで次の API を許可する必要があります。Cloud Commerce Consumer Procurement API - cloudcommerceconsumerprocurement.googleapis.com

組織でサービスの使用を制限するように組織のポリシーを設定している場合、組織管理者は組織のポリシーを設定することで、cloudcommerceconsumerprocurement.googleapis.com が許可されていることを確認する必要があります。

また、Model Garden でのモデルの使用を制限する組織のポリシーがある場合は、ポリシーでパートナーモデルへのアクセスを許可する必要があります。詳細については、モデルへのアクセスを制御するをご覧ください。

パートナーモデルの規制遵守

Gemini Enterprise Agent Platform を使用してパートナーモデルをマネージド API として使用する場合も、 Gemini Enterprise Agent Platform の生成 AI の認定は引き続き適用されます。モデル自体について詳しくお知りになりたい場合は、それぞれのモデルカードで詳細情報を確認するか、それぞれのモデルのパブリッシャーにお問い合わせください。

データは、Gemini Enterprise Agent Platform のパートナーモデル用に選択されたリージョンまたはマルチリージョン内に保存されますが、データ処理のリージョン化は異なる場合があります。パートナーモデルのデータ処理に関するコミットメントの詳細なリストについては、パートナーモデルのデータ所在地をご覧ください。

パートナーモデルを含む Gemini Enterprise API を使用する場合、お客様のプロンプトとモデルのレスポンスは第三者と共有されません。Google は、お客様の指示に従ってのみお客様データを処理します。詳細については、 Cloud のデータ処理に関する追加条項をご覧ください。

MaaS 用の Gemini Enterprise Agent Platform プラットフォーム パートナー モデル コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

パートナーのモデル

Gen AI Evaluation Service を使用してパートナー モデルを評価する

容量保証付きの Gemini Enterprise Agent Platform パートナー モデルの料金

リージョナル エンドポイント、グローバル エンドポイント、マルチリージョン エンドポイント

グローバル エンドポイント

マルチリージョン エンドポイント

米国

EU

ユーザーにパートナー モデルへのアクセス権を付与する

パートナー モデルの使用に必要な権限を設定する