Gemini Enterprise Agent Platform は、Google パートナーが開発したモデルに対してキュレートされたリストをサポートしています。 パートナー モデルは、 Gemini Enterprise Agent Platform で Model as a Service(MaaS)として使用でき、マネージド API として提供されます。パートナー モデルを使用する場合、リクエストは引き続き Gemini Enterprise Agent Platform エンドポイントに送信されます。パートナー モデルはサーバーレスであるため、インフラストラクチャのプロビジョニングや管理は必要ありません。
パートナー モデルは Model Garden で見つけることができます。Model Garden を使用してモデルをデプロイすることもできます。詳細については、Model Garden で AI モデルを確認するをご覧ください。利用可能なパートナー モデルの詳細は、Model Garden のモデルカードで確認できます。このガイドでは、Gemini Enterprise Agent Platform で MaaS として機能するサードパーティ モデルのみを説明します。
Anthropic の Claude モデルと Mistral モデルは、Gemini Enterprise Agent Platform で使用できるサードパーティのマネージド モデルの例です。
パートナーのモデル
Gemini Enterprise Agent Platform Model Garden(MaaS)では次のパートナー モデルがマネージド API として提供されます。
| モデル名 | モダリティ | 説明 | クイックスタート |
|---|---|---|---|
| Grok 4.3(プレビュー) | 言語 | xAI の高性能モデル。 | モデルカード |
| Grok 4.20(推論)(プレビュー) | 言語 | Grok 4.20(推論)は、xAI の高性能モデルで、業界をリードする低いハルシネーション率を特長としています。ドキュメント理解タスクと長期エージェント ツール呼び出しに優れています。 | モデルカード |
| Grok 4.20(非推論)(プレビュー) | 言語 | Grok 4.20(非推論)は、xAI の高性能非思考モデルで、業界をリードする低いハルシネーション率を特長としています。カスタマー サポートや分類など、レイテンシの影響を受けやすいユースケースに優れています。 | モデルカード |
| Grok 4.1 Fast(推論)(プレビュー) | 言語 | Grok 4.1 Fast(推論)は、xAI の最も費用対効果の高いモデルで、強力なツール呼び出し機能と効率的なナレッジベース合成機能を備えています。ウェブデータと内部ナレッジベース ツールを含む検索タスクに優れています。 | モデルカード |
| Grok 4.1 Fast(非推論)(プレビュー) | 言語 | Grok 4.1 Fast(非推論)は、xAI の最も費用対効果の高い非思考モデルで、低レイテンシのパフォーマンスに最適化されています。要約や分類など、大量のタスクに優れています。 | モデルカード |
| Claude Opus 4.8 | 言語、ビジョン | Claude Opus 4.8 は、コーディングとエージェント向けに構築された高インテリジェンスの Opus モデルで、エンタープライズ ワークフローの推論が強化されています。 | モデルカード |
| Claude Opus 4.7 | 言語、ビジョン | Claude Opus 4.7 は、Anthropic の高インテリジェンス モデルであり、 コーディング、エージェント、コンピュータ使用、エンタープライズ ワークフローにおいて業界をリードしています。 | モデルカード |
| Claude Sonnet 4.6 | 言語、ビジョン | Claude Sonnet 4.6 は、コーディング、エージェント、エンタープライズ ワークフロー向けに構築された、最先端のインテリジェンスを大規模に提供します。 | モデルカード |
| Claude Opus 4.6 | 言語、ビジョン | Claude Opus 4.6 は、Anthropic の高インテリジェンス モデルであり、 コーディング、エージェント、コンピュータ使用、エンタープライズ ワークフローにおいて業界をリードしています。 | モデルカード |
| Claude Opus 4.5 | 言語、ビジョン | Claude Opus 4.5 は、Anthropic の高インテリジェンス モデルであり、 コーディング、エージェント、コンピュータ使用、エンタープライズ ワークフローにおいて業界をリードしています。 | モデルカード |
| Claude Sonnet 4.5 | 言語、ビジョン | コーディング、コンピュータの使用、サイバーセキュリティ、スプレッドシートなどのオフィス ファイルの操作機能を備えた、現実世界のエージェントを強化する Anthropic の中規模モデル。 | モデルカード |
| Claude Opus 4.1 | 言語、ビジョン | コーディングの業界リーダー。集中した作業と数千ものステップを必要とする長時間実行タスクで持続的なパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。フロンティア エージェントのプロダクトや機能の強化に最適です。 | モデルカード |
| Claude Haiku 4.5 | 言語、ビジョン | Claude Haiku 4.5 は、幅広いユースケースで最先端に近いパフォーマンスを実現し、無料のプロダクトや大量のユーザー エクスペリエンスを支える適切な速度とコストを備えた、世界で最も優れたコーディング モデルの 1 つとして際立っています。 | モデルカード |
| Claude Opus 4 | 言語、ビジョン | Claude Opus 4 は、集中的な作業と数千ものステップを必要とする長時間にわたるタスクで安定したパフォーマンスを発揮し、AI エージェントが解決できる範囲を大幅に拡大します。 | モデルカード |
| Claude Sonnet 4 | 言語、ビジョン | コーディング、詳細な調査、エージェントなど、大量のユースケースのために優れたインテリジェンスを備えた Anthropic の中規模モデル。 | モデルカード |
| Anthropic の Claude 3.5 Sonnet v2 | 言語、ビジョン | Claude 3.5 Sonnet は 現実世界のソフトウェア エンジニアリング タスクと エージェント機能向けの高性能モデルです。Claude 3.5 Sonnet は、前のモデルと同じ価格とスピードでこれらの 進歩を実現しています。 | モデルカード |
| Anthropic の Claude 3.5 Sonnet | 言語 | Anthropic の Claude 3.5 Sonnet は、Anthropic の幅広い評価において Claude 3 Opus を上回っています。また、そのスピードと料金は Anthropic の中間モデルである Claude 3 Sonnet と同じです。 | モデルカード |
| Jamba 1.5 Large(プレビュー) | 言語 | AI21 Labs の Jamba 1.5 Large は、同サイズクラスの他のモデルと比較して、優れた品質のレスポンス、高いスループット、競争力のある価格を実現するように設計されています。 | モデルカード |
| Jamba 1.5 Mini(プレビュー) | 言語 | AI21 Labs の Jamba 1.5 Mini は、品質、スループット、低コストのバランスが取れています。 | モデルカード |
| Mistral Medium 3 | 言語 | Mistral Medium 3 は、プログラミング、数学的推論、長いドキュメントの理解、要約、会話など、幅広いタスク向けに設計された汎用モデルです。 | モデルカード |
| Mistral OCR(25.05) | 言語、ビジョン | Mistral OCR(25.05)は、ドキュメントの理解のための光学式文字認識 API です。モデルは、メディア、テキスト、表、数式などのドキュメントの各要素を理解します。 | モデルカード |
| Mistral Small 3.1(25.03) | 言語 | Mistral Small 3.1(25.03)は、マルチモーダル機能と 拡張されたコンテキスト長を備えた Mistral の Small モデルのバージョンです。 | モデルカード |
| Codestral 2 | 言語、コード | Codestral 2 は、高精度の Fill-in-the-Middle(FIM)補完専用に構築された Mistral のコード生成特化モデルです。このモデルにより、デベロッパーは共有された指示と補完の API エンドポイントを通じたコードの記述と操作が可能になります。 | モデルカード |
Gen AI Evaluation Service を使用してパートナー モデルを評価する
Gen AI Evaluation Service は、Anthropic モデルや Llama モデルなどのパートナー モデルの評価をサポートしています。パートナー モデルの評価は Model Garden でサポートされているため、パートナー モデルに対して評価を実行する前に モデルを有効にする必要があります。
詳細については、コンソールで評価を行う をご覧ください。
容量保証付きの Gemini Enterprise Agent Platform パートナー モデルの料金
Google は、一部のパートナー モデル向けにプロビジョンド スループットを提供しており、これにより、固定料金でモデルのスループット容量を確保できます。利用者は、スループット容量と、その容量を確保するリージョンを選択できます。プロビジョンド スループットのリクエストは、標準の従量課金制リクエストよりも優先されるため、可用性が向上します。システムが過負荷状態でも、そのスループットが確保したスループット容量内であれば、リクエストは完了できます。詳細やサービスへの登録については、営業担当者にお問い合わせください 。
リージョナル エンドポイント、グローバル エンドポイント、マルチリージョン エンドポイント
リージョナル エンドポイントの場合、リクエストは指定されたリージョンから処理されます。データ所在地に関する要件がある場合や、モデルがグローバル エンドポイントをサポートしていない場合は、リージョナル エンドポイントを使用します。
グローバル エンドポイントを使用すると、Google は使用モデルでサポートされている任意のリージョンからリクエストを処理して提供できます。これにより、場合によってはレイテンシが高くなることがあります。グローバル エンドポイントは、全体的な可用性を高め、エラーを減らすのに役立ちます。
マルチリージョン エンドポイントを使用すると、米国などの広範な地域内でデータ所在地を維持しながら、パートナー モデルに高可用性でアクセスできます。
選択するエンドポイントのタイプによって料金が異なります。割り当てと機能の詳細については、関連するサードパーティ モデルのページをご覧ください。
グローバル エンドポイント
グローバル エンドポイントを使用するには、リージョンを global に設定します。
たとえば、curl コマンドのリクエスト URL は次の形式を使用します:
https://aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/global/publishers/PUBLISHER_NAME/models/MODEL_NAME
Agent Platform SDK の場合、リージョナル エンドポイントがデフォルトです。グローバル エンドポイントを使用するには、リージョンを GLOBAL に設定します。
グローバル エンドポイントでサポートされているモデル
グローバル エンドポイントは、次のモデルで使用できます。
- Claude Opus 4.8
- Claude Opus 4.7
- Claude Opus 4.6
- Claude Sonnet 4.6
- Claude Opus 4.5
- Claude Opus 4.1
- Claude Opus 4
- Claude Sonnet 4.5
- Claude Sonnet 4
- Claude 3.7 Sonnet
- Claude 3.5 Sonnet v2
- Claude Haiku 4.5
- Grok 4.1 Fast
- Grok 4.20
- Grok 4.3
グローバル API エンドポイントの使用を制限する
リージョナル エンドポイントの使用を強制するには、constraints/gcp.restrictEndpointUsage 組織のポリシーの制約を使用して、グローバル API エンドポイントへのリクエストをブロックします。詳細については、
エンドポイントの使用を制限するをご覧ください。
マルチリージョン エンドポイント
マルチリージョン エンドポイントを使用すると、米国や欧州連合などの広範な地域内でデータ所在地を維持しながら、パートナー モデルに高可用性でアクセスできます。
使用するマルチリージョンに対応するタブを選択します。
米国
米国のマルチリージョン エンドポイントを使用するには、エンドポイント URL を aiplatform.us.rep.googleapis.com に設定します。
curl コマンドのリクエスト URL は次の形式を使用します:
https://aiplatform.us.rep.googleapis.com/v1/projects/PROJECT_ID/locations/us/publishers/anthropic/models/MODEL_NAME
EU
EU のマルチリージョン エンドポイントを使用するには、エンドポイント URL を aiplatform.eu.rep.googleapis.com に設定します。
curl コマンドのリクエスト URL は次の形式を使用します。
https://aiplatform.eu.rep.googleapis.com/v1/projects/PROJECT_ID/locations/eu/publishers/anthropic/models/MODEL_NAME
MODEL_NAME 形式の詳細については、Anthropic のドキュメントをご覧ください。
マルチリージョン エンドポイントでサポートされているモデル:
次のモデルがサポートされています。該当する場合は、バージョン日付を含む完全なモデル ID を使用してください。
| モデル | API モデル ID |
|---|---|
claude-opus-4-8 |
claude-opus-4-8 |
claude-opus-4-7 |
claude-opus-4-7 |
リクエスト例
curl を使用してマルチリージョン エンドポイントを呼び出す方法は次のとおりです。
export PROJECT_ID="YOUR_PROJECT_ID"
# Example using claude-opus-4-7
# Option 1: US Region
export LOCATION="us"
export ENDPOINT="aiplatform.us.rep.googleapis.com"
# Option 2: EU Region
# export LOCATION="eu"
# export ENDPOINT="aiplatform.eu.rep.googleapis.com"
export MODEL_ID="claude-opus-4-7"
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json" \
"https://${ENDPOINT}/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:rawPredict" \
-d '{
"max_tokens": 300,
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Why is the sky blue?"
}
]
}
],
"anthropic_version": "vertex-2023-10-16"
}'
マルチリージョン割り当て:
専用のマルチリージョン割り当てが適用されます。これらのデフォルトの割り当て値は、 Google Cloud コンソールで確認して増加をリクエストできます。
米国の割り当ての例:
UsOnlinePredictionInputTokensPerMinutePerBaseModelUsOnlinePredictionOutputTokensPerMinutePerBaseModelUsOnlinePredictionRequestsPerMinPerProjectPerBaseModelUsOnlinePredictionWebSearchRequestsPerProjectPerPublisher
EU の割り当ての例:
EuOnlinePredictionInputTokensPerMinutePerBaseModelEuOnlinePredictionOutputTokensPerMinutePerBaseModelEuOnlinePredictionRequestsPerMinPerProjectPerBaseModelEuOnlinePredictionWebSearchRequestsPerProjectPerPublisher
ユーザーにパートナー モデルへのアクセス権を付与する
パートナー モデルを有効にしてプロンプト リクエストを実行するには、 Google Cloud管理者が必要な権限を設定し、組織のポリシーで必要な API の使用が許可されていることを確認する必要があります。
パートナー モデルの使用に必要な権限を設定する
パートナー モデルを使用するには、次のロールと権限が必要です。
Consumer Procurement Entitlement 管理者 Identity and Access Management(IAM)ロールが必要です。このロールを付与されたユーザーなら誰でも、Model Garden でパートナー モデルを有効にできます。
aiplatform.endpoints.predict権限が必要です。この権限は、Agent Platform ユーザー IAM ロールに含まれています。詳細については、Gemini Enterprise Agent Platform ユーザーと アクセス制御をご覧ください。
コンソール
Consumer Procurement Entitlement 管理者 IAM ロールをユーザーに付与するには、[IAM] ページに移動します。
[プリンシパル] 列で、Anthropic Claude モデルへのアクセスを有効にするユーザー プリンシパルを見つけて、その行の [プリンシパルを編集] をクリックします。
権限の編集ペインで、[ 別のロールを追加] をクリックします。
[ロールを選択] で、[Consumer Procurement Entitlement 管理者] を選択します。
[編集権限] ペインで、 [別のロールを追加] をクリックします。
[ロールを選択] で、[Agent Platform ユーザー] を選択します。
[保存] をクリックします。
gcloud
-
コンソールで Cloud Shell をアクティブにします。 Google Cloud
Model Garden でパートナー モデルを有効にするために必要な Consumer Procurement Entitlement 管理者のロールを付与します。
gcloud projects add-iam-policy-binding PROJECT_ID \ --member=PRINCIPAL --role=roles/consumerprocurement.entitlementManagerプロンプト リクエストを行うために必要な
aiplatform.endpoints.predict権限を含む Agent Platform ユーザー ロールを付与します。gcloud projects add-iam-policy-binding PROJECT_ID \ --member=PRINCIPAL --role=roles/aiplatform.userPRINCIPALは、プリンシパルの ID に置き換えます。ID の形式はuser|group|serviceAccount:emailまたはdomain:domainです(例:user:cloudysanfrancisco@gmail.com、group:admins@example.com、serviceAccount:test123@example.domain.com、domain:example.domain.com)。以下を含むポリシー バインディングのリストが出力されます。
- members: - user:PRINCIPAL role: roles/roles/consumerprocurement.entitlementManager詳細については、単一のロールを付与すると
gcloud projects add-iam-policy-bindingをご覧ください。
パートナー モデルへのアクセスに関する組織のポリシーを設定する
パートナー モデルを有効にするには、組織のポリシーで次の API を許可する必要があります。Cloud Commerce Consumer Procurement API - cloudcommerceconsumerprocurement.googleapis.com
組織でサービスの使用を制限するように組織のポリシーを設定している場合、組織管理者は組織のポリシーを設定することで、cloudcommerceconsumerprocurement.googleapis.com が許可されていることを確認する必要があります。
また、Model Garden でのモデルの使用を制限する組織のポリシーがある場合は、ポリシーでパートナー モデルへのアクセスを許可する必要があります。詳細については、モデルへのアクセスを制御するをご覧ください。
パートナー モデルの規制遵守
Gemini Enterprise Agent Platform を使用してパートナー モデルをマネージド API として使用する場合も、 Gemini Enterprise Agent Platform の生成 AI の認定は引き続き適用されます。 モデル自体について詳しくお知りになりたい場合は、それぞれのモデルカードで詳細情報を確認するか、それぞれのモデルのパブリッシャーにお問い合わせください。
データは、Gemini Enterprise Agent Platform のパートナー モデル用に選択されたリージョンまたはマルチリージョン内に保存されますが、データ処理のリージョン化は異なる場合があります。パートナー モデルのデータ処理 に関するコミットメントの詳細なリストについては、パートナー モデルのデータ所在地 をご覧ください。
パートナー モデルを含む Gemini Enterprise API を使用する場合、お客様のプロンプトとモデルのレスポンスは第三者と共有されません。Google は、お客様の指示に従ってのみ お客様データを処理します。詳細については、 Cloud のデータ処理に関する追加条項をご覧ください。