Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

概要

Model Armor は、 Google Cloud サービスと統合して、 AI と大規模言語モデル（LLM）のインタラクションを保護します。Model Armor は、ポリシー違反の可能性を特定して報告し、セキュリティ評価に基づいてアクションを積極的にブロックできます。

サポートされているモダリティ

Model Armor と他の Google Cloud サービスとのインテグレーションでは、 Model Armor は LLM、エージェント、 Google Cloud MCP サーバーとの間のテキストベースの入力と出力のみをスキャンして分析します。Gemini Enterprise インテグレーションのドキュメントを除き、他のモダリティはスキャンされません。サポートされているドキュメントタイプの詳細については、ドキュメントのスクリーニングをご覧ください。

サポート対象のサービス

このセクションでは、 Google Cloud Model Armor と統合できるサービスについて説明します。

Agent Gateway

Model Armor を Agent Gateway と統合して、ゲートウェイに則って管理されるすべてのエージェントとの間のトラフィックにセキュリティポリシーを適用します。このインテグレーションにより、悪意のあるコンテンツや非準拠のコンテンツをインラインで検査してブロックできます。このインテグレーションは、アプリケーションコードを変更することなく、ワークフローのセキュリティと組織の安全ガイドラインの遵守を向上させることを目的としています。この保護は、エージェントへの入力パスとエージェントからの出力パスの両方で、サポートされているプロトコルに適用されます。詳細については、Agent Gateway と統合するをご覧ください。

Apigee

Model Armor と Apigee のインテグレーションを使用すると、Apigee API ゲートウェイレイヤ内で Model Armor の AI 保護機能を直接使用できます。Apigee API プロキシ内で特定の Model Armor ポリシーを構成します。API 呼び出しがこれらのポリシーを持つ Apigee プロキシを通過すると、Apigee はプロンプトとレスポンスを Model Armor サービスに送信して検査します。詳細については、 Apigee と統合するをご覧ください。

Gemini Enterprise

Model Armor は、テンプレートを使用して Gemini Enterprise と直接統合できます。Gemini Enterprise は、ユーザーとエージェント間のやり取りと基盤となる LLM を Model Armor を介してルーティングします。つまり、ユーザーやエージェントからのプロンプトと、LLM によって生成されたレスポンスは、ユーザーに提示される前に Model Armor によって検査されます。詳細については、Gemini Enterprise と統合するをご覧ください。

サポートされているモダリティに記載されているモダリティに加えて、 Model Armor と Gemini Enterprise のインテグレーションではドキュメントもサポートされています。ただし、ドキュメントに埋め込まれた画像はスクリーニングされません。

Google と Google Cloud MCP サーバー

Model Armor を構成して、データを保護し、 Model Context Protocol（MCP）ツールとサーバーを公開する Google Cloud サービスにリクエストを送信する際に、コンテンツを保護できます。Model Armor は、MCP ツール呼び出しとレスポンスをサニタイズすることで、エージェント型 AI アプリケーションを保護します。フロア設定を使用します。このプロセスにより、プロンプトインジェクションやセンシティブデータ開示などのリスクが軽減されます。詳細については、Google と MCP サーバーを統合するをご覧ください。 Google Cloud

Service Extensions

Model Armor は、 Google Cloud ネットワークサービスを介して Service Extensions と統合できます。Service Extensions を使用すると、サービスまたはユーザー管理サービスを Google Cloud 統合してトラフィックを処理できます。アプリケーションロードバランサでサービス拡張機能を構成して、エージェントや MCP サーバーとのやり取りなど、さまざまな AI インタラクションのネットワークトラフィックをスクリーニングできます。また、GKE 推論ゲートウェイでサービス拡張機能を使用して、GKE クラスタとの間のトラフィックをスクリーニングすることもできます。これにより、ロードバランサを通過するすべての AI インタラクションが Model Armor によって保護されます。詳細については、ネットワークサービスと統合する Google Cloud をご覧ください。

Gemini Enterprise Agent Platform

Model Armor は、フロア設定またはテンプレートを使用して、Gemini Enterprise Agent Platform に直接統合できます。このインテグレーションにより、Gemini モデルのリクエストとレスポンスがスクリーニングされ、フロア設定に違反するリクエストとレスポンスがブロックされます。このインテグレーションにより、Vertex AI の Gemini API 内で generateContent メソッドのプロンプトとレスポンスが保護されます。プロンプトとレスポンスのサニタイズ結果を可視化するには、Cloud Logging を有効にする必要があります。詳細については、 Gemini Enterprise Agent Platform と統合するをご覧ください。

始める前に

API を有効にする

Model Armor を使用するには、Model Armor API を有効にする必要があります。

コンソール

Model Armor API を有効にします。
API を有効にするために必要なロール
API を有効にするには、serviceusage.services.enable 権限を含む Service Usage 管理者 IAM ロール（roles/serviceusage.serviceUsageAdmin）が必要です。詳しくは、ロールを付与する方法をご覧ください。
API の有効化
Model Armor を有効にするプロジェクトを選択します。

gcloud

始める前に、Google Cloud CLI で Model Armor API を使用して、次の処理を行います。

コンソールで Cloud Shell をアクティブにします。 Google Cloud

Cloud Shell をアクティブにする

コンソールの下部にある Google Cloud Cloud Shell セッションが開始し、コマンドラインプロンプトが表示されます。Cloud Shell はシェル環境です。Google Cloud CLI がすでにインストールされており、現在のプロジェクトの値もすでに設定されています。セッションが初期化されるまで数秒かかることがあります。
gcloud CLI を使用して API エンドポイントのオーバーライドを設定します。

gcloud CLI を使用して API エンドポイントのオーバーライドを設定する

この手順は、gcloud CLI を使用して Model Armor API を有効にする場合にのみ必要です。gcloud CLI がリクエストを Model Armor サービスに正しくルーティングするように、API エンドポイントのオーバーライドを手動で設定する必要があります。

次のコマンドを実行して、Model Armor サービスの API エンドポイントを設定します。

gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

LOCATION は、Model Armor を使用するリージョンに置き換えます。

割り当てを管理

Model Armor は、割り当てシステムを使用して、公平な使用を確保し、システムの安定性を保護します。Model Armor API のデフォルトの割り当ては、プロジェクトごとに 1,200 QPM です。プロジェクトごとに 0 ～ 1,200 QPM の値を適用できます。調整をリクエストするには、割り当ての調整をリクエストするをご覧ください。デフォルトの割り当てを超える割り当てが必要な場合は、 Cloud カスタマーケアにお問い合わせください。

Model Armor の割り当ては、他のサービスと統合する際に重要な考慮事項となります。操作する主な割り当ては、プロジェクトごとに 1 分あたりの API リクエスト数です。

Model Armor を他のサービスと統合する場合は、次の割り当てタイプを考慮してください。

Model Armor のデフォルトの割り当て: サービスが分析のために Model Armor API を呼び出すと（プロンプトやレスポンスの確認など）、プロジェクトの Model Armor API の割り当てが消費されます。
統合サービスの割り当て: Model Armor の割り当ては、統合サービスに関連付けられた割り当てとは異なります。リクエストパス内のすべてのサービスに十分な割り当てがあることを確認する必要があります。アプリケーションのコンテンツをサニタイズするために Model Armor API に対して行われた呼び出しは、Model Armor API の割り当て上限にカウントされます。

割り当て超過の状況を確認する

アプリケーションログに Model Armor からのエラー（通常は HTTP 429 RESOURCE_EXHAUSTED エラー）が表示されている場合は、Model Armor の割り当て上限に達しています。これは、リクエストが多すぎることを示します。

割り当ての必要量を見積もる

リクエストする Model Armor の割り当て量を決定するには、次の操作を行います。

サービスが Model Armor に送信する 1 分あたりのリクエスト数のピークを見積もります。
サービスとのユーザーインタラクションごとに Model Armor が呼び出される回数を考慮します（プロンプトに 1 回、レスポンスに 1 回など）。
同時ユーザーまたはセッションの最大数を考慮します。
予期しない急増に対応するために、適切なバッファ（予想されるピークの 20 ～ 30% 増など）で割り当てをリクエストします。
最適な見積もりから始め、リリース後に使用状況を注意深くモニタリングし、必要に応じて調整をリクエストします。

たとえば、1 分あたり 500 人のユーザーが想定され、各ユーザーインタラクションで Model Armor が 2 回（プロンプトとレスポンス）呼び出される場合は、少なくとも 1,000 QPM が必要です。バッファを考慮すると、1,200 ～ 1,300 QPM をリクエストすることをおすすめします。

考慮事項

他のサービスと統合する場合は、次の点を考慮してください。

他のサービスの割り当てをモニタリングして管理してください。Model Armor の割り当てが十分であっても、他のサービスの割り当てが不足すると、アプリケーションに影響します。
一時的な割り当ての問題やその他の再試行可能なエラーに対処するために、アプリケーションの設定で指数バックオフを使用したクライアントサイドの再試行を実装します。詳細については、再試行戦略をご覧ください。

適用タイプ

Model Armor を他のサービスと統合する場合に構成する重要な要素は、適用タイプです。この設定により、Model Armor が検査するデータ（LLM プロンプトやレスポンスなど）でポリシー違反の可能性が検出された場合の動作が決まります。適用タイプによって、Model Armor が違反を報告するだけか、積極的に介入するかが決まります。詳細については、適用タイプを定義するをご覧ください。

REST API を使用して統合する

インテグレーションに REST API を使用する場合、Model Armor はテンプレートを使用する検出機能としてのみ機能します。つまり、ポリシー違反の可能性を積極的に防止するのではなく、事前定義されたテンプレートに基づいて特定して報告します。 Model Armor API と統合すると、アプリケーションは Model Armor からの出力を使用して、提供されたセキュリティ評価の結果に基づいてアクションをブロックまたは許可できます。Model Armor API は、API トラフィックに関連する潜在的な脅威やポリシー違反に関する情報を返します。特に AI インタラクションの場合に役立ちます。アプリケーションは Model Armor API を呼び出し、レスポンスで受信した情報を使用して、事前定義されたカスタムロジックに基づいて意思決定を行い、アクションを実行できます。

Model Armor を統合する際のオプション

Model Armor には、次のインテグレーションオプションがあります。各オプションには、異なる機能が用意されています。

インテグレーションオプション	検出を構成する	検査のみ	検査してブロック	対象範囲
Agent Gateway（プレビュー）	テンプレートのみを使用する	はい	はい	すべてのモデルとすべてのクラウド
Apigee	テンプレートのみを使用する	はい	はい	すべてのモデルとすべてのクラウド²
Gemini Enterprise	テンプレートのみを使用する	はい	はい	すべてのモデルとすべてのクラウド²
Google と Google Cloud MCP サーバー	フロア設定のみを使用する	はい	はい	Google と Google Cloud MCP サーバー
Service Extensions	テンプレートのみを使用する	はい	はい	すべてのクラウド² の OpenAI 形式のモデル¹、エージェント、MCP サーバー
Gemini Enterprise Agent Platform	フロア設定とテンプレートの両方を使用する	はい	はい	Gemini モデル（非ストリーミング）

¹ Anthropic Claude、Mistral AI、 Grok など、いくつかの一般的なモデルは OpenAI 仕様をサポートしています。これらのモデルは通常、必要な OpenAI 互換の API レイヤを提供する vLLM などの推論エンジンを使用してデプロイされます。vLLM は、Meta Llama シリーズ、DeepSeek、Mistral、Mixtral ファミリー、Gemma など、幅広いモデルをサポートしています。

² AWS や Azure などの他のパブリッククラウドが含まれます。

Gemini Enterprise Agent Platform インテグレーションオプションを使用すると、Model Armor はフロア設定またはテンプレートを使用してインライン適用を行います。つまり、Model Armor は、アプリケーションコードを変更することなく、プロセスに直接介入してポリシーを積極的に適用します。

Service Extensions と Gemini Enterprise のインテグレーションでは、インラインポリシー適用にテンプレートのみが使用されます。つまり、Model Armor は、Service Extensions 内と Gemini Enterprise インスタンス内のユーザーまたはエージェントのインタラクションの両方で、アプリケーションコードを変更することなく、ポリシーを直接適用できます。

Model Armor と Gemini Enterprise のインテグレーションでは、最初のユーザープロンプトと最終的なエージェントまたはモデルのレスポンスのみがサニタイズされます。最初のユーザープロンプトと最終的なレスポンス生成の間に行われる中間ステップは、このインテグレーションの対象外です。

Security Command Center の Model Armor

Model Armor は、LLM プロンプトとレスポンスを検査して、プロンプトインジェクション、ジェイルブレイクの試み、悪意のある URL、有害なコンテンツなど、さまざまな脅威を検出します。Model Armor は、構成されたフロア設定の違反を検出すると、プロンプトまたはレスポンスをブロックし、Security Command Center に検出結果を送信します。詳細については、 Model Armor の検出結果をご覧ください。

概要 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。