このドキュメントでは、 Model Armor からコンテンツ セキュリティの分析情報を表示する方法について説明します。サポートされている AI エージェント
Model Armor は、間接的なプロンプト インジェクション攻撃、センシティブ データ漏洩、有害なコンテンツの生成や配信などのセキュリティ リスクについて、リクエストとレスポンスをスクリーニングします。詳細については、 Model Armor をご覧ください。
Model Armor オペレーションの結果は、次のレベルで確認できます。
- 最上位レベルのビュー: プロジェクト内のサポートされているすべての AI エージェントの分析情報
- エージェント レベルのビュー: 単一の AI エージェントの分析情報
始める前に
- アカウントにログインします。 Google Cloud を初めて使用する場合は、 アカウントを作成して、実際のシナリオで Google プロダクトのパフォーマンスを評価してください。 Google Cloud新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
Enable the Model Armor API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.Enable the Model Armor API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.- プロジェクト内の 1 つ以上のゲートウェイで Model Armor を構成します。
- a Google Cloud MCP サーバーと通信するエージェントをモニタリングするには、MCP サーバーで Model Armor を 構成します。
- エージェントのトレースを 設定します。
必要なロール
コンテンツ セキュリティの違反をモニタリングするために必要な権限を取得するには、プロジェクトに対する次の IAM ロールの付与を管理者に依頼してください。
- Observability View Accessor (
roles/observability.viewAccessor) - Observability Analytics User (
roles/observability.analyticsUser) - ログビューア (
roles/logging.viewer) - ログ表示アクセス者 (
roles/logging.viewAccessor)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
これらの事前定義ロールには コンテンツ セキュリティの違反をモニタリングするために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。
必要な権限
コンテンツ セキュリティの違反をモニタリングするには、次の権限が必要です。
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
サポートされているエージェント
[セキュリティ] タブには、次のエージェントの Model Armor の分析情報のみが表示されます。
- Agent Runtime にデプロイされ、Model Armor が 構成されているゲートウェイに則って管理されるエージェント。
- Agent Runtime にデプロイされ、MCP サーバーと Google Cloud 通信するエージェント。
- Model Armor のフロア設定が構成されているプロジェクトの Agent Runtime にデプロイされたエージェント。
プロジェクト内のサポートされている AI エージェントのコンテンツ分析情報を表示する(最上位レベルのビュー)
プロジェクト内のサポートされているすべての AI エージェントのコンテンツ セキュリティの分析情報を表示する手順は次のとおりです。
- コンソールで、Gemini Enterprise Agent Platform の [セキュリティ] タブに移動します。 Google Cloud
- プロジェクトを選択します。
[**セキュリティ**] タブにコンテンツ セキュリティの分析情報が表示されず、プロジェクトにサポートされている AI エージェントがある場合は、エージェントのトレースが設定されていることを確認してください。
AI エージェントのコンテンツ分析情報を表示する(エージェント レベルのビュー)
サポートされているエージェントのコンテンツ セキュリティの分析情報を表示する手順は次のとおりです。
- コンソールで、[エージェント レジストリ] に移動します。 Google Cloud
- プロジェクトを選択します。
- エージェントの名前をクリックします。
- [セキュリティ] タブをクリックします。
フラグが設定されたインタラクションまたはブロックされたインタラクションの数を表示する
最上位レベル または エージェント レベル [セキュリティ] タブに移動します。
[セキュリティ] タブで、フラグ付きインタラクションやブロックされたインタラクションなど、インタラクションの数を表示します。[セキュリティ] タブには、次の指標が表示されます。
- インタラクションの合計数: Model Armor によって分析されたプロンプトとレスポンスの合計数
- フラグ付きインタラクション数: Model Armor のテンプレートまたはフロア設定で構成されたポリシーに違反したインタラクションの数。
- ブロックされたインタラクション数:
INSPECT_AND_BLOCKモードで Model Armor を構成した場合にブロックされたインタラクションの数。これらのブロックされたインタラクションは、フロア設定またはテンプレートに違反しています。
コンテンツ セキュリティの違反をモニタリングする
最上位レベル または エージェント レベル [セキュリティ] タブに移動します。
[違反の推移] グラフで、検出された違反の数をモニタリングします。
検出された違反は、次のカテゴリに分類されます。
- プロンプト インジェクションとジェイルブレイク: 悪意のあるコマンドやジェイルブレイクの試行を含むプロンプトの存在を示すコンテンツ違反。詳細については、 プロンプト インジェクションとジェイルブレイクの検出をご覧ください。
- 悪意のある URL: 悪意のある URL の存在を示すコンテンツ違反。詳細については、悪意のある URL の検出をご覧ください。
- 責任ある AI: ハラスメントやヘイトスピーチなど、安全フィルタによって検出されたコンテンツ違反。責任ある AI カテゴリの完全なリストについては、 責任ある AI の安全 フィルタをご覧ください。
- センシティブ データ: 機密情報タイプまたは ユーザー定義のカスタム情報タイプの存在に関連するコンテンツ違反。詳細については、 Sensitive Data Protection をご覧ください。
これらの検出機能の詳細については、Model Armor フィルタをご覧ください。
違反が最も多いエージェントを特定する
最上位レベル [セキュリティ] タブに移動します。
[セキュリティ] タブには、違反が最も多い上位 10 個のエージェントが表示されます。リストには、各エージェントのエージェント ID と、そのエージェントで検出された違反の数が表示されます。
リスト内の特定のエージェントの Model Armor の分析情報を表示するには、[エージェント レジストリ] に移動して、エージェント ID でエージェントを検索します。次に、そのエージェントのエージェント レベルの [agent-level] [Security] タブに移動します。
SQL を使用してテレメトリー データをクエリして分析する
Model Armor からのテレメトリー データをクエリして分析するには、SQL ベースのクエリ インターフェースを提供する Observability Analytics を使用します。
- 最上位レベル [セキュリティ] タブに移動します。
- クエリするビューで、 [その他のグラフ オプション] > [Observability Analytics で探索] をクリックします。
Observability Analytics の使用方法の一般的な手順については、 Observability Analytics でテレメトリーをクエリして分析するをご覧ください。
違反データを PNG ファイルまたは CSV ファイルにダウンロードする
違反データを PNG ファイルまたは CSV ファイルにダウンロードする手順は次のとおりです。
- [違反の推移] ビューの [セキュリティ] タブで、データをダウンロードする期間を選択します。
- [その他のグラフ オプション] > [ダウンロード] をクリックします。
- [PNG をダウンロード] または [CSV をダウンロード] をクリックして、必要な形式でデータをダウンロードします。