コンテンツ セキュリティをモニタリングする

このドキュメントでは、 Model Armor からコンテンツ セキュリティの分析情報を表示する方法について説明します。サポートされている AI エージェント

Model Armor は、間接的なプロンプト インジェクション攻撃、センシティブ データ漏洩、有害なコンテンツの生成や配信などのセキュリティ リスクについて、リクエストとレスポンスをスクリーニングします。詳細については、 Model Armor をご覧ください。

Model Armor オペレーションの結果は、次のレベルで確認できます。

始める前に

  1. アカウントにログインします。 Google Cloud を初めて使用する場合は、 アカウントを作成して、実際のシナリオで Google プロダクトのパフォーマンスを評価してください。 Google Cloud新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. Enable the Model Armor API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  3. Enable the Model Armor API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. プロジェクト内の 1 つ以上のゲートウェイで Model Armor を構成します。
  5. a Google Cloud MCP サーバーと通信するエージェントをモニタリングするには、MCP サーバーで Model Armor を 構成します
  6. エージェントのトレースを 設定します

必要なロール

コンテンツ セキュリティの違反をモニタリングするために必要な権限を取得するには、プロジェクトに対する次の IAM ロールの付与を管理者に依頼してください。

ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。

これらの事前定義ロールには コンテンツ セキュリティの違反をモニタリングするために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

コンテンツ セキュリティの違反をモニタリングするには、次の権限が必要です。

  • monitoring.monitoredResourceDescriptors.list
  • monitoring.metricDescriptors.list

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

サポートされているエージェント

[セキュリティ] タブには、次のエージェントの Model Armor の分析情報のみが表示されます。

プロジェクト内のサポートされている AI エージェントのコンテンツ分析情報を表示する(最上位レベルのビュー)

プロジェクト内のサポートされているすべての AI エージェントのコンテンツ セキュリティの分析情報を表示する手順は次のとおりです。

  1. コンソールで、Gemini Enterprise Agent Platform の [セキュリティ] タブに移動します。 Google Cloud

    [セキュリティ] に移動

  2. プロジェクトを選択します。

[**セキュリティ**] タブにコンテンツ セキュリティの分析情報が表示されず、プロジェクトにサポートされている AI エージェントがある場合は、エージェントのトレースが設定されていることを確認してください。

AI エージェントのコンテンツ分析情報を表示する(エージェント レベルのビュー)

サポートされているエージェントのコンテンツ セキュリティの分析情報を表示する手順は次のとおりです。

  1. コンソールで、[エージェント レジストリ] に移動します。 Google Cloud

    [エージェント レジストリ] に移動

  2. プロジェクトを選択します。
  3. エージェントの名前をクリックします。
  4. [セキュリティ] タブをクリックします。

フラグが設定されたインタラクションまたはブロックされたインタラクションの数を表示する

最上位レベル または エージェント レベル [セキュリティ] タブに移動します。

[セキュリティ] タブで、フラグ付きインタラクションやブロックされたインタラクションなど、インタラクションの数を表示します。[セキュリティ] タブには、次の指標が表示されます。

  • インタラクションの合計数: Model Armor によって分析されたプロンプトとレスポンスの合計数
  • フラグ付きインタラクション数: Model Armor のテンプレートまたはフロア設定で構成されたポリシーに違反したインタラクションの数。
  • ブロックされたインタラクション数: INSPECT_AND_BLOCKモードで Model Armor を構成した場合にブロックされたインタラクションの数。これらのブロックされたインタラクションは、フロア設定またはテンプレートに違反しています。

コンテンツ セキュリティの違反をモニタリングする

最上位レベル または エージェント レベル [セキュリティ] タブに移動します。

[違反の推移] グラフで、検出された違反の数をモニタリングします。

検出された違反は、次のカテゴリに分類されます。

これらの検出機能の詳細については、Model Armor フィルタをご覧ください。

違反が最も多いエージェントを特定する

最上位レベル [セキュリティ] タブに移動します。

[セキュリティ] タブには、違反が最も多い上位 10 個のエージェントが表示されます。リストには、各エージェントのエージェント ID と、そのエージェントで検出された違反の数が表示されます。

リスト内の特定のエージェントの Model Armor の分析情報を表示するには、[エージェント レジストリ] に移動して、エージェント ID でエージェントを検索します。次に、そのエージェントのエージェント レベルの [agent-level] [Security] タブに移動します。

[エージェント レジストリ] に移動

SQL を使用してテレメトリー データをクエリして分析する

Model Armor からのテレメトリー データをクエリして分析するには、SQL ベースのクエリ インターフェースを提供する Observability Analytics を使用します。

  1. 最上位レベル [セキュリティ] タブに移動します。
  2. クエリするビューで、 [その他のグラフ オプション] > [Observability Analytics で探索] をクリックします。

Observability Analytics の使用方法の一般的な手順については、 Observability Analytics でテレメトリーをクエリして分析するをご覧ください。

違反データを PNG ファイルまたは CSV ファイルにダウンロードする

違反データを PNG ファイルまたは CSV ファイルにダウンロードする手順は次のとおりです。

  1. [違反の推移] ビューの [セキュリティ] タブで、データをダウンロードする期間を選択します。
  2. [その他のグラフ オプション] > [ダウンロード] をクリックします。
  3. [PNG をダウンロード] または [CSV をダウンロード] をクリックして、必要な形式でデータをダウンロードします。

次のステップ

ガイド

Model Armor の監査ロギングについて確認する。

ガイド

Model Armor のロギングを構成する方法を学習する。

トラブルシューティング

Model Armor に関する問題のトラブルシューティング方法を学習する。