Model Armor は、LLM アプリケーションのプロンプトとレスポンスをスクリーニングします。モニタリング ダッシュボードには、このスクリーニング プロセスから生成されたデータ、指標、可視化が表示されます。これらの分析情報を使用して、Model Armor が AI アプリケーションを保護し、プロンプト インジェクションやその他の悪意のあるアクティビティの試行を特定する方法を理解します。
始める前に
必要な権限
モニタリング ダッシュボードにアクセスするために必要な権限を取得するには、プロジェクトに対する IAM ロールを付与するよう管理者に依頼します。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。
この事前定義ロールには、モニタリング ダッシュボードにアクセスするために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。
必要な権限
モニタリング ダッシュボードにアクセスするには、次の権限が必要です。
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
モニタリング ダッシュボードにアクセスする
Google Cloud コンソールで、[Model Armor] ページに移動します。
Model Armor を有効にしたプロジェクトが表示されていることを確認します。
[Monitoring] タブに移動します。
このページでは、次のことができます。
- 選択した日時におけるインタラクションを表示します。
- 関連付けられたテンプレートまたはフロア設定、場所、統合ポイント、入力タイプに基づいてインタラクションをフィルタします。
- データを PNG ファイルまたは CSV ファイルにダウンロードします。
- 違反の推移をトレンドグラフで確認します。
- プロジェクト全体で使用されているテンプレートを表示します。
選択した日時の関連するログを検査します。これを行うには、 [その他のグラフ オプション] > [関連するログを検査] をクリックします。
関連するログを検査するには、テンプレートとフロア設定でロギングを有効にする必要があります。また、ログを表示するための IAM 権限を付与されている必要があります。
主な指標
モニタリング ダッシュボードの主な指標には、次のものがあります。
- スキャンされたインタラクションの合計数: Model Armor によって分析されたプロンプトとレスポンスの合計数。
- フラグ付きインタラクション数: Model Armor のテンプレートまたはフロア設定で構成されたポリシーの 1 つ以上に違反したインタラクションの数。
- ブロックされたインタラクション数: ブロックされたインタラクションの数(検査とブロックモードで Model Armor を構成している場合)。
- カテゴリ別の違反:
- すべての検出機能: すべての検出機能で違反が検出されたコンテンツ。
- 機密データに関する違反: 個人を特定できる情報(PII)、財務データ、またはユーザーが定義したカスタムデータ型の存在。
- 責任ある AI: ヘイトスピーチ、危険なコンテンツ、ハラスメント、性的描写が露骨なコンテンツなど、安全性フィルタに違反するコンテンツ。
次のステップ
- Model Armor について確認する。
- Model Armor テンプレートについて確認する。
- Model Armor のフロア設定について確認する。
- Model Armor のエンドポイントについて確認する。
- プロンプトとレスポンスをサニタイズする。
- Model Armor の監査ロギングについて確認する。
- Model Armor のロギングを構成する
- Model Armor に関する問題のトラブルシューティングを行う。