Model Armor 會篩選 AI 應用程式的提示詞和回覆,監控資訊主頁會顯示這項篩選程序產生的資料、指標和視覺化效果。您可以運用這些洞察資料,瞭解 Model Armor 如何保護 AI 應用程式,以及識別嘗試注入提示詞或其他惡意活動。
事前準備
必要角色
如要取得存取監控資訊主頁所需的權限,請要求管理員授予您專案的「Monitoring 檢視者 」(roles/monitoring.viewer) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。
這個預先定義的角色具備存取監控資訊主頁所需的權限。如要查看確切的必要權限,請展開「Required permissions」(必要權限) 部分:
所需權限
如要存取監控資訊主頁,必須具備下列權限:
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
查看監控資訊主頁
前往 Google Cloud 控制台的「Model Armor」頁面。
確認您正在查看已啟用 Model Armor 的專案。
前往「監控」分頁。
監控 Model Armor 使用情形和效能
如要詳細監控 Model Armor 的用量和效能,可以使用 Cloud Monitoring 提供的特定指標類型。可用的指標類型如下:
modelarmor.googleapis.com/template/request_count:SanitizeAPI 要求計數modelarmor.googleapis.com/template/pi_jb_request_count:提示詞注入和越獄篩選器計數modelarmor.googleapis.com/template/rai_request_count:負責任的 AI 技術篩選器計數modelarmor.googleapis.com/template/sdp_request_count:Sensitive Data Protection 篩選器數量modelarmor.googleapis.com/template/malicious_uri_request_count:惡意 URI 篩選器計數modelarmor.googleapis.com/template/used_token_count:已使用的權杖數量
詳情請參閱「Model Armor 指標類型」。
查看已標記或封鎖的互動次數
在監控資訊主頁上,查看互動次數,包括遭檢舉和封鎖的互動。監控資訊主頁會顯示下列指標:
- 互動總數:Model Armor 分析的提示和回覆總數。
- 標記的互動:違反 Model Armor 範本或底限設定中設定政策的互動次數。
- 已封鎖的互動數量:如果您在
INSPECT_AND_BLOCK模式中設定 Model Armor,系統會封鎖互動。這些遭到封鎖的互動違反了底限設定或範本。
監控內容安全違規事項
在「隨時間變化的違規次數」圖表中,監控隨時間變化的違規次數。
系統偵測到的違規事項會歸類到下列領域:
- 所有偵測工具:所有偵測工具偵測到的違規事件總數,包括提示詞注入和越獄、惡意網址、負責任的 AI 技術和敏感資料。
- 負責任的 AI 技術:安全篩選器偵測到的違規內容,例如騷擾和仇恨言論。如需負責任的 AI 技術類別完整清單,請參閱「負責任的 AI 技術安全性篩選器」。
- 機密資料:內容違規事件涉及出現您定義的機密資訊類型或自訂資訊類型。詳情請參閱 Sensitive Data Protection。
如要進一步瞭解這些偵測器,請參閱「Model Armor 篩選器」。
對資料檢視套用篩選器
在監控資訊主頁套用這些篩選器後,監控資訊主頁上的所有檢視畫面都會根據您選取的條件進行篩選。
- 範本/底限設定:根據相關聯的範本或底限設定篩選檢視畫面。
- 整合點:根據 Model Armor 整合項目篩選檢視畫面。
- 位置:根據互動處理地點篩選檢視畫面。
- 輸入類型:根據評估的輸入類型 (提示或回覆) 篩選檢視畫面。
檢查相關記錄
如要探索與監控資訊主頁資料相關的記錄項目,請在範本和底限設定中啟用記錄功能。您必須具備必要的 IAM 角色,才能查看記錄。
如要檢查所選時間範圍的記錄,請在監控資訊主頁中,依序點選 「更多圖表選項」>「檢查相關記錄」。
將違規資料下載為 PNG 或 CSV 檔案
如要將違規事項資料下載為 PNG 或 CSV 檔案,請按照下列步驟操作:
- 在監控資訊主頁的「違規事項隨時間變化」檢視畫面中,選取要下載資料的期間。
- 依序點選「更多圖表選項」「下載」。
- 按一下「下載 PNG」或「下載 CSV」,即可下載偏好的資料格式。