Model Armor prüft die Prompts und Antworten für Ihre KI-Anwendungen. Das Monitoring-Dashboard enthält die Daten, Messwerte und Visualisierungen, die aus diesem Screening-Prozess generiert werden. Mithilfe dieser Statistiken können Sie nachvollziehen, wie Model Armor Ihre KI-Anwendungen schützt und versuchte Prompt-Injections oder andere schädliche Aktivitäten erkennt.
Hinweis
Erforderliche Rolle
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Monitoring Viewer (roles/monitoring.viewer) für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie für den Zugriff auf das Monitoring-Dashboard benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die für den Zugriff auf das Monitoring-Dashboard erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um auf das Monitoring-Dashboard zuzugreifen:
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Monitoring-Dashboard aufrufen
Rufen Sie in der Google Cloud Console die Seite Model Armor auf.
Prüfen Sie, ob Sie das Projekt aufrufen, in dem Sie Model Armor aktiviert haben.
Rufen Sie den Tab Monitoring auf.
Model Armor-Nutzung und ‑Leistung überwachen
Wenn Sie die Nutzung und Leistung von Model Armor im Detail überwachen möchten, können Sie die spezifischen Messwerttypen verwenden, die in Cloud Monitoring verfügbar sind. Die folgenden Messwerttypen sind verfügbar:
modelarmor.googleapis.com/template/request_count: Anzahl der SanitizeAPI-Anfragenmodelarmor.googleapis.com/template/pi_jb_request_count: Anzahl der Prompt-Injection- und Jailbreaking-Filtermodelarmor.googleapis.com/template/rai_request_count: Anzahl der Filter für verantwortungsbewusste Anwendung von KImodelarmor.googleapis.com/template/sdp_request_count: Anzahl der Filter für Sensitive Data Protectionmodelarmor.googleapis.com/template/malicious_uri_request_count: Anzahl der Filter für schädliche URLsmodelarmor.googleapis.com/template/used_token_count: Anzahl der verwendeten Tokens
Weitere Informationen finden Sie unter Model Armor-Messwerttypen.
Anzahl der gemeldeten oder blockierten Interaktionen ansehen
Im Monitoring-Dashboard sehen Sie die Anzahl der Interaktionen, einschließlich der gemeldeten und blockierten Interaktionen. Im Monitoring-Dashboard werden die folgenden Messwerte angezeigt:
- Interaktionen insgesamt: Die Gesamtzahl der Prompts und Antworten, die von Model Armor analysiert werden.
- Gekennzeichnete Interaktionen: Die Anzahl der Interaktionen, die gegen eine konfigurierte Richtlinie in Ihrer Model Armor-Vorlage oder Ihren Mindesteinstellungen verstoßen haben.
- Blockierte Interaktionen: Die Anzahl der Interaktionen, die blockiert wurden, wenn Sie Model Armor im Modus
INSPECT_AND_BLOCKkonfiguriert haben. Diese blockierten Interaktionen verstießen gegen Mindesteinstellungen oder Vorlagen.
Verstöße gegen die Inhaltsrichtlinien überwachen
Im Diagramm Verstöße im Zeitverlauf können Sie die Anzahl der erkannten Verstöße im Zeitverlauf beobachten.
Die erkannten Verstöße sind in die folgenden Bereiche unterteilt:
- Prompt Injections und Jailbreaks: Inhaltsverstöße, die auf das Vorhandensein von Prompts mit schädlichen Befehlen oder Jailbreak-Versuchen hinweisen. Weitere Informationen finden Sie unter Erkennung von Prompt Injection und Jailbreaking.
- Schädliche URL: Inhaltsverstöße, die auf das Vorhandensein schädlicher URLs hinweisen. Weitere Informationen finden Sie unter Erkennung schädlicher URLs.
- Verantwortungsbewusste KI: Inhaltsverstöße, die von Sicherheitsfiltern erkannt werden, z. B. Belästigung und Hassrede. Eine vollständige Liste der Kategorien für verantwortungsbewusste KI finden Sie unter Sicherheitsfilter für verantwortungsbewusste Anwendung von KI.
- Vertrauliche Daten: Inhaltsverstöße, bei denen vertrauliche Informationstypen oder benutzerdefinierte Informationstypen, die Sie definieren, vorhanden sind. Weitere Informationen finden Sie unter Sensitive Data Protection.
Weitere Informationen zu diesen Detektoren finden Sie unter Model Armor-Filter.
Filter auf Datenansichten anwenden
Wenn Sie diese Filter auf das Monitoring-Dashboard anwenden, werden alle Ansichten im Monitoring-Dashboard anhand der von Ihnen ausgewählten Kriterien gefiltert:
- Vorlagen/Mindesteinstellungen: Filtern Sie Ansichten nach der zugehörigen Vorlage oder den Mindesteinstellungen.
- Integrationspunkte: Datenansichten nach Model Armor-Integrationen filtern.
- Standorte: Filtern Sie Ansichten danach, wo eine Interaktion verarbeitet wurde.
- Eingabetypen: Ansichten nach dem Typ der ausgewerteten Eingabe filtern: Prompt oder Antwort.
Zugehörige Logs prüfen
Wenn Sie Logeinträge im Zusammenhang mit den Daten im Monitoring-Dashboard aufrufen möchten, aktivieren Sie die Protokollierung in Ihren Vorlagen oder Mindesteinstellungen. Sie benötigen die erforderlichen IAM-Rollen, um Logs aufzurufen.
Wenn Sie die Logs für den ausgewählten Zeitraum prüfen möchten, klicken Sie im Monitoring-Dashboard auf Weitere Diagrammoptionen > Zugehörige Logs prüfen.
Daten zu Verstößen in eine PNG- oder CSV-Datei herunterladen
So laden Sie Daten zu Verstößen in eine PNG- oder CSV-Datei herunter:
- Wählen Sie im Monitoring-Dashboard in der Ansicht Verstöße im Zeitverlauf den Zeitraum aus, für den Sie Daten herunterladen möchten.
- Klicken Sie auf Weitere Diagrammoptionen> Herunterladen.
- Klicken Sie auf PNG herunterladen oder CSV-Datei herunterladen, um die Daten im gewünschten Format herunterzuladen.
Nächste Schritte
- Weitere Informationen zum Audit-Logging für Model Armor
- Logging für Model Armor konfigurieren
- Probleme mit Model Armor beheben