Model Armor prüft die Prompts und Antworten für Ihre KI-Anwendungen. Das Monitoring-Dashboard enthält die Daten, Messwerte und Visualisierungen, die aus diesem Überprüfungsprozess generiert wurden. Anhand dieser Informationen können Sie nachvollziehen, wie Model Armor Ihre KI-Anwendungen schützt und versuchte Prompt Injections oder andere schädliche Aktivitäten erkennt.
Hinweis
Erforderliche Rolle
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Monitoring-Betrachter (roles/monitoring.viewer) für das Projekt zu erteilen, um die für den Zugriff auf das Monitoring-Dashboard erforderlichen Berechtigungen zu erhalten.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die für den Zugriff auf das Monitoring-Dashboard erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind für den Zugriff auf das Monitoring-Dashboard erforderlich:
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Monitoring-Dashboard ansehen
Rufen Sie in der Google Cloud Console die Model Armor Seite auf.
Prüfen Sie, ob Sie das Projekt aufrufen, für das Sie Model Armor aktiviert haben.
Rufen Sie den Tab Monitoring auf.
Anzahl der gemeldeten oder blockierten Interaktionen ansehen
Im Monitoring-Dashboard sehen Sie die Anzahl der Interaktionen, einschließlich gemeldeter und blockierter Interaktionen. Im Monitoring-Dashboard werden die folgenden Messwerte angezeigt:
- Gesamtzahl der Interaktionen: Die Gesamtzahl der Prompts und Antworten die von Model Armor analysiert werden.
- Gemeldete Interaktionen: Die Anzahl der Interaktionen, die gegen eine konfigurierte Richtlinie in Ihrer Model Armor-Vorlage oder in den Mindesteinstellungen verstoßen haben.
- Blockierte Interaktionen: Die Anzahl der Interaktionen, die blockiert wurden, wenn Sie
Model Armor im
INSPECT_AND_BLOCKModus konfiguriert haben. Diese blockierten Interaktionen haben gegen Mindesteinstellungen oder Vorlagen verstoßen.
Verstöße gegen die Inhaltsrichtlinien beobachten
Im Diagramm Verstöße im Zeitverlauf können Sie die Anzahl der erkannten Verstöße im Zeitverlauf beobachten.
Die erkannten Verstöße sind in die folgenden Bereiche unterteilt:
- Alle Detektoren: Die Gesamtzahl der Verstöße, die von allen Detektoren erkannt wurden, einschließlich Prompt Injections und Jailbreaks, schädlicher URLs, verantwortungsbewusster Anwendung von KI und sensibler Daten.
- Verantwortungsbewusste Anwendung von KI: Verstöße gegen die Inhaltsrichtlinien, die von Sicherheitsfiltern erkannt wurden, z. B. Belästigung und Hassrede. Eine vollständige Liste der Kategorien für die verantwortungsbewusste Anwendung von KI finden Sie unter Sicherheitsfilter für die verantwortungsbewusste Anwendung von KI.
- Sensible Daten: Verstöße gegen die Inhaltsrichtlinien, bei denen sensible Informationstypen oder benutzerdefinierte Informationstypen vorhanden sind. Weitere Informationen finden Sie unter Schutz sensibler Daten.
Weitere Informationen zu diesen Detektoren finden Sie unter Model Armor-Filter.
Filter auf Ansichten anwenden
Wenn Sie diese Filter auf das Monitoring-Dashboard anwenden, werden alle Ansichten im Monitoring-Dashboard anhand der von Ihnen ausgewählten Kriterien gefiltert.
- Vorlagen/Mindesteinstellungen: Ansichten nach der zugehörigen Vorlage oder den Mindesteinstellungen filtern.
- Integrationspunkte: Ansichten nach Model Armor-Integrationen filtern.
- Standorte: Ansichten danach filtern, wo eine Interaktion verarbeitet wurde.
- Eingabetypen: Ansichten nach dem Typ der ausgewerteten Eingabe filtern: Prompt oder Antwort.
Zugehörige Logs prüfen
Wenn Sie Logeinträge zu den Daten im Monitoring-Dashboard aufrufen möchten, aktivieren Sie das Logging in Ihren Vorlagen und Mindesteinstellungen. Sie müssen die erforderlichen IAM-Rollen haben, um Logs aufzurufen.
Wenn Sie die Logs für den ausgewählten Zeitraum prüfen möchten, klicken Sie im Monitoring-Dashboard auf Weitere Diagrammoptionen > Zugehörige Logs prüfen.
Daten zu Verstößen in eine PNG- oder CSV-Datei herunterladen
So laden Sie Daten zu Verstößen in eine PNG- oder CSV-Datei herunter:
- Wählen Sie in der Ansicht Verstöße im Zeitverlauf im Monitoring-Dashboard den Zeitraum aus, für den Sie Daten herunterladen möchten.
- Klicken Sie auf „“ Weitere Diagrammoptionen > Herunterladen.
- Klicken Sie auf PNG herunterladen oder CSV-Datei herunterladen , um die Daten im gewünschten Format herunterzuladen.
Nächste Schritte
- Weitere Informationen zum Audit-Logging von Model Armor
- Logging für Model Armor konfigurieren
- Probleme mit Model Armor beheben.