Model Armor filtra i prompt e le risposte per le tue applicazioni di AI. La dashboard di monitoraggio fornisce i dati, le metriche e le visualizzazioni generati da questo processo di screening. Utilizza questi approfondimenti per capire in che modo Model Armor protegge le tue applicazioni di AI e identifica i tentativi di prompt injection o altre attività dannose.
Prima di iniziare
Ruolo richiesto
Per ottenere le autorizzazioni necessarie per accedere alla dashboard di monitoraggio, chiedi all'amministratore di concederti il ruolo IAM Visualizzatore Monitoring (roles/monitoring.viewer) sul progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questo ruolo predefinito contiene le autorizzazioni necessarie per accedere alla dashboard di monitoraggio. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per accedere alla dashboard di monitoraggio sono necessarie le seguenti autorizzazioni:
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Visualizzare la dashboard di monitoraggio
Nella console Google Cloud , vai alla pagina Model Armor.
Verifica di visualizzare il progetto su cui hai attivato Model Armor.
Vai alla scheda Monitoraggio.
Visualizzare il numero di interazioni segnalate o bloccate
Nella dashboard di monitoraggio, visualizza il numero di interazioni, incluse quelle segnalate e bloccate. La dashboard di monitoraggio mostra le seguenti metriche:
- Interazioni totali: il numero totale di prompt e risposte analizzati da Model Armor.
- Interazioni segnalate: il numero di interazioni che hanno violato una norma configurata nel modello o nelle impostazioni di base di Model Armor.
- Interazioni bloccate: il numero di interazioni bloccate se hai
configurato Model Armor in modalità
INSPECT_AND_BLOCK. Queste interazioni bloccate violavano le impostazioni di base o i modelli.
Monitorare le violazioni della sicurezza dei contenuti
Nel grafico Violazioni nel tempo, monitora il numero di violazioni rilevate nel tempo.
Le violazioni rilevate sono classificate nelle seguenti aree:
- Tutti i rilevatori: il numero totale di violazioni rilevate da tutti i rilevatori, tra cui prompt injection e jailbreak, URL dannosi, AI responsabile e dati sensibili.
- AI responsabile: violazioni dei contenuti rilevate dai filtri di sicurezza, come molestie e incitamento all'odio. Per un elenco completo delle categorie di AI responsabile, consulta Filtro di sicurezza dell'AI responsabile.
- Dati sensibili: violazioni dei contenuti che comportano la presenza di tipi di informazioni sensibili o tipi di informazioni personalizzate che definisci. Per ulteriori informazioni, consulta Sensitive Data Protection.
Per saperne di più su questi rilevatori, consulta Filtri Model Armor.
Applicare filtri alle visualizzazioni
Quando applichi questi filtri alla dashboard di monitoraggio, tutte le visualizzazioni della dashboard di monitoraggio vengono filtrate in base ai criteri che selezioni.
- Impostazioni dei modelli/di base: filtra le visualizzazioni in base al modello o alle impostazioni di base associati.
- Punti di integrazione: filtra le visualizzazioni in base alle integrazioni di Model Armor.
- Località: filtra le visualizzazioni in base alla posizione in cui è stata elaborata un'interazione.
- Tipi di input: filtra le visualizzazioni in base al tipo di input valutato: prompt o risposta.
Ispeziona i log correlati
Per esplorare le voci di log correlate ai dati nella dashboard di monitoraggio, attiva la registrazione nei tuoi modelli e nelle impostazioni di base. Devi disporre dei ruoli IAM richiesti per visualizzare i log.
Per esaminare i log per il periodo selezionato, nella dashboard di monitoraggio, fai clic su Altre opzioni del grafico > Esamina log correlati.
Scaricare i dati sulle violazioni in un file PNG o CSV
Per scaricare i dati sulle violazioni in un file PNG o CSV, segui questi passaggi:
- Nella visualizzazione Violazioni nel tempo della dashboard di monitoraggio, seleziona il periodo per cui vuoi scaricare i dati.
- Fai clic su Altre opzioni del grafico > Scarica.
- Fai clic su Scarica PNG o Scarica CSV per scaricare i dati nel formato che preferisci.
Passaggi successivi
- Scopri di più sui log di controllo di Model Armor.
- Configura la registrazione per Model Armor
- Risolvi i problemi di Model Armor.