Model Armor analyse les prompts et les réponses de vos applications d'IA. Le tableau de bord de surveillance vous fournit les données, les métriques et les visualisations générées à partir de ce processus d'analyse. Utilisez ces insights pour comprendre comment Model Armor protège vos applications d'IA et identifie les tentatives d'injection de prompt ou d'autres activités malveillantes.
Avant de commencer
Rôle requis
Pour obtenir les autorisations nécessaires pour accéder au tableau de bord de surveillance, demandez à votre administrateur de vous accorder le rôle IAM Lecteur Monitoring (roles/monitoring.viewer) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Ce rôle prédéfini contient les autorisations requises pour accéder au tableau de bord de surveillance. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour accéder au tableau de bord de surveillance :
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Afficher le tableau de bord de surveillance
Dans la Google Cloud console, accédez à la page Model Armor.
Vérifiez que vous consultez le projet sur lequel vous avez activé Model Armor.
Accédez à l'onglet Surveillance.
Surveiller l'utilisation et les performances de Model Armor
Pour surveiller en détail l'utilisation et les performances de Model Armor, vous pouvez utiliser les types de métriques spécifiques disponibles dans Cloud Monitoring. Les types de métriques suivants sont disponibles :
modelarmor.googleapis.com/template/request_count: nombre de requêtes SanitizeAPImodelarmor.googleapis.com/template/pi_jb_request_count: nombre de filtres d'injection de prompt et de jailbreakmodelarmor.googleapis.com/template/rai_request_count: nombre de filtres d'IA responsablemodelarmor.googleapis.com/template/sdp_request_count: nombre de filtres Sensitive Data Protectionmodelarmor.googleapis.com/template/malicious_uri_request_count: nombre de filtres d'URI malveillantesmodelarmor.googleapis.com/template/used_token_count: nombre de jetons utilisés
Pour en savoir plus, consultez la page Types de métriques Model Armor.
Afficher le nombre d'interactions signalées ou bloquées
Dans le tableau de bord de surveillance, affichez le nombre d'interactions, y compris celles qui ont été signalées et bloquées. Le tableau de bord de surveillance affiche les métriques suivantes :
- Nombre total d'interactions : nombre total de prompts et de réponses analysés par Model Armor.
- Interactions signalées : nombre d'interactions qui ne respectaient pas une règle configurée dans votre modèle Model Armor ou vos paramètres de plancher.
- Interactions bloquées : nombre d'interactions bloquées si vous
avez configuré Model Armor en mode
INSPECT_AND_BLOCK. Ces interactions bloquées ne respectaient pas les paramètres de plancher ou les modèles.
Surveiller les cas de non-respect de la sécurité des contenus
Dans le graphique Cas de non-respect au fil du temps, surveillez le nombre de cas de non-respect détectés au fil du temps.
Les cas de non-respect détectés sont classés dans les catégories suivantes :
- Injections de prompts et jailbreaks : cas de non-respect des contenus indiquant la présence de prompts contenant des commandes malveillantes ou des tentatives de jailbreak. Pour en savoir plus, consultez la section Détection de l'injection de prompt et du jailbreak.
- URL malveillante : cas de non-respect des contenus indiquant la présence d'URL malveillantes. Pour en savoir plus, consultez la section Détection des URL malveillantes.
- IA responsable : cas de non-respect des contenus détectés par des filtres de sécurité, tels que le harcèlement et les discours incitant à la haine. Pour obtenir la liste complète des catégories d'IA responsable, consultez Filtre de sécurité d'IA responsable.
- Données sensibles : cas de non-respect des contenus impliquant la présence de types d'informations sensibles ou types d'informations personnalisés que vous définissez. Pour en savoir plus, consultez Protection des données sensibles.
Pour en savoir plus sur ces détecteurs, consultez la section Filtres Model Armor.
Appliquer des filtres aux vues
Lorsque vous appliquez ces filtres dans le tableau de bord de surveillance, toutes les vues du tableau de bord de surveillance sont filtrées en fonction des critères que vous sélectionnez :
- Modèles/Paramètres de plancher : filtrez les vues en fonction du modèle ou des paramètres de plancher associés.
- Points d'intégration : filtrez les vues en fonction des intégrations Model Armor.
- Emplacements : filtrez les vues en fonction de l'emplacement où une interaction a été traitée.
- Types d'entrée : filtrez les vues en fonction du type d'entrée évalué : prompt ou réponse.
Inspecter les journaux associés
Pour explorer les entrées de journal associées aux données du tableau de bord de surveillance, activez la journalisation dans vos modèles ou paramètres de plancher. Vous devez disposer des rôles IAM requis pour afficher les journaux.
Pour inspecter les journaux de la période sélectionnée, dans le tableau de bord de surveillance, cliquez sur Autres options de graphique > Inspecter les journaux associés.
Télécharger les données de cas de non-respect dans un fichier PNG ou CSV
Pour télécharger les données de cas de non-respect dans un fichier PNG ou CSV, procédez comme suit :
- Dans la vue Cas de non-respect au fil du temps du tableau de bord de surveillance, sélectionnez la période pour laquelle vous souhaitez télécharger des données.
- Cliquez sur Autres options de graphique > Télécharger.
- Cliquez sur Télécharger au format PNG ou Télécharger au format CSV pour télécharger les données dans le format de votre choix.
Étape suivante
- Découvrez la journalisation d'audit Model Armor.
- Configurer la journalisation pour Model Armor
- Résoudre les problèmes liés à Model Armor.