Model Armor examina las instrucciones y las respuestas de tus aplicaciones de IA. El panel de supervisión te proporciona los datos, las métricas y las visualizaciones generadas a partir de este proceso de examen. Usa estas estadísticas para comprender cómo Model Armor protege tus aplicaciones de IA y cómo identifica los intentos de inyección de instrucciones o cualquier otra actividad maliciosa.
Antes de comenzar
Función requerida
Para obtener los permisos que
necesitas para acceder al panel de supervisión,
pídele a tu administrador que te otorgue el
rol de IAM de Visualizador de Monitoring (roles/monitoring.viewer) en el proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene los permisos necesarios para acceder al panel de supervisión. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para acceder al panel de supervisión:
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
También puedes obtener estos permisos con roles personalizados o otros roles predefinidos.
Visualiza el panel de supervisión
En la Google Cloud consola de, accede a la página de Model Armor.
Verifica que estés viendo el proyecto en el que activaste Model Armor.
Ve a la pestaña Monitoring.
Supervisa el uso y el rendimiento de Model Armor
Para supervisar el uso y el rendimiento de Model Armor en detalle, puedes usar los tipos de métricas específicos disponibles en Cloud Monitoring. Estos son los tipos de métricas que se encuentran disponibles:
modelarmor.googleapis.com/template/request_count: Recuento de solicitudes de SanitizeAPImodelarmor.googleapis.com/template/pi_jb_request_count: Recuento de filtros de inyección de instrucciones y jailbreakmodelarmor.googleapis.com/template/rai_request_count: Recuento de filtros de IA responsablemodelarmor.googleapis.com/template/sdp_request_count: Recuento de filtros de Sensitive Data Protectionmodelarmor.googleapis.com/template/malicious_uri_request_count: Recuento de filtros de URI maliciososmodelarmor.googleapis.com/template/used_token_count: Recuento de tokens usados
Para obtener más información, consulta Tipos de métricas de Model Armor.
Visualiza la cantidad de interacciones marcadas o bloqueadas
En el panel de supervisión, visualiza la cantidad de interacciones, incluidas las interacciones marcadas y bloqueadas. En el panel de supervisión, se muestran las siguientes métricas:
- Interacciones totales: Es la cantidad total de instrucciones y respuestas que analiza Model Armor.
- Interacciones marcadas: Es la cantidad de interacciones que incumplieron una política configurada en la plantilla o la configuración mínima de Model Armor.
- Interacciones bloqueadas: Es la cantidad de interacciones bloqueadas si
configuraste Model Armor en el
INSPECT_AND_BLOCKmodo. Estas interacciones bloqueadas incumplieron la configuración mínima o las plantillas.
Supervisa los incumplimientos de seguridad del contenido
En el gráfico Incumplimientos a lo largo del tiempo, supervisa la cantidad de incumplimientos detectados a lo largo del tiempo.
Los incumplimientos detectados se clasifican en las siguientes áreas:
- Inyecciones de instrucciones y jailbreaks: Incumplimientos de contenido que indican la presencia de instrucciones que contienen comandos maliciosos o intentos de jailbreak. Para obtener más información, consulta Detección de inyección de instrucciones y jailbreak.
- URL maliciosa: Incumplimientos de contenido que indican la presencia de URLs maliciosas. Para obtener más información, consulta Detección de URLs maliciosas.
- IA responsable: Incumplimientos de contenido que detectan los filtros de seguridad, como el acoso y la incitación al odio o a la violencia. Para obtener una lista completa de las categorías de IA responsable, consulta Filtro de seguridad de IA responsable.
- Datos sensibles: Incumplimientos de contenido que implican la presencia de tipos de información sensible o tipos de información personalizados que definas. Para obtener más información, consulta Sensitive Data Protection.
Para obtener más información sobre estos detectores, consulta Filtros de Model Armor.
Aplica filtros a las vistas
Cuando aplicas estos filtros en el panel de supervisión, todas las vistas del panel se filtran según los criterios que selecciones:
- Plantillas o configuración mínima: Filtra las vistas según la plantilla o la configuración mínima asociadas.
- Puntos de integración: Filtra las vistas según las integraciones de Model Armor.
- Ubicaciones: Filtra las vistas según la ubicación en la que se procesó una interacción.
- Tipos de entrada: Filtra las vistas según el tipo de entrada evaluada: instrucción o respuesta.
Inspecciona registros relacionados
Para explorar las entradas de registro relacionadas con los datos del panel de supervisión, habilita el registro en tus plantillas o configuración mínima. Debes tener los roles de IAM necesarios para ver los registros.
Para inspeccionar los registros del período seleccionado, en el panel de supervisión, haz clic en Más opciones del gráfico > Inspeccionar registros relacionados.
Descarga los datos de incumplimientos en un archivo PNG o CSV
Para descargar los datos de incumplimientos en un archivo PNG o CSV, sigue estos pasos:
- En la vista Incumplimientos a lo largo del tiempo del panel de supervisión, selecciona el período para el que deseas descargar datos.
- Haz clic en Más opciones del gráfico > Descargar.
- Haz clic en Descargar PNG o Descargar CSV para descargar los datos en el formato que prefieras.
¿Qué sigue?
- Obtén información sobre el registro de auditoría de Model Armor.
- Configura el registro de Model Armor
- Soluciona problemas de Model Armor.