Model Armor filtra las instrucciones y las respuestas de tus aplicaciones de IA. El panel de supervisión te proporciona los datos, las métricas y las visualizaciones que se generan a partir de este proceso de detección. Usa estas estadísticas para comprender cómo Model Armor protege tus aplicaciones de IA y cómo identifica los intentos de inyección de instrucciones o cualquier otra actividad maliciosa.
Antes de comenzar
Función requerida
Para obtener los permisos que
necesitas para acceder al panel de supervisión,
pídele a tu administrador que te otorgue el
rol de IAM de Visualizador de Monitoring (roles/monitoring.viewer) en el proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene los permisos necesarios para acceder al panel de supervisión. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para acceder al panel de supervisión:
-
monitoring.monitoredResourceDescriptors.list -
monitoring.metricDescriptors.list
También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.
Visualiza el panel de supervisión
En la consola de Google Cloud , accede a la página de Model Armor.
Verifica que estés viendo el proyecto en el que activaste Model Armor.
Ve a la pestaña Monitoring.
Supervisa el uso y el rendimiento de Model Armor
Para supervisar el uso y el rendimiento de Model Armor en detalle, puedes usar los tipos de métricas específicos disponibles en Cloud Monitoring. Están disponibles los siguientes tipos de métricas:
modelarmor.googleapis.com/template/request_count: Recuento de solicitudes de SanitizeAPImodelarmor.googleapis.com/template/pi_jb_request_count: Recuento de filtros de inyección de instrucciones y jailbreakmodelarmor.googleapis.com/template/rai_request_count: Recuento de filtros de IA responsablemodelarmor.googleapis.com/template/sdp_request_count: Recuento de filtros de Sensitive Data Protectionmodelarmor.googleapis.com/template/malicious_uri_request_count: Recuento de filtros de URI maliciososmodelarmor.googleapis.com/template/used_token_count: Recuento de tokens usados
Para obtener más información, consulta Tipos de métricas de Model Armor.
Consulta la cantidad de interacciones marcadas o bloqueadas
En el panel de supervisión, consulta la cantidad de interacciones, incluidas las interacciones marcadas y bloqueadas. En el panel de supervisión, se muestran las siguientes métricas:
- Interacciones totales: Es la cantidad total de instrucciones y respuestas que analiza Model Armor.
- Interacciones marcadas: Es la cantidad de interacciones que incumplieron una política configurada en la plantilla o la configuración mínima de Model Armor.
- Interacciones bloqueadas: Es la cantidad de interacciones bloqueadas si configuraste Model Armor en el modo
INSPECT_AND_BLOCK. Estas interacciones bloqueadas incumplieron la configuración mínima o las plantillas.
Supervisa los incumplimientos de la seguridad del contenido
En el gráfico Incumplimientos a lo largo del tiempo, supervisa la cantidad de incumplimientos detectados a lo largo del tiempo.
Los incumplimientos detectados se clasifican en las siguientes áreas:
- Todos los detectores: Es la cantidad total de incumplimientos detectados por todos los detectores, incluidos los de inyección de instrucciones y jailbreak, URLs maliciosas, IA responsable y datos sensibles.
- IA responsable: Infracciones de contenido detectadas por los filtros de seguridad, como hostigamiento e incitación al odio o a la violencia. Para obtener una lista completa de las categorías de IA responsable, consulta el filtro de seguridad de IA responsable.
- Datos sensibles: Incumplimientos de contenido que involucran la presencia de tipos de información sensible o tipos de información personalizados que definas. Para obtener más información, consulta Sensitive Data Protection.
Para obtener más información sobre estos detectores, consulta Filtros de Model Armor.
Cómo aplicar filtros a las vistas
Cuando aplicas estos filtros en el panel de supervisión, todas las vistas del panel se filtran según los criterios que selecciones.
- Plantillas/Configuración mínima: Filtra las vistas según la plantilla o la configuración mínima asociadas.
- Puntos de integración: Filtra las vistas según las integraciones de Model Armor.
- Ubicaciones: Filtra las vistas según el lugar donde se procesó una interacción.
- Tipos de entrada: Filtra las vistas según el tipo de entrada evaluada: instrucción o respuesta.
Inspeccionar registros relacionados
Para explorar las entradas de registro relacionadas con los datos del panel de supervisión, habilita el registro en tus plantillas y la configuración mínima. Debes tener los roles de IAM necesarios para ver los registros.
Para inspeccionar los registros del período seleccionado, en el panel de supervisión, haz clic en Más opciones del gráfico > Inspeccionar registros relacionados.
Descarga los datos de los incumplimientos en un archivo PNG o CSV
Para descargar los datos de los incumplimientos en un archivo PNG o CSV, sigue estos pasos:
- En la vista Violaciones a lo largo del tiempo del panel de supervisión, selecciona el período para el que deseas descargar los datos.
- Haz clic en Más opciones de gráficos > Descargar.
- Haz clic en Descargar PNG o Descargar CSV para descargar los datos en el formato que prefieras.
¿Qué sigue?
- Obtén más información sobre el registro de auditoría de Model Armor.
- Configura el registro de Model Armor
- Soluciona problemas de Model Armor.