Supervisa la seguridad del contenido

En este documento, se describe cómo ver estadísticas de seguridad del contenido de Model Armor para los agentes de IA compatibles.

Model Armor analiza las solicitudes y respuestas en busca de riesgos de seguridad, como ataques de inyección de instrucciones indirectos, filtración de datos sensibles y la generación o publicación de contenido dañino. Para obtener más información, consulta Model Armor.

Puedes ver los resultados de las operaciones de Model Armor en los siguientes niveles:

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud . Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. Enable the Model Armor API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  3. Enable the Model Armor API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. Configura Model Armor en una o más puertas de enlace de tu proyecto.
  5. Para supervisar los agentes que se comunican con un servidor de MCP Google Cloud , configura Model Armor con servidores de MCP.
  6. Configura el seguimiento para tu agente.

Función requerida

Para obtener los permisos que necesitas para supervisar los incumplimientos de la seguridad del contenido, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Estos roles predefinidos contienen los permisos necesarios para supervisar los incumplimientos de la seguridad del contenido. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para supervisar los incumplimientos de la seguridad del contenido:

  • monitoring.monitoredResourceDescriptors.list
  • monitoring.metricDescriptors.list

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Agentes admitidos

La pestaña Seguridad se completa con estadísticas de Model Armor solo para los siguientes agentes:

Consulta las estadísticas de contenido de los agentes de IA admitidos en un proyecto (vista de nivel superior)

Para ver las estadísticas de seguridad del contenido de todos los agentes de IA admitidos en un proyecto, sigue estos pasos:

  1. En la consola de Google Cloud , ve a la pestaña Seguridad de Gemini Enterprise Agent Platform.

    Ir a Seguridad

  2. Elige tu proyecto.

Si no ves estadísticas de seguridad del contenido en la pestaña Seguridad y tienes agentes de IA compatibles en tu proyecto, asegúrate de haber configurado el seguimiento de tus agentes.

Consulta las estadísticas de contenido de un agente de IA (vista a nivel del agente)

Para ver las estadísticas de seguridad del contenido de los agentes compatibles, sigue estos pasos:

  1. En la consola de Google Cloud , ve a Agent Registry.

    Ir a Agent Registry

  2. Elige tu proyecto.
  3. Haz clic en el nombre del agente.
  4. Haz clic en la pestaña Seguridad.

Consulta la cantidad de interacciones marcadas o bloqueadas

Ve a la pestaña Seguridad de nivel superior o de agente.

En la pestaña Seguridad, consulta la cantidad de interacciones, incluidas las interacciones marcadas y bloqueadas. En la pestaña Seguridad, se muestran las siguientes métricas:

  • Interacciones totales: Es la cantidad total de instrucciones y respuestas que analiza Model Armor.
  • Interacciones marcadas: Es la cantidad de interacciones que incumplieron una política configurada en la plantilla o la configuración mínima de Model Armor.
  • Interacciones bloqueadas: Es la cantidad de interacciones bloqueadas si configuraste Model Armor en el modo INSPECT_AND_BLOCK. Estas interacciones bloqueadas incumplieron la configuración mínima o las plantillas.

Supervisa los incumplimientos de la seguridad del contenido

Ve a la pestaña Seguridad de nivel superior o de agente.

En el gráfico Incumplimientos a lo largo del tiempo, supervisa la cantidad de incumplimientos detectados a lo largo del tiempo.

Los incumplimientos detectados se clasifican en las siguientes áreas:

  • Inyección de instrucciones y jailbreak: Infracciones de contenido que indican la presencia de instrucciones que contienen comandos maliciosos o intentos de jailbreak. Para obtener más información, consulta Detección de inyección de instrucciones y jailbreak.
  • URL maliciosa: Incumplimientos de contenido que indican la presencia de URLs maliciosas. Para obtener más información, consulta Detección de URLs maliciosas.
  • IA responsable: Infracciones de contenido que detectan los filtros de seguridad, como hostigamiento e incitación al odio o a la violencia Para obtener una lista completa de las categorías de IA responsable, consulta el filtro de seguridad de IA responsable.
  • Datos sensibles: Infracciones de contenido que implican la presencia de tipos de información sensible o tipos de información personalizados que definas. Para obtener más información, consulta Protección de datos sensibles.

Para obtener más información sobre estos detectores, consulta Filtros de Model Armor.

Identifica los agentes con la mayor cantidad de incumplimientos

Ve a la pestaña Seguridad de nivel superior.

En la pestaña Seguridad, se muestran los 10 agentes con más incumplimientos. En la lista, se muestra el ID de cada agente y la cantidad de incumplimientos detectados para ese agente.

Para ver las estadísticas de Model Armor de un agente específico en la lista, ve al Registro de agentes y busca el agente por su ID. Luego, ve a la pestaña Seguridad a nivel del agente para ese agente.

Ir a Agent Registry

Consulta y analiza datos de telemetría con SQL

Para consultar y analizar los datos de telemetría de Model Armor, usa Observability Analytics, que proporciona una interfaz de consultas basada en SQL.

  1. Ve a la pestaña Seguridad de nivel superior.
  2. En la vista sobre la que deseas realizar la consulta, haz clic en Más opciones de gráficos > Explorar en Observability Analytics.

Si deseas obtener instrucciones generales para usar Análisis de observabilidad, consulta Cómo consultar y analizar datos de telemetría con Análisis de observabilidad.

Descarga los datos de los incumplimientos en un archivo PNG o CSV

Para descargar los datos de los incumplimientos en un archivo PNG o CSV, sigue estos pasos:

  1. En la vista Violaciones a lo largo del tiempo de la pestaña Seguridad, selecciona el período para el que deseas descargar los datos.
  2. Haz clic en Más opciones de gráficos > Descargar.
  3. Haz clic en Descargar PNG o Descargar CSV para descargar los datos en el formato que prefieras.

¿Qué sigue?

Guía

Obtén más información sobre el registro de auditoría de Model Armor.

Guía

Aprende a configurar el registro de Model Armor.

Solución de problemas

Obtén más información para solucionar problemas con Model Armor.