Protege las aplicaciones de IA con Model Armor

Model Armor es un Google Cloud servicio diseñado para mejorar la seguridad de tus aplicaciones de IA, especialmente las que usan modelos de lenguaje extensos (LLMs). Para ello, inspecciona las peticiones enviadas a tus modelos y las respuestas que generan, lo que te ayuda a mitigar los riesgos y a aplicar prácticas responsables de IA.

Configurar plantillas

Define cómo debe filtrar el contenido Model Armor creando y usando plantillas de Model Armor. Una plantilla es un conjunto de configuraciones reutilizable en el que se especifica qué filtros se deben habilitar, los niveles de confianza de los filtros y el tipo de aplicación de cada filtro. Para obtener más información, consulta el artículo Crear y gestionar plantillas.

Configurar los ajustes de límite mínimo

Para asegurar un nivel de protección básico, los administradores de seguridad pueden configurar ajustes mínimos a nivel de organización, carpeta o proyecto. Estos ajustes exigen requisitos mínimos de filtro que deben cumplir todas las plantillas de Model Armor creadas en ese ámbito, lo que ayuda a evitar configuraciones demasiado permisivas. Para obtener más información, consulta Configurar los ajustes de la planta.

Desinfectar peticiones y respuestas

Cuando un usuario envía una petición a tu aplicación, esta envía primero la petición a Model Armor. Model Armor procesa la petición a través de los filtros habilitados en la plantilla y devuelve una respuesta que indica si se ha detectado alguna infracción de las políticas y los resultados detallados de cada filtro. A continuación, la lógica de tu aplicación decide qué hacer.

Cuando un LLM genera una respuesta, antes de mostrarla al usuario, tu aplicación la envía a Model Armor. Model Armor analiza la salida del LLM mediante las configuraciones de filtro definidas en la plantilla y devuelve los resultados del análisis. A continuación, tu aplicación decide si muestra la respuesta al usuario, y puede bloquearla si se detectan infracciones.

Para obtener más información, consulta Limpiar peticiones y respuestas.

Siguientes pasos