Model Armor es un Google Cloud servicio diseñado para mejorar la seguridad de tus aplicaciones de IA, en especial las que usan modelos de lenguaje grandes (LLMs). Funciona inspeccionando las instrucciones enviadas a tus modelos y las respuestas que generan, lo que te ayuda a mitigar los riesgos y aplicar prácticas de IA responsable.
Configura plantillas
Define cómo Model Armor debe filtrar el contenido creando y usando plantillas de Model Armor. Una plantilla es un conjunto de parámetros de configuración reutilizables en el que especificas qué filtros habilitar, los niveles de confianza para los filtros y el tipo de aplicación para cada filtro. Para obtener más información, consulta Crea y administra plantillas.
Configuración de límites
Para garantizar un nivel de protección básico, los administradores de seguridad pueden configurar parámetros mínimos a nivel de la organización, la carpeta o el proyecto. Estos parámetros de configuración exigen requisitos mínimos de filtro que deben cumplir todas las plantillas de Model Armor creadas dentro de ese alcance, lo que ayuda a evitar configuraciones demasiado permisivas. Para obtener más información, consulta Cómo configurar los ajustes de piso.
Limpiar instrucciones y respuestas
Cuando un usuario envía una instrucción a tu aplicación, esta primero la envía a Model Armor. Model Armor procesa la instrucción a través de los filtros habilitados en la plantilla y devuelve una respuesta que indica si se encontraron incumplimientos de políticas y los resultados detallados de cada filtro. Luego, la lógica de tu aplicación decide qué hacer a continuación.
Cuando un LLM genera una respuesta, antes de mostrarla al usuario, tu aplicación la envía a Model Armor. Model Armor analiza el resultado del LLM con la configuración de filtros definida en la plantilla y devuelve los resultados del análisis. Luego, tu aplicación decide si mostrarle la respuesta al usuario, y puede bloquearla si se detectan incumplimientos.
Para obtener más información, consulta Cómo limpiar las instrucciones y las respuestas.