O Model Armor se integra aos serviços do Google Cloud para proteger as interações de IA e modelos de linguagem grandes (LLMs). O Model Armor identifica e informa possíveis violações da política e pode bloquear ações com base em avaliações de segurança.
Modalidades compatíveis
Nas integrações do Model Armor com outros serviços Google Cloud , ele verifica e analisa apenas entradas e saídas baseadas em texto de e para LLMs, agentes e servidores Google Cloud MCP. Outras modalidades não são verificadas, exceto documentos na integração do Gemini Enterprise. Para detalhes sobre os tipos de documentos aceitos, consulte Análise de documentos.
Serviços compatíveis
Nesta seção, descrevemos os serviços do Google Cloud que podem ser integrados ao Model Armor.
Gateway de Agente
Integre o Model Armor ao Gateway de Agente para aplicar políticas de segurança ao tráfego de e para todos os agentes governados pelo gateway. Essa integração permite a inspeção inline e o bloqueio de conteúdo malicioso ou não compatível. Essa integração visa melhorar a segurança do fluxo de trabalho e a adesão às diretrizes de segurança da organização, sem precisar modificar o código do aplicativo. Essa proteção se aplica a protocolos compatíveis nos caminhos de entrada (para o agente) e saída (do agente). Para mais informações, consulte Integrar com o Gateway de Agente.
Apigee
Com a integração do Model Armor e da Apigee, é possível usar os recursos de proteção de IA do Model Armor diretamente na camada de gateway de API da Apigee. Você configura políticas específicas do Model Armor nos proxies de API da Apigee. Quando uma chamada de API passa por um proxy da Apigee que tem essas políticas, a Apigee envia os comandos e as respostas ao serviço Model Armor para inspeção. Para mais informações, consulte Integrar com a Apigee.
Gemini Enterprise
O Model Armor pode ser integrado diretamente ao Gemini Enterprise usando modelos. O Gemini Enterprise encaminha as interações entre usuários e agentes e os LLMs subjacentes pelo Model Armor. Isso significa que os comandos dos usuários ou agentes e as respostas geradas pelos LLMs são inspecionados pelo Model Armor antes de serem apresentados ao usuário. Para mais informações, consulte Integrar com o Gemini Enterprise.
Além das modalidades listadas em Modalidades compatíveis, a integração do Model Armor com o Gemini Enterprise também aceita documentos. No entanto, as imagens incorporadas em documentos não são verificadas.
Google e servidores MCP Google Cloud
O Model Armor pode ser configurado para ajudar a proteger seus dados e conteúdo seguro ao enviar solicitações para serviços do Google Cloud que expõem ferramentas e servidores do Protocolo de Contexto de Modelo (MCP). O Model Armor ajuda a proteger seus aplicativos de IA agêntica ao limpar chamadas e respostas de ferramentas do MCP usando configurações mínimas. Esse processo mitiga riscos como injeção de comandos e divulgação de dados sensíveis. Para mais informações, consulte Integrar com servidores do Google e do Google Cloud MCP.
Service Extensions
O Model Armor pode ser integrado aos Google Cloud serviços de rede usando as extensões de serviço. Com o Service Extensions, é possível integrar serviços Google Cloud ou serviços gerenciados pelo usuário para processar o tráfego. É possível configurar uma extensão de serviço nos balanceadores de carga de aplicativos para filtrar o tráfego de rede em várias interações de IA, como com agentes e servidores MCP. Também é possível usar extensões de serviço com gateways de inferência do GKE para filtrar o tráfego de e para um cluster do GKE. Isso ajuda a garantir que todas as interações de IA que passam pelo balanceador de carga sejam protegidas pelo Model Armor. Para mais informações, consulte Integrar com serviços de rede do Google Cloud .
Plataforma de agentes do Gemini Enterprise
O Model Armor pode ser integrado diretamente à Gemini Enterprise Agent Platform usando configurações mínimas ou modelos.
Essa integração examina as solicitações e respostas do modelo do Gemini, bloqueando
aquelas que violam as configurações mínimas. Essa integração oferece proteção de comandos e respostas na API Gemini na Vertex AI para o método generateContent. Ative o Cloud Logging para ter visibilidade dos resultados da sanitização de comandos e respostas. Para mais informações, consulte
Integrar com a plataforma de agentes do Gemini Enterprise.
Antes de começar
Ativar APIs
É necessário ativar a API Model Armor antes de usar o Model Armor.
Console
Ative a API Model Armor.
Funções necessárias para ativar APIs
Para ativar as APIs, é necessário ter o papel do IAM de administrador de uso do serviço (
roles/serviceusage.serviceUsageAdmin), que contém a permissãoserviceusage.services.enable. Saiba como conceder papéis.Selecione o projeto em que você quer ativar o Model Armor.
gcloud
Antes de começar, siga estas etapas usando a Google Cloud CLI com a API Model Armor:
No console do Google Cloud , ative o Cloud Shell.
Na parte de baixo do console Google Cloud , uma sessão do Cloud Shell é iniciada e exibe um prompt de linha de comando. O Cloud Shell é um ambiente shell com a CLI do Google Cloud já instalada e com valores já definidos para o projeto atual. A inicialização da sessão pode levar alguns segundos.
Defina a substituição do endpoint de API usando a CLI gcloud.
Definir a substituição do endpoint de API usando a CLI gcloud
Esta etapa só é necessária se você estiver usando a CLI gcloud para ativar a API Model Armor. É necessário definir manualmente a substituição do endpoint de API para garantir que a CLI gcloud roteie corretamente as solicitações para o serviço Model Armor.
Execute o comando a seguir para definir o endpoint de API do serviço Model Armor.
gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"
Substitua LOCATION pela região em que você quer usar o
Model Armor.
Gerenciar cota
O Model Armor usa um sistema de cotas para garantir o uso justo e proteger a estabilidade do sistema. A cota padrão da API Model Armor é de 1.200 QPM por projeto. É possível aplicar um valor de 0 a 1.200 QPM por projeto. Para solicitar um ajuste, consulte Solicitar um ajuste de cota. Se você precisar de mais do que a cota padrão, entre em contato com o Cloud Customer Care.
A cota do Model Armor exige considerações importantes ao integrar com outros serviços. A cota principal com que você interage é o número de solicitações de API por minuto em cada projeto.
Considere os seguintes tipos de cota ao integrar o Model Armor com outros serviços.
- Cota padrão do Model Armor:quando um serviço faz uma chamada para a API Model Armor para análise (por exemplo, verificação de comandos ou respostas), isso consome a cota da API Model Armor do seu projeto.
- Cota de serviços de integração:a cota do Model Armor é separada de todas as cotas associadas aos serviços de integração. Verifique se há cota suficiente para todos os serviços no caminho da solicitação. Qualquer chamada feita para a API Model Armor para higienizar conteúdo do seu aplicativo conta para os limites de cota da API Model Armor.
Descobrir situações de cota excedida
Você atinge os limites de cota do Model Armor se os registros do aplicativo mostrarem erros do Model Armor, geralmente erros HTTP 429 RESOURCE_EXHAUSTED, que indicam um número excessivo de solicitações.
Estimar as necessidades de cota
Para determinar a quantidade de cota do Model Armor a ser solicitada:
- Estime o número máximo de solicitações por minuto que seus serviços vão enviar ao Model Armor.
- Considere quantas vezes o Model Armor é chamado por interação do usuário com seu serviço (por exemplo, uma vez para o comando e uma vez para a resposta).
- Considere o número máximo de usuários ou sessões simultâneas.
- Solicite uma cota com um buffer razoável (por exemplo, 20 a 30% acima do pico esperado) para lidar com picos inesperados.
- Comece com sua melhor estimativa, monitore o uso de perto após o lançamento e solicite mais ajustes conforme necessário.
Por exemplo, se você espera 500 usuários por minuto e cada interação do usuário chama o Model Armor duas vezes (comando e resposta), você precisa de pelo menos 1.000 QPM. Considerando um buffer, solicitar de 1.200 a 1.300 QPM é um bom ponto de partida.
Considerações
Ao fazer a integração com outros serviços, considere o seguinte:
- Monitore e gerencie as cotas de outros serviços. A falta de cota para outros serviços afeta seu aplicativo, mesmo que você tenha cota suficiente do Model Armor.
- Implemente novas tentativas do lado do cliente com espera exponencial na configuração do aplicativo para lidar com problemas de cota temporários ou outros erros que podem ser repetidos. Para mais informações, consulte Estratégia de novas tentativas.
Tipos de restrição
Ao integrar o Model Armor com outros serviços, um aspecto crucial a ser configurado é o tipo de aplicação. Essa configuração determina como o Model Armor age ao detectar uma possível violação da política nos dados inspecionados, como prompts ou respostas de LLMs. O tipo de aplicação determina se o Model Armor apenas informa violações ou intervém ativamente. Para mais informações, consulte Definir o tipo de restrição.
Integrar usando a API REST
Ao usar a API REST para integração, o Model Armor funciona apenas como um detector usando modelos. Ele identifica e informa possíveis violações de política com base em modelos predefinidos, em vez de impedir ativamente que elas aconteçam. Ao fazer a integração com a API Model Armor, seu aplicativo pode usar a saída do Model Armor para bloquear ou permitir ações com base nos resultados da avaliação de segurança fornecidos. A API Model Armor retorna informações sobre possíveis ameaças ou violações de política relacionadas ao tráfego da API, especialmente no caso de interações de IA. Seu aplicativo pode chamar a API Model Armor e usar as informações recebidas na resposta para tomar uma decisão e agir com base na sua lógica personalizada predefinida.
Opções ao integrar o Model Armor
O Model Armor oferece as seguintes opções de integração. Cada opção oferece recursos e capacidades diferentes.
| Opção de integração | Configurar detecções | Somente inspecionar | Inspecionar e bloquear | Cobertura |
|---|---|---|---|---|
| Gateway de Agente (prévia) | Usar apenas modelos | Sim | Sim | Todos os modelos e todas as nuvens |
| Apigee | Usar apenas modelos | Sim | Sim | Todos os modelos e todas as nuvens2 |
| Gemini Enterprise | Usar apenas modelos | Sim | Sim | Todos os modelos e todas as nuvens2 |
| Google e servidores Google Cloud MCP | Usando apenas configurações mínimas | Sim | Sim | Google e servidores MCP Google Cloud |
| Extensões de serviço | Usar apenas modelos | Sim | Sim | Modelos de formato da OpenAI1, agentes e servidores MCP em todas as nuvens2 |
| Gemini Enterprise Agent Platform | Usando configurações mínimas e modelos | Sim | Sim | Modelos do Gemini (não streaming) |
1Vários modelos conhecidos, incluindo Anthropic Claude, Mistral AI e Grok, são compatíveis com as especificações da OpenAI. Esses modelos geralmente são implantados usando mecanismos de inferência como o vLLM, que fornece a camada de API compatível com o OpenAI necessária. O vLLM oferece suporte a uma ampla variedade de modelos, incluindo as séries Meta Llama, DeepSeek, Mistral e Mixtral, além do Gemma.
2Inclui outras nuvens públicas, como AWS e Azure.
Com a opção de integração da Gemini Enterprise Agent Platform, o Model Armor oferece aplicação inline usando configurações mínimas ou modelos. Isso significa que o Model Armor aplica ativamente as políticas intervindo diretamente no processo sem exigir modificações no código do aplicativo.
As extensões de serviço e as integrações do Gemini Enterprise usam modelos apenas para aplicação de políticas inline. Isso significa que o Model Armor pode aplicar políticas diretamente sem exigir que você modifique o código do aplicativo nas Service Extensions e durante as interações do usuário ou do agente nas instâncias do Gemini Enterprise.
A integração do Model Armor e do Gemini Enterprise higieniza apenas o comando inicial do usuário e a resposta final do agente ou modelo. As etapas intermediárias que ocorrem entre o comando inicial do usuário e a geração de respostas final não são cobertas por essa integração.
Model Armor no Security Command Center
O Model Armor inspeciona comandos e respostas de LLMs em busca de várias ameaças, incluindo injeção de comandos, tentativas de jailbreak, URLs maliciosos e conteúdo nocivo. Quando o Model Armor detecta uma violação de uma configuração de restrição configurada, ele bloqueia o comando ou a resposta e envia uma descoberta para o Security Command Center. Para mais informações, consulte Descobertas do Model Armor.