Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Aperçu

Model Armor s'intègre aux services Google Cloud pour sécuriser les interactions avec l'IA et les grands modèles de langage (LLM). Model Armor identifie et signale les cas potentiels de non-respect des règles, et peut bloquer activement les actions en fonction des évaluations de sécurité.

Modalités acceptées

Dans les intégrations Model Armor avec d'autres services Google Cloud , Model Armor n'analyse que les entrées et sorties textuelles vers et depuis les LLM, les agents et les serveurs MCP Google Cloud . Les autres modalités ne sont pas analysées, à l'exception des documents dans l'intégration Gemini Enterprise. Pour en savoir plus sur les types de documents acceptés, consultez Examen des documents.

Services compatibles

Cette section décrit les services Google Cloud que vous pouvez intégrer à Model Armor.

Passerelle d'agent

Intégrez Model Armor à Agent Gateway pour appliquer des règles de sécurité au trafic entrant et sortant de tous les agents régis par la passerelle. Cette intégration permet d'inspecter et de bloquer le contenu malveillant ou non conforme de manière intégrée. Cette intégration vise à améliorer la sécurité des workflows et le respect des consignes de sécurité de l'organisation, sans nécessiter de modifications du code de l'application. Cette protection s'applique aux protocoles compatibles sur les chemins d'entrée (vers l'agent) et de sortie (depuis l'agent). Pour en savoir plus, consultez Intégrer à la passerelle d'agent.

Apigee

L'intégration vous permet d'utiliser les fonctionnalités de protection par IA de Model Armor directement dans la couche de passerelle d'API Apigee. Vous configurez des règles Model Armor spécifiques dans vos proxys d'API Apigee. Lorsqu'un appel d'API passe par un proxy Apigee doté de ces règles, Apigee envoie les requêtes et les réponses au service Model Armor pour inspection. Pour en savoir plus, consultez Intégrer à Apigee.

Gemini Enterprise

Model Armor peut être directement intégré à Gemini Enterprise à l'aide de modèles. Gemini Enterprise achemine les interactions entre les utilisateurs et les agents, ainsi que les LLM sous-jacents, via Model Armor. Cela signifie que les requêtes des utilisateurs ou des agents et les réponses générées par les LLM sont inspectées par Model Armor avant d'être présentées à l'utilisateur. Pour en savoir plus, consultez Intégrer à Gemini Enterprise.

En plus des modalités listées dans Modalités acceptées, l'intégration de Model Armor à Gemini Enterprise est également compatible avec les documents. Toutefois, les images intégrées dans les documents ne sont pas filtrées.

Google et les serveurs MCP Google Cloud

Vous pouvez configurer Model Armor pour protéger vos données et sécuriser le contenu lorsque vous envoyez des requêtes aux services Google Cloud qui exposent des outils et des serveurs MCP (Model Context Protocol). Model Armor vous aide à sécuriser vos applications d'IA agentiques en assainissant les appels et les réponses des outils MCP à l'aide des paramètres de plancher. Ce processus permet d'atténuer les risques tels que l'injection de requêtes et la divulgation de données sensibles. Pour en savoir plus, consultez Intégrer aux serveurs Google et Google Cloud MCP.

Service Extensions

Model Armor peut être intégré aux services réseau Google Cloud via les extensions de service. Les extensions de service vous permettent d'intégrer des services internes (Google Cloud ) ou externes (gérés par l'utilisateur) pour traiter le trafic. Vous pouvez configurer une extension de service sur les équilibreurs de charge d'application pour filtrer le trafic réseau pour diverses interactions d'IA, par exemple avec des agents et des serveurs MCP. Vous pouvez également utiliser des extensions de service avec les passerelles d'inférence GKE pour filtrer le trafic vers et depuis un cluster GKE. Cela permet de s'assurer que toutes les interactions avec l'IA qui transitent par l'équilibreur de charge sont protégées par Model Armor. Pour en savoir plus, consultez Intégrer aux services de mise en réseau Google Cloud .

Gemini Enterprise Agent Platform

Model Armor peut être directement intégré à Gemini Enterprise Agent Platform à l'aide des paramètres de base ou des modèles. Cette intégration analyse les requêtes et les réponses du modèle Gemini, et bloque celles qui ne respectent pas les paramètres de plancher. Cette intégration assure la protection des requêtes et des réponses dans l'API Gemini de Vertex AI pour la méthode generateContent. Vous devez activer Cloud Logging pour obtenir de la visibilité sur les résultats de la désinfection des requêtes et des réponses. Pour en savoir plus, consultez Intégrer à Gemini Enterprise Agent Platform.

Avant de commencer

Activer les API

Vous devez activer l'API Model Armor avant de pouvoir utiliser Model Armor.

Console

Activez l'API Model Armor.
Rôles requis pour activer les API
Pour activer les API, vous avez besoin du rôle IAM Administrateur Service Usage (roles/serviceusage.serviceUsageAdmin), qui contient l'autorisation serviceusage.services.enable. Découvrez comment attribuer des rôles.
Activer l'API
Sélectionnez le projet dans lequel vous souhaitez activer Model Armor.

gcloud

Avant de commencer, suivez ces étapes à l'aide de la Google Cloud CLI avec l'API Model Armor :

Dans la console Google Cloud , activez Cloud Shell.

Activer Cloud Shell

En bas de la console Google Cloud , une session Cloud Shell démarre et affiche une invite de ligne de commande. Cloud Shell est un environnement de shell dans lequel Google Cloud CLI est déjà installé, et dans lequel des valeurs sont déjà définies pour votre projet actuel. L'initialisation de la session peut prendre quelques secondes.
Définissez le remplacement du point de terminaison de l'API à l'aide de la gcloud CLI.

Définir le remplacement du point de terminaison de l'API à l'aide de la gcloud CLI

Cette étape n'est nécessaire que si vous utilisez la gcloud CLI pour activer l'API Model Armor. Vous devez définir manuellement le remplacement du point de terminaison de l'API pour vous assurer que gcloud CLI achemine correctement les requêtes vers le service Model Armor.

Exécutez la commande suivante pour définir le point de terminaison de l'API pour le service Model Armor.

gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

Remplacez LOCATION par la région dans laquelle vous souhaitez utiliser Model Armor.

Gérer le quota

Model Armor utilise un système de quotas pour garantir une utilisation équitable et protéger la stabilité du système. Le quota par défaut pour l'API Model Armor est de 1 200 RPM par projet. Vous pouvez appliquer une valeur comprise entre 0 et 1 200 requêtes par minute et par projet. Pour demander un ajustement, consultez Demander un ajustement de quota. Si vous avez besoin d'un quota supérieur à celui par défaut, contactez Cloud Customer Care.

Le quota Model Armor nécessite des considérations importantes lors de l'intégration à d'autres services. Le quota principal avec lequel vous interagissez est le nombre de requêtes API par minute et par projet.

Quota par défaut de Model Armor : lorsqu'un service appelle l'API Model Armor pour l'analyse (par exemple, pour vérifier les requêtes ou les réponses), cela consomme le quota de l'API Model Armor de votre projet.
Quota des services d'intégration : le quota de Model Armor est distinct de tous les quotas associés aux services d'intégration. Vous devez vous assurer qu'il existe un quota suffisant pour tous les services de votre chemin de requête. Tout appel effectué à l'API Model Armor pour assainir le contenu de votre application est comptabilisé dans les limites de quota de l'API Model Armor.

Détecter les situations de dépassement de quota

Vous avez atteint les limites de quota Model Armor si les journaux de votre application affichent des erreurs de Model Armor, généralement des erreurs HTTP 429 RESOURCE_EXHAUSTED, qui indiquent un nombre de requêtes trop élevé.

Estimer les besoins en quota

Pour déterminer le quota Model Armor à demander :

Estimez le nombre maximal de requêtes par minute que vos services enverront à Model Armor.
Déterminez le nombre de fois où Model Armor est appelé par interaction utilisateur avec votre service (par exemple, une fois pour la requête et une fois pour la réponse).
Tenez compte du nombre maximal d'utilisateurs ou de sessions simultanés.
Demandez un quota avec une marge raisonnable (par exemple, 20 à 30% au-dessus de votre pic attendu) pour gérer les pics inattendus.
Commencez par faire votre meilleure estimation, surveillez attentivement l'utilisation après le lancement et demandez d'autres ajustements si nécessaire.

Par exemple, si vous prévoyez 500 utilisateurs par minute et que chaque interaction utilisateur appelle Model Armor deux fois (prompt et réponse), vous avez besoin d'au moins 1 000 QPM. En tenant compte d'une marge, une bonne base de départ consiste à demander 1 200 à 1 300 QPM.

Remarques

Assurez-vous de surveiller et de gérer les quotas pour les autres services. Si vous manquez de quota pour d'autres services, cela aura un impact sur votre application, même si vous disposez d'un quota Model Armor suffisant.
Implémentez des nouvelles tentatives côté client avec un intervalle exponentiel entre les tentatives dans la configuration de votre application pour gérer les problèmes de quota temporaires ou d'autres erreurs pouvant être corrigées par une nouvelle tentative. Pour en savoir plus, consultez Stratégie de nouvelle tentative.

Intégrer à l'aide de l'API REST

Lorsque vous utilisez l'API REST pour l'intégration, Model Armor ne fonctionne que comme détecteur à l'aide de modèles. Il identifie et signale les cas potentiels de non-respect des règles en fonction de modèles prédéfinis, plutôt que de les empêcher activement. Lorsque vous intégrez l'API Model Armor, votre application peut utiliser la sortie de Model Armor pour bloquer ou autoriser des actions en fonction des résultats de l'évaluation de sécurité fournis. L'API Model Armor renvoie des informations sur les menaces potentielles ou les cas de non-respect des règles liés au trafic de votre API, en particulier dans le cas des interactions avec l'IA. Votre application peut appeler l'API Model Armor et utiliser les informations reçues dans la réponse pour prendre une décision et agir en fonction de votre logique personnalisée prédéfinie.

Options d'intégration de Model Armor

Model Armor propose les options d'intégration suivantes. Chaque option offre des fonctionnalités différentes.

Option d'intégration	Configurer les détections	Inspecter uniquement	Inspecter et bloquer	Couverture
Agent Gateway (version bêta)	Utiliser uniquement des modèles	Oui	Oui	Tous les modèles et tous les clouds
Apigee	Utiliser uniquement des modèles	Oui	Oui	Tous les modèles et tous les clouds²
Gemini Enterprise	Utiliser uniquement des modèles	Oui	Oui	Tous les modèles et tous les clouds²
Google et les Google Cloud serveurs MCP	Utiliser uniquement les paramètres de plancher	Oui	Oui	Google et les serveurs MCP Google Cloud
Extensions de service	Utiliser uniquement des modèles	Oui	Oui	Modèles au format OpenAI¹, agents et serveurs MCP sur tous les clouds²
Gemini Enterprise Agent Platform	Utiliser les paramètres de plancher et les modèles	Oui	Oui	Modèles Gemini (non en streaming)

¹ Plusieurs modèles populaires, dont Anthropic Claude, Mistral AI et Grok, sont compatibles avec les spécifications OpenAI. Ces modèles sont généralement déployés à l'aide de moteurs d'inférence tels que vLLM, qui fournissent la couche d'API compatible avec OpenAI nécessaire. vLLM est compatible avec un large éventail de modèles, y compris les familles Meta Llama, DeepSeek, Mistral et Mixtral, ainsi que Gemma.

² Inclut d'autres clouds publics tels qu'AWS et Azure.

Avec l'option d'intégration Gemini Enterprise Agent Platform, Model Armor fournit une application intégrée à l'aide de paramètres de plancher ou de modèles. Cela signifie que Model Armor applique activement les règles en intervenant directement dans le processus, sans nécessiter de modifications du code de votre application.

Les Service Extensions et les intégrations Gemini Enterprise n'utilisent les modèles que pour l'application des règles intégrées. Cela signifie que Model Armor peut appliquer les règles directement sans que vous ayez à modifier le code d'application, à la fois dans les Service Extensions et lors des interactions utilisateur ou agent dans les instances Gemini Enterprise.

L'intégration de Model Armor et Gemini Enterprise ne désinfecte que la requête utilisateur initiale et la réponse finale de l'agent ou du modèle. Les étapes intermédiaires qui se produisent entre la requête initiale de l'utilisateur et la génération de la réponse finale ne sont pas couvertes par cette intégration.

Model Armor dans Security Command Center

Model Armor inspecte les prompts et les réponses des LLM pour détecter diverses menaces, y compris l'injection de prompts, les tentatives de jailbreak, les URL malveillantes et les contenus nuisibles. Lorsque Model Armor détecte une infraction à un paramètre de seuil configuré, il bloque la requête ou la réponse et envoie un résultat à Security Command Center. Pour en savoir plus, consultez Résultats de Model Armor.