Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Übersicht

Model Armor lässt sich in andere Google Cloud Dienste einbinden, um KI- und Large Language Model-Interaktionen (LLM) zu schützen. Model Armor erkennt und meldet potenzielle Richtlinienverstöße und kann Aktionen basierend auf Sicherheitsbewertungen aktiv blockieren.

Unterstützte Modalitäten

Bei Model Armor-Einbindungen in andere Google Cloud Dienste werden nur textbasierte Eingaben und Ausgaben zu und von LLMs, Agenten und Google Cloud MCP-Servern gescannt und analysiert. Andere Modalitäten werden nicht gescannt, mit Ausnahme von Dokumenten in der Gemini Enterprise-Einbindung. Weitere Informationen zu den unterstützten Dokumenttypen finden Sie unter Dokumentprüfung.

Unterstützte Dienste

In diesem Abschnitt werden die Google Cloud Dienste beschrieben, die Sie in Model Armor einbinden können.

Agent Gateway

Binden Sie Model Armor in Agent Gateway ein, um Sicherheitsrichtlinien für den Traffic zu und von allen Agenten zu erzwingen, die vom Gateway verwaltet werden. Diese Einbindung ermöglicht die Inline-Prüfung und ‑Blockierung von schädlichen oder nicht konformen Inhalten. Ziel dieser Einbindung ist es, die Sicherheit von Arbeitsabläufen und die Einhaltung der Sicherheitsrichtlinien der Organisation zu verbessern, ohne dass Änderungen am Anwendungscode erforderlich sind. Dieser Schutz gilt für unterstützte Protokolle sowohl für eingehende (zum Agenten) als auch für ausgehende (vom Agenten) Pfade. Weitere Informationen finden Sie unter In Agent Gateway einbinden.

Apigee

Mit der Model Armor- und Apigee-Einbindung können Sie die KI-Schutzfunktionen von Model Armor direkt in der Apigee API-Gateway-Schicht verwenden. Sie konfigurieren bestimmte Model Armor-Richtlinien in Ihren Apigee API-Proxys. Wenn ein API-Aufruf einen Apigee-Proxy mit diesen Richtlinien durchläuft, sendet Apigee die Prompts und Antworten zur Prüfung an den Model Armor-Dienst. Weitere Informationen finden Sie unter In Apigee einbinden.

Gemini Enterprise

Model Armor kann mithilfe von Vorlagen direkt in Gemini Enterprise eingebunden werden. Gemini Enterprise leitet die Interaktionen zwischen Nutzern und Agenten sowie den zugrunde liegenden LLMs über Model Armor weiter. Das bedeutet, dass Prompts von Nutzern oder Agenten und die von den LLMs generierten Antworten von Model Armor geprüft werden, bevor sie dem Nutzer präsentiert werden. Weitere Informationen finden Sie unter In Gemini Enterprise einbinden.

Zusätzlich zu den unter Unterstützte Modalitäten aufgeführten Modalitäten werden bei der Model Armor-Einbindung in Gemini Enterprise auch Dokumente unterstützt. In Dokumente eingebettete Bilder werden jedoch nicht geprüft.

Google- und Google Cloud MCP-Server

Model Armor kann so konfiguriert werden, dass Ihre Daten geschützt und Inhalte gesichert werden, wenn Sie Anfragen an Google Cloud Dienste senden, die MCP-Tools (Model Context Protocol) und ‑Server bereitstellen. Model Armor helps Ihre agentischen KI-Anwendungen schützen, indem es MCP-Tool-Aufrufe und ‑Antworten mithilfe von Mindesteinstellungenbereinigt. Dieser Prozess minimiert Risiken wie Prompt Injection und die Offenlegung sensibler Daten. Weitere Informationen finden Sie unter In Google- und MCP-Server einbinden. Google Cloud

Service Extensions

Model Armor kann über Service Extensions in Google Cloud Netzwerkdienste eingebunden werden. Mit Service Extensions können Sie Dienste oder nutzerverwaltete Dienste einbinden, um Traffic zu verarbeiten. Google Cloud Sie können eine Diensterweiterung für Application Load Balancer konfigurieren, um den Netzwerk-Traffic für verschiedene KI-Interaktionen zu prüfen, z. B. mit Agenten und MCP-Servern. Sie können Diensterweiterungen auch mit GKE-Inferenz-Gateways verwenden, um den Traffic zu und von einem GKE-Cluster zu prüfen. So wird dafür gesorgt, dass alle KI-Interaktionen, die über den Load Balancer laufen, durch Model Armor geschützt sind. Weitere Informationen finden Sie unter InNetzwerkdienste einbinden. Google Cloud

Gemini Enterprise Agent Platform

Model Armor kann entweder mit Mindesteinstellungen oder mit Vorlagen direkt in die Gemini Enterprise Agent Platform eingebunden werden. Bei dieser Einbindung werden Gemini-Modellanfragen und ‑Antworten geprüft und diejenigen blockiert, die gegen die Mindesteinstellungen verstoßen. Diese Einbindung bietet Prompt- und Antwortschutz in der Gemini API in Vertex AI für die Methode generateContent. Sie müssen Cloud Logging aktivieren, um die Sichtbarkeit der Ergebnisse der Bereinigung von Prompts und Antworten zu erhalten. Weitere Informationen finden Sie unter In Gemini Enterprise Agent Platform einbinden.

Hinweis

APIs aktivieren

Sie müssen die Model Armor API aktivieren, bevor Sie Model Armor verwenden können.

Console

Aktivieren Sie die Model Armor API.
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Weitere Informationen zum Zuweisen von Rollen.
API aktivieren
Wählen Sie das Projekt aus, in dem Sie Model Armor aktivieren möchten.

gcloud

Führen Sie die folgenden Schritte mit der Google Cloud CLI und der Model Armor API aus:

Aktivieren Sie Cloud Shell in der Google Cloud Console.

Cloud Shell aktivieren

Unten in der Google Cloud Console wird eine Cloud Shell Sitzung gestartet und eine Eingabeaufforderung angezeigt. Cloud Shell ist eine Shell-Umgebung in der das Google Cloud CLI bereits installiert ist und Werte für Ihr aktuelles Projekt bereits festgelegt sind. Das Initialisieren der Sitzung kann einige Sekunden dauern.
Legen Sie die API-Endpunktüberschreibung mit der gcloud CLI fest.

API-Endpunktüberschreibung mit der gcloud CLI festlegen

Dieser Schritt ist nur erforderlich, wenn Sie die gcloud CLI verwenden, um die Model Armor API zu aktivieren. Sie müssen die API-Endpunktüberschreibung manuell festlegen, damit die gcloud CLI Anfragen korrekt an den Model Armor-Dienst weiterleitet.

Führen Sie den folgenden Befehl aus, um den API-Endpunkt für den Model Armor-Dienst festzulegen.

gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

Ersetzen Sie LOCATION durch die Region, in der Sie Model Armor verwenden möchten.

Kontingent verwalten

Model Armor verwendet ein Kontingentsystem um eine faire Nutzung zu gewährleisten und die Systemstabilität zu schützen. Das Standardkontingent für die Model Armor API beträgt 1.200 Anfragen pro Minute und Projekt. Sie können einen Wert zwischen 0 und 1.200 Anfragen pro Minute und Projekt festlegen. Informationen zum Anfordern einer Anpassung finden Sie unter Kontingentanpassung anfordern. Wenn Sie mehr als das Standardkontingent benötigen, wenden Sie sich an Cloud Customer Care.

Bei der Einbindung von Model Armor in andere Dienste müssen wichtige Aspekte des Model Armor-Kontingents berücksichtigt werden. Das wichtigste Kontingent, mit dem Sie interagieren, ist die Anzahl der API-Anfragen pro Minute und Projekt.

Berücksichtigen Sie die folgenden Kontingenttypen, wenn Sie Model Armor in andere Dienste einbinden.

Standardkontingent für Model Armor:Wenn ein Dienst einen Aufruf an die Model Armor API zur Analyse sendet (z. B. zum Prüfen von Prompts oder Antworten), wird das Model Armor API-Kontingent Ihres Projekts verwendet.
Kontingent für die Einbindung von Diensten:Das Model Armor-Kontingent ist von allen Kontingenten getrennt, die mit den eingebundenen Diensten verknüpft sind. Sie müssen dafür sorgen, dass für alle Dienste in Ihrem Anfragepfad ausreichend Kontingent vorhanden ist. Alle Aufrufe der Model Armor API zum Bereinigen von Inhalten für Ihre Anwendung werden auf die Kontingentlimits der Model Armor API angerechnet.

Situationen mit unzureichendem Kontingent erkennen

Sie erreichen die Kontingentlimits von Model Armor, wenn in den Logs Ihrer Anwendung Fehler von Model Armor angezeigt werden, in der Regel HTTP-Fehler vom Typ 429 RESOURCE_EXHAUSTED, die auf zu viele Anfragen hinweisen.

Kontingentbedarf schätzen

So ermitteln Sie, wie viel Model Armor-Kontingent Sie anfordern müssen:

Schätzen Sie die maximale Anzahl von Anfragen pro Minute, die Ihre Dienste an Model Armor senden.
Berücksichtigen Sie, wie oft Model Armor pro Nutzerinteraktion mit Ihrem Dienst aufgerufen wird (z. B. einmal für den Prompt und einmal für die Antwort).
Berücksichtigen Sie die maximale Anzahl gleichzeitiger Nutzer oder Sitzungen.
Fordern Sie ein Kontingent mit einem angemessenen Puffer an (z. B. 20–30% über dem erwarteten Höchstwert), um unerwartete Spitzen zu bewältigen.
Beginnen Sie mit Ihrer besten Schätzung, beobachten Sie die Nutzung nach der Einführung genau und fordern Sie bei Bedarf weitere Anpassungen an.

Wenn Sie beispielsweise 500 Nutzer pro Minute erwarten und jede Nutzerinteraktion Model Armor zweimal aufruft (Prompt und Antwort), benötigen Sie mindestens 1.000 Anfragen pro Minute. Wenn Sie einen Puffer einplanen, ist die Anforderung von 1.200 bis 1.300 Anfragen pro Minute ein guter Ausgangspunkt.

Hinweise

Berücksichtigen Sie bei der Einbindung in andere Dienste Folgendes:

Sie müssen die Kontingente für andere Dienste beobachten und verwalten. Wenn das Kontingent für andere Dienste erschöpft ist, wirkt sich das auf Ihre Anwendung aus, auch wenn Sie ausreichend Model Armor-Kontingent haben.
Implementieren Sie clientseitige Wiederholungsversuche mit exponentiellem Backoff in Ihrer Anwendungseinrichtung, um vorübergehende Kontingentprobleme oder andere wiederholbare Fehler zu beheben. Weitere Informationen finden Sie unter Wiederholungsstrategie.

Erzwingungstypen

Bei der Einbindung von Model Armor in andere Dienste ist der Erzwingungstyp ein wichtiger Konfigurationsaspekt. Diese Einstellung bestimmt, wie Model Armor reagiert, wenn ein potenzieller Richtlinienverstoß in den von ihm geprüften Daten erkannt wird, z. B. in LLM-Prompts oder ‑Antworten. Der Erzwingungstyp bestimmt, ob Model Armor nur Verstöße meldet oder aktiv eingreift. Weitere Informationen finden Sie unter Erzwingungstyp definieren.

Einbindung über die REST API

Wenn Sie die REST API für die Einbindung verwenden, fungiert Model Armor nur als Detektor, der Vorlagen verwendet. Es erkennt und meldet potenzielle Richtlinienverstöße basierend auf vordefinierten Vorlagen, verhindert sie aber nicht aktiv. Bei der Einbindung in die Model Armor API kann Ihre Anwendung die Ausgabe von Model Armor verwenden, um Aktionen basierend auf den bereitgestellten Sicherheitsbewertungsergebnissen zu blockieren oder zuzulassen. Die Model Armor API gibt Informationen zu potenziellen Bedrohungen oder Richtlinienverstößen im Zusammenhang mit Ihrem API-Traffic zurück, insbesondere bei KI-Interaktionen. Ihre Anwendung kann die Model Armor API aufrufen und die in der Antwort enthaltenen Informationen verwenden, um eine Entscheidung zu treffen und Maßnahmen basierend auf Ihrer vordefinierten benutzerdefinierten Logik zu ergreifen.

Optionen bei der Einbindung von Model Armor

Model Armor bietet die folgenden Einbindungsoptionen. Jede Option bietet unterschiedliche Funktionen und Möglichkeiten.

Einbindungsoption	Erkennungen konfigurieren	Nur prüfen	Prüfen und blockieren	Abdeckung
Agent Gateway (Vorschau)	Nur mit Vorlagen	Ja	Ja	Alle Modelle und alle Clouds
Apigee	Nur mit Vorlagen	Ja	Ja	Alle Modelle und alle Clouds²
Gemini Enterprise	Nur mit Vorlagen	Ja	Ja	Alle Modelle und alle Clouds²
Google- und Google Cloud MCP-Server	Nur mit Mindesteinstellungen	Ja	Ja	Google- und Google Cloud MCP-Server
Service Extensions	Nur mit Vorlagen	Ja	Ja	Modelle im OpenAI-Format¹, Agenten und MCP-Server in allen Clouds²
Gemini Enterprise Agent Platform	Sowohl mit Mindesteinstellungen als auch mit Vorlagen	Ja	Ja	Gemini-Modelle (nicht streamingfähig)

¹ Mehrere beliebte Modelle, darunter Anthropic Claude, Mistral AI und Grok, unterstützen OpenAI-Spezifikationen. Diese Modelle werden in der Regel mit Inferenz-Engines wie vLLM bereitgestellt, die die erforderliche OpenAI-kompatible API-Schicht bieten. vLLM unterstützt eine Vielzahl von Modellen, darunter die Meta Llama-Serie, DeepSeek, die Mistral- und Mixtral-Familien und Gemma.

² Dazu gehören andere öffentliche Clouds wie AWS und Azure.

Bei der Einbindungsoption für die Gemini Enterprise Agent Platform bietet Model Armor die Inline-Erzwingung mit Mindesteinstellungen oder Vorlagen. Das bedeutet, dass Model Armor Richtlinien aktiv erzwingt, indem es direkt in den Prozess eingreift, ohne dass Änderungen am Anwendungscode erforderlich sind.

Bei den Einbindungen von Service Extensions und Gemini Enterprise werden nur Vorlagen für die Inline-Erzwingung von Richtlinien verwendet. Das bedeutet, dass Model Armor Richtlinien direkt erzwingen kann, ohne dass Sie Anwendungscode ändern müssen, sowohl in Service Extensions als auch bei Nutzer- oder Agenteninteraktionen in Gemini Enterprise-Instanzen.

Bei der Einbindung von Model Armor und Gemini Enterprise werden nur der erste Nutzer-Prompt und die endgültige Antwort des Agenten oder Modells bereinigt. Alle Zwischenschritte zwischen dem ersten Nutzer-Prompt und der endgültigen Antwortgenerierung sind von dieser Einbindung nicht abgedeckt.

Model Armor im Security Command Center

Model Armor prüft LLM-Prompts und ‑Antworten auf verschiedene Bedrohungen, darunter Prompt Injection, Jailbreaking-Versuche, schädliche URLs und schädliche Inhalte. Wenn Model Armor einen Verstoß erkennt gegen eine konfigurierte Mindesteinstellung, wird der Prompt oder die Antwort blockiert und ein Ergebnis an das Security Command Center gesendet. Weitere Informationen finden Sie unter Model Armor-Ergebnisse.

Übersicht Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.