Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

GKE-Remote-MCP-Server verwenden

Autopilot Standard

In diesem Dokument wird beschrieben, wie Sie den Remote-MCP-Server (Model Context Protocol) von Google Kubernetes Engine verwenden, um eine Verbindung zu KI-Anwendungen wie Gemini CLI, ChatGPT, Claude und benutzerdefinierten Anwendungen herzustellen, die Sie entwickeln. Der GKE-Remote-MCP-Server bietet Lesezugriff auf Ihre GKE- und Kubernetes-Ressourcen. Dadurch kann ein KI-Agent Ihre Umgebung untersuchen und beobachten. Der Remote-MCP-Server von Google Kubernetes Engine wird aktiviert, wenn Sie die Google Kubernetes Engine API aktivieren.

Das Model Context Protocol (MCP) standardisiert, wie Large Language Models (LLMs) und KI-Anwendungen oder ‑Agents eine Verbindung zu externen Datenquellen herstellen. Mit MCP-Servern können Sie die Tools, Ressourcen und Prompts verwenden, um Aktionen auszuführen und aktualisierte Daten vom Backend-Dienst abzurufen.

Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?

Lokale MCP-Server: werden in der Regel auf Ihrem lokalen Computer ausgeführt und verwenden die Standard-Ein- und Ausgabestreams (stdio) für die Kommunikation zwischen Diensten auf demselben Gerät.
Remote-MCP-Server: Wird auf der Infrastruktur des Dienstes ausgeführt und bietet einen HTTP-Endpunkt für KI-Anwendungen für die Kommunikation zwischen dem KI-MCP-Client und dem MCP-Server. Weitere Informationen zur MCP-Architektur finden Sie unter MCP-Architektur.

Informationen zum lokalen GKE-MCP-Server finden Sie unter GKE-MCP-Server auf GitHub.

Google- und Google Cloud Remote-MCP-Server

Google- und Google Cloud Remote-MCP-Server bieten folgende Funktionen und Vorteile:

Einfache, zentrale Suche
Verwaltete globale oder regionale HTTP-Endpunkte
Detaillierte Autorisierung
Optionale Sicherheit für Prompts und Antworten mit Model Armor-Schutz
Zentralisiertes Audit-Logging

Informationen zu anderen MCP-Servern sowie zu Sicherheits- und Governance-Kontrollen, die für Google Cloud-MCP-Server verfügbar sind, finden Sie unter Google Cloud-MCP-Server – Übersicht.

Es gibt folgende Gründe, den lokalen MCP-Server von GKE zu verwenden:

Lokale Entwicklung und Tests
Offline-Nutzung von MCP
Cluster- und Arbeitslastenerstellung, einschließlich der Manifestgenerierung für KI-/ML-Arbeitslasten
Lokale Clientkonfiguration (mit kubeconfig)
Abfragelogs
Kosten- und Sicherheitsempfehlungen für Ihre GKE-Umgebung erhalten

Weitere Informationen zur Verwendung unseres lokalen MCP-Servers finden Sie unter GKE-MCP-Server. Die folgenden Abschnitte gelten nur für den Remote-MCP-Server von GKE.

Hinweis

Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Installieren Sie die Google Cloud CLI.

Hinweis:Wenn Sie die gcloud CLI zuvor installiert haben, prüfen Sie, ob Sie die aktuelle Version haben, indem Sie gcloud components update ausführen.

Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

Führen Sie den folgenden Befehl aus, um die gcloud CLI zu initialisieren:

gcloud init

Erstellen Sie ein Google Cloud Projekt oder wählen Sie eines aus.

Rollen, die zum Auswählen oder Erstellen eines Projekts erforderlich sind

Projekt auswählen: Für die Auswahl eines Projekts ist keine bestimmte IAM-Rolle erforderlich. Sie können jedes Projekt auswählen, für das Ihnen eine Rolle zugewiesen wurde.
Projekt erstellen: Zum Erstellen eines Projekts benötigen Sie die Rolle „Projektersteller“ (roles/resourcemanager.projectCreator), die die Berechtigung resourcemanager.projects.create enthält. Weitere Informationen zum Zuweisen von Rollen

So erstellen Sie ein Google Cloud Projekt:
```
gcloud projects create PROJECT_ID
```
Ersetzen Sie PROJECT_ID durch einen Namen für das Google Cloud Projekt, das Sie erstellen.
Wählen Sie das von Ihnen erstellte Google Cloud Projekt aus:
```
gcloud config set project PROJECT_ID
```
Ersetzen Sie PROJECT_ID durch den Namen Ihres Projekts in Google Cloud .

Prüfen Sie, ob für Ihr Google Cloud Projekt die Abrechnung aktiviert ist.

Aktivieren Sie die Kubernetes Engine API:

Rollen, die zum Aktivieren von APIs erforderlich sind

Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Weitere Informationen zum Zuweisen von Rollen

gcloud services enable container.googleapis.com

Weisen Sie Ihrem Nutzerkonto Rollen zu. Führen Sie den folgenden Befehl für jede der folgenden IAM-Rollen einmal aus: roles/container.clusterViewer

gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE

Ersetzen Sie Folgendes:

PROJECT_ID: Ihre Projekt-ID.
USER_IDENTIFIER: Die Kennung für Ihr Nutzerkonto . Beispiel: myemail@example.com
ROLE: Die IAM-Rolle, die Sie Ihrem Nutzerkonto zuweisen.

Installieren Sie die Google Cloud CLI.

Hinweis:Wenn Sie die gcloud CLI zuvor installiert haben, prüfen Sie, ob Sie die aktuelle Version haben, indem Sie gcloud components update ausführen.

Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

Führen Sie den folgenden Befehl aus, um die gcloud CLI zu initialisieren:

gcloud init

Erstellen Sie ein Google Cloud Projekt oder wählen Sie eines aus.

Rollen, die zum Auswählen oder Erstellen eines Projekts erforderlich sind

Projekt auswählen: Für die Auswahl eines Projekts ist keine bestimmte IAM-Rolle erforderlich. Sie können jedes Projekt auswählen, für das Ihnen eine Rolle zugewiesen wurde.
Projekt erstellen: Zum Erstellen eines Projekts benötigen Sie die Rolle „Projektersteller“ (roles/resourcemanager.projectCreator), die die Berechtigung resourcemanager.projects.create enthält. Weitere Informationen zum Zuweisen von Rollen

So erstellen Sie ein Google Cloud Projekt:
```
gcloud projects create PROJECT_ID
```
Ersetzen Sie PROJECT_ID durch einen Namen für das Google Cloud Projekt, das Sie erstellen.
Wählen Sie das von Ihnen erstellte Google Cloud Projekt aus:
```
gcloud config set project PROJECT_ID
```
Ersetzen Sie PROJECT_ID durch den Namen Ihres Projekts in Google Cloud .

Prüfen Sie, ob für Ihr Google Cloud Projekt die Abrechnung aktiviert ist.

Aktivieren Sie die Kubernetes Engine API:

Rollen, die zum Aktivieren von APIs erforderlich sind

gcloud services enable container.googleapis.com

Weisen Sie Ihrem Nutzerkonto Rollen zu. Führen Sie den folgenden Befehl für jede der folgenden IAM-Rollen einmal aus: roles/container.clusterViewer

gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE

Ersetzen Sie Folgendes:

PROJECT_ID: Ihre Projekt-ID.
USER_IDENTIFIER: Die Kennung für Ihr Nutzerkonto . Beispiel: myemail@example.com
ROLE: Die IAM-Rolle, die Sie Ihrem Nutzerkonto zuweisen.

Erforderliche Rollen

Das Prinzipal, das Aufrufe an die Remote-MCP-Servertools sendet, benötigt Berechtigungen für den Zugriff auf GKE-Ressourcen. Dieses Prinzipal kann ein menschlicher Nutzer oder ein automatisiertes Dienstkonto sein. Weisen Sie IhremGoogle Cloud -Projekt mindestens die folgende Rolle zu:

MCP Tool User (roles/mcp.toolUser): Gewährt die Berechtigung, Tool-Aufrufe an den MCP-Serverendpunkt zu senden.
Betrachter für Kubernetes Engine-Cluster (roles/container.clusterViewer): Diese Rolle bietet den Lesezugriff, der für die Tools des Remote-Servers erforderlich ist.

Weisen Sie diese Rolle folgenden Nutzern zu:

Ein Nutzerkonto, wenn eine Person über einen Client wie die Gemini CLI mit dem MCP-Server interagiert.
Ein Dienstkonto, wenn Sie einen autonomen Agenten oder eine Anwendung erstellen, die den MCP-Server aufruft.

Authentifizierung und Autorisierung

Für die Authentifizierung und Autorisierung verwenden GKE-Remote-MCP-Server das OAuth 2.0-Protokoll mit Identity and Access Management (IAM). Alle Google Cloud Identitäten werden für die Authentifizierung bei MCP-Servern unterstützt.

Der GKE-Remote-MCP-Server akzeptiert keine API-Schlüssel für die Authentifizierung.

Wir empfehlen, eine separate Identität für Kundenservicemitarbeiter zu erstellen, die MCP-Tools verwenden, damit der Zugriff auf Ressourcen gesteuert und überwacht werden kann. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.

OAuth-Bereiche für den Remote-MCP in GKE

OAuth 2.0 verwendet Bereiche und Anmeldedaten, um zu ermitteln, ob ein authentifiziertes Hauptkonto autorisiert ist, eine bestimmte Aktion für eine Ressource auszuführen. Weitere Informationen zu OAuth 2.0-Bereichen bei Google finden Sie unter Mit OAuth 2.0 auf Google APIs zugreifen.

GKE hat die folgenden OAuth-Bereiche für MCP-Tools:

Bereichs-URI für die gcloud CLI	Beschreibung
`https://www.googleapis.com/auth/container`	Gewährt vollständigen Lese-/Schreibzugriff auf Ihre GKE-Ressourcen.
`https://www.googleapis.com/auth/container.read-only`	Gewährt Lesezugriff auf Ihre GKE-Ressourcen.
`https://www.googleapis.com/auth/cloud-platform`	Gewährt weitreichenden Lese-/Schreibzugriff auf Ihre Google Cloud Projekte.

Möglicherweise sind zusätzliche Bereiche für die Ressourcen erforderlich, auf die während eines Tool-Aufrufs zugegriffen wird. Eine Liste der für GKE erforderlichen Bereiche finden Sie unter GKE API.

MCP-Client für die Verwendung des GKE-MCP-Servers konfigurieren

KI-Anwendungen und ‑Agents wie Claude oder Antigravity können einen MCP-Client instanziieren, der eine Verbindung zu einem einzelnen MCP-Server herstellt. Eine KI-Anwendung kann mehrere Clients haben, die sich mit verschiedenen MCP-Servern verbinden. Wenn Ihre Anwendung nicht in der clientspezifischen Anleitung aufgeführt ist, können Sie die folgenden Informationen verwenden, um eine Verbindung von den meisten Anwendungen aus herzustellen.

Suchen Sie in Ihrer KI-Anwendung nach einer Möglichkeit, einen Remote-MCP-Server hinzuzufügen oder eine Verbindung zu ihm herzustellen. Geben Sie für den GKE MCP-Server die folgenden Informationen nach Bedarf ein:

Servername: GKE-Remote-MCP-Server
Server-URL oder Endpunkt: https://container.googleapis.com/mcp oder eine andere Toolset-URL (siehe Verfügbare Tools)
Transport: HTTP
Authentifizierungsdetails: Je nachdem, wie Sie sich authentifizieren möchten, können Sie Ihre Google Cloud Anmeldedaten, Ihre OAuth-Client-ID und Ihren OAuth-Clientschlüssel oder eine Agent-Identität und Anmeldedaten eingeben. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.

Anwendungsspezifische Anleitungen zum Einrichten und Herstellen einer Verbindung zum MCP-Server finden Sie unter Clientspezifische Anleitungen.

Allgemeine Informationen finden Sie in den folgenden Ressourcen:

Verfügbare Tools

Details zu verfügbaren MCP-Tools und deren Beschreibungen für den GKE-MCP-Server finden Sie in der GKE-MCP-Referenz.

Tools für Listen

Verwenden Sie den MCP-Inspector, um Tools aufzulisten, oder senden Sie eine tools/list-HTTP-Anfrage direkt an den Remote-MCP-Server in GKE. Für die Methode tools/list ist keine Authentifizierung erforderlich.

POST /mcp HTTP/1.1
Host: container.googleapis.com
Content-Type: application/json

{
  "jsonrpc": "2.0",
  "method": "tools/list",
}

Beispiele für Anwendungsfälle

Im Folgenden finden Sie einige Beispielanwendungsfälle für den Remote-MCP-Server von GKE:

Konfiguration und Status Ihrer GKE-Cluster und Knotenpools prüfen Verwenden Sie beispielsweise den Prompt: „Show me the details of my 'production-cluster' and list all of its node pools.“ (Zeige mir die Details meines „production-cluster“ und liste alle zugehörigen Knotenpools auf.)
Kubernetes-Ressourcenkonfigurationen und Containerlogs in einem Cluster ansehen, ohne kubectl zu verwenden. Verwenden Sie beispielsweise den Prompt: „Get the YAML for the 'frontend-deployment' in the 'default' namespace.“ (Rufe das YAML für die Bereitstellung „frontend-deployment“ im Namespace „default“ ab.)
Status von lang andauernden GKE-Vorgängen wie Cluster-Upgrades überwachen. Verwenden Sie beispielsweise den Prompt: „List all the GKE operations in my project from the last hour.“ (Liste alle GKE-Vorgänge in meinem Projekt aus der letzten Stunde auf.)

Optionale Sicherheitskonfigurationen

MCP birgt neue Sicherheitsrisiken und ‑aspekte, da mit den MCP-Tools eine Vielzahl von Aktionen möglich ist. Um diese Risiken zu minimieren und zu verwalten, bietetGoogle Cloud Standardeinstellungen und anpassbare Richtlinien, mit denen Sie die Verwendung von MCP-Tools in Ihrer Google Cloud-Organisation oder Ihrem Google Cloud-Projekt steuern können.

Weitere Informationen zur Sicherheit und Governance von MCP finden Sie unter KI-Sicherheit.

Wenn Sie MCP mit GKE verwenden, ist es wichtig, das Modell der gemeinsamen Verantwortung zwischen Ihnen und Google zu verstehen. Google schützt die Infrastruktur und den MCP-Server selbst. Sie sind jedoch dafür verantwortlich, die vom MCP-Client verwendeten Anmeldedaten zu schützen, geeignete IAM-Richtlinien für diese Anmeldedaten zu definieren und die vom KI-Agent ausgeführten Aktionen zu überwachen.

Model Armor verwenden

Model Armor ist einGoogle Cloud Dienst, der die Sicherheit Ihrer KI-Anwendungen verbessern soll. Dazu werden LLM-Prompts und ‑Antworten proaktiv geprüft, um vor verschiedenen Risiken zu schützen und eine verantwortungsbewusste Anwendung von KI zu unterstützen. Unabhängig davon, ob Sie KI in Ihrer Cloud-Umgebung oder bei externen Cloud-Anbietern bereitstellen, kann Model Armor Ihnen helfen, schädliche Eingaben zu verhindern, die Sicherheit von Inhalten zu überprüfen, sensible Daten zu schützen, die Compliance aufrechtzuerhalten und Ihre KI-Sicherheitsrichtlinien in Ihrer vielfältigen KI-Landschaft einheitlich durchzusetzen.

Wenn Model Armor mit aktiviertem Logging aktiviert ist, protokolliert Model Armor die gesamte Nutzlast. Dadurch können vertrauliche Informationen in Ihren Logs offengelegt werden.

Model Armor aktivieren

Sie müssen Model Armor APIs aktivieren, bevor Sie Model Armor verwenden können.

Console

Aktivieren Sie die Model Armor API.
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Weitere Informationen zum Zuweisen von Rollen
API aktivieren
Wählen Sie das Projekt aus, für das Sie Model Armor aktivieren möchten.

gcloud

Führen Sie die folgenden Schritte mit der Google Cloud CLI und der Model Armor API aus, bevor Sie beginnen:

Aktivieren Sie Cloud Shell in der Google Cloud Console.

Cloud Shell aktivieren

Unten in der Google Cloud Console wird eine Cloud Shell-Sitzung gestartet und eine Eingabeaufforderung angezeigt. Cloud Shell ist eine Shell-Umgebung, in der das Google Cloud CLI bereits installiert ist und Werte für Ihr aktuelles Projekt bereits festgelegt sind. Das Initialisieren der Sitzung kann einige Sekunden dauern.
Führen Sie den folgenden Befehl aus, um den API-Endpunkt für den Model Armor-Dienst festzulegen.
```
gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"
```
Ersetzen Sie LOCATION durch die Region, in der Sie Model Armor verwenden möchten.

Schutz für Google- und Google Cloud Remote-MCP-Server konfigurieren

Um Ihre MCP-Toolaufrufe und ‑Antworten zu schützen, können Sie Model Armor-Mindesteinstellungen verwenden. Eine Mindesteinstellung definiert die Mindestsicherheitsfilter, die für das gesamte Projekt gelten. Mit dieser Konfiguration wird ein einheitlicher Satz von Filtern auf alle MCP-Toolaufrufe und ‑Antworten im Projekt angewendet.

Richten Sie eine Model Armor-Mindesteinstellung mit aktivierter MCP-Bereinigung ein. Weitere Informationen finden Sie unter Model Armor-Untergrenzeneinstellungen konfigurieren.

Hier ein Beispielbefehl:

gcloud model-armor floorsettings update \
--full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
--enable-floor-setting-enforcement=TRUE \
--add-integrated-services=GOOGLE_MCP_SERVER \
--google-mcp-server-enforcement-type=INSPECT_AND_BLOCK \
--enable-google-mcp-server-cloud-logging \
--malicious-uri-filter-settings-enforcement=ENABLED \
--add-rai-settings-filters='[{"confidenceLevel": "MEDIUM_AND_ABOVE", "filterType": "DANGEROUS"}]'

Ersetzen Sie dabei PROJECT_ID durch die ID Ihres Projekts in Google Cloud .

Beachten Sie die folgenden Einstellungen:

INSPECT_AND_BLOCK: Der Erzwingungstyp, der Inhalte für den Google MCP-Server prüft und Prompts und Antworten blockiert, die den Filtern entsprechen.
ENABLED: Die Einstellung, die einen Filter oder die Erzwingung ermöglicht.
MEDIUM_AND_ABOVE: Das Konfidenzniveau für die Filtereinstellungen „Verantwortungsbewusste Anwendung von KI – Gefährlich“. Sie können diese Einstellung ändern. Niedrigere Werte können jedoch zu mehr falsch positiven Ergebnissen führen. Weitere Informationen finden Sie unter Vertrauenswürdigkeitsstufen von Model Armor.

Scannen von MCP-Traffic mit Model Armor deaktivieren

Wenn Sie verhindern möchten, dass Model Armor den Traffic zu und von Google MCP-Servern automatisch auf Grundlage der Mindesteinstellungen des Projekts scannt, führen Sie den folgenden Befehl aus:

gcloud model-armor floorsettings update \
  --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
  --remove-integrated-services=GOOGLE_MCP_SERVER

Ersetzen Sie PROJECT_ID durch die Google Cloud Projekt-ID. Model Armor wendet die in den Mindesteinstellungen dieses Projekts definierten Regeln nicht automatisch auf den gesamten Google MCP-Server-Traffic an.

Model Armor-Mindesteinstellungen und die allgemeine Konfiguration können sich auf mehr als nur MCP auswirken. Da Model Armor in Dienste wie Vertex AI eingebunden ist, können sich Änderungen an den Mindesteinstellungen auf das Scannen von Traffic und das Sicherheitsverhalten in allen eingebundenen Diensten auswirken, nicht nur in MCP.

MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern

IAM-Ablehnungsrichtlinien (Identity and Access Management) helfen Ihnen, Google Cloud Remote-MCP-Server zu schützen. Konfigurieren Sie diese Richtlinien, um unerwünschten Zugriff auf MCP-Tools zu blockieren.

Sie können den Zugriff beispielsweise anhand der folgenden Kriterien verweigern oder zulassen:

Das Hauptkonto
Tool-Eigenschaften wie „Schreibgeschützt“
Die OAuth-Client-ID der Anwendung

Weitere Informationen finden Sie unter Verwendung von MCP mit Identity and Access Management steuern.

GKE-Remote-MCP-Server verwenden Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?

Google- und Google Cloud Remote-MCP-Server

Hinweis

Erforderliche Rollen

Authentifizierung und Autorisierung

OAuth-Bereiche für den Remote-MCP in GKE

MCP-Client für die Verwendung des GKE-MCP-Servers konfigurieren

Verfügbare Tools

Tools für Listen

Beispiele für Anwendungsfälle

Optionale Sicherheitskonfigurationen

Model Armor verwenden

Model Armor aktivieren

Console

gcloud

Schutz für Google- und Google Cloud Remote-MCP-Server konfigurieren

Scannen von MCP-Traffic mit Model Armor deaktivieren

MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern

Nächste Schritte

GKE-Remote-MCP-Server verwenden