Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Compute Engine-Remote-MCP-Server verwenden

In diesem Dokument wird beschrieben, wie Sie den Compute Engine-Remote-MCP-Server (Model Context Protocol) verwenden, um eine Verbindung zu KI-Anwendungen wie der Gemini-Befehlszeile, ChatGPT, Claude und benutzerdefinierten Anwendungen herzustellen, die Sie entwickeln. Der Remote-MCP-Server von Compute Engine bietet eine umfassende Reihe von Funktionen, mit denen LLM-Agents eine Reihe von Infrastrukturverwaltungsaufgaben ausführen können, darunter:

VM-Instanzen verwalten
Instanzgruppenmanager und Instanzvorlagen verwalten.
Laufwerke und Snapshots verwalten

Informationen zu Reservierungen und Zusicherungen abrufen. Der Compute Engine-Remote-MCP-Server wird aktiviert, wenn Sie die Compute Engine API aktivieren.

Das Model Context Protocol (MCP) standardisiert die Verbindung von Large Language Models (LLMs) und KI-Anwendungen oder ‑Agenten mit externen Datenquellen. Mit MCP-Servern können Sie die zugehörigen Tools, Ressourcen und Prompts verwenden, um Aktionen auszuführen und aktualisierte Daten vom Backend-Dienst abzurufen.

Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?

Lokale MCP-Server: werden in der Regel auf Ihrem lokalen Computer ausgeführt und verwenden die Standard-Ein- und Ausgabestreams (stdio) für die Kommunikation zwischen Diensten auf demselben Gerät.
Remote-MCP-Server: Wird auf der Infrastruktur des Dienstes ausgeführt und bietet einen HTTP-Endpunkt für KI-Anwendungen für die Kommunikation zwischen dem KI-MCP-Client und dem MCP-Server. Weitere Informationen zur MCP-Architektur finden Sie unter MCP-Architektur.

Google- und Google Cloud Remote-MCP-Server

Google- und Google Cloud Remote-MCP-Server bieten folgende Funktionen und Vorteile:

Einfache, zentrale Suche
Verwaltete globale oder regionale HTTP-Endpunkte
Detaillierte Autorisierung
Optionale Sicherheit für Prompts und Antworten mit Model Armor-Schutz
Zentralisiertes Audit-Logging

Informationen zu anderen MCP-Servern sowie zu Sicherheits- und Governance-Kontrollen, die für Google Cloud-MCP-Server verfügbar sind, finden Sie unter Google Cloud-MCP-Server – Übersicht.

Hinweis

Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

Check for the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

Grant the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
Click Grant access.
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
Click Select a role, then search for the role.
To grant additional roles, click Add another role and add each additional role.
Click Save.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

Check for the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

Grant the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
Click Grant access.
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
Click Select a role, then search for the role.
To grant additional roles, click Add another role and add each additional role.
Click Save.

Aktivieren Sie die Compute Engine API.
Compute Engine-API aktivieren

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Google Cloud Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung des Compute Engine-Remote-MCP-Servers benötigen:

MCP-Tool-Aufrufe ausführen: MCP Tool User (roles/mcp.toolUser)

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Verwenden des Remote-MCP-Servers von Compute Engine erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um den Compute Engine-Remote-MCP-Server zu verwenden:

MCP-Tool-Aufrufe erstellen: mcp.tools.call

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Außerdem benötigen Sie die Rollen und Berechtigungen, die zum Ausführen der Compute Engine-Vorgänge erforderlich sind. Weitere Informationen finden Sie unter Compute Engine-Rollen und -Berechtigungen.

Authentifizierung und Autorisierung

Compute Engine-MCP-Server verwenden das OAuth 2.0-Protokoll mit Identity and Access Management (IAM) zur Authentifizierung und Autorisierung. Alle Google Cloud Identitäten werden für die Authentifizierung bei MCP-Servern unterstützt.

Wir empfehlen, eine separate Identität für Kundenservicemitarbeiter zu erstellen, die MCP-Tools verwenden, damit der Zugriff auf Ressourcen gesteuert und überwacht werden kann. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.

Compute Engine-OAuth-Bereiche für MCP

OAuth 2.0 verwendet Bereiche und Anmeldedaten, um zu ermitteln, ob ein authentifiziertes Hauptkonto autorisiert ist, eine bestimmte Aktion für eine Ressource auszuführen. Weitere Informationen zu OAuth 2.0-Bereichen bei Google finden Sie unter Mit OAuth 2.0 auf Google APIs zugreifen.

Compute Engine hat die folgenden OAuth-Bereiche für das MCP-Tool:

Bereichs-URI für die gcloud CLI	Beschreibung
`https://www.googleapis.com/auth/compute.read-only`	Gewährt nur Lesezugriff auf Daten.
`https://www.googleapis.com/auth/compute.read-write`	Ermöglicht den Zugriff zum Lesen und Ändern von Daten.

Möglicherweise sind zusätzliche Bereiche für die Ressourcen erforderlich, auf die während eines Tool-Aufrufs zugegriffen wird. Eine Liste der für Compute Engine erforderlichen Bereiche finden Sie unter Compute Engine API.

MCP-Client für die Verwendung des Compute Engine-MCP-Servers konfigurieren

KI-Anwendungen und ‑Agents wie Claude oder Antigravity können einen MCP-Client instanziieren, der eine Verbindung zu einem einzelnen MCP-Server herstellt. Eine KI-Anwendung kann mehrere Clients haben, die sich mit verschiedenen MCP-Servern verbinden. Wenn Ihre Anwendung nicht in der clientspezifischen Anleitung aufgeführt ist, können Sie die folgenden Informationen verwenden, um eine Verbindung von den meisten Anwendungen aus herzustellen.

Suchen Sie in Ihrer KI-Anwendung nach einer Möglichkeit, einen Remote-MCP-Server hinzuzufügen oder eine Verbindung zu ihm herzustellen. Geben Sie für den Compute Engine-MCP-Server die folgenden Informationen nach Bedarf ein:

Servername: Compute Engine-MCP-Server
Server-URL oder Endpunkt: https://compute.googleapis.com/mcp
Transport: HTTP
Authentifizierungsdetails: Je nachdem, wie Sie sich authentifizieren möchten, können Sie Ihre Google Cloud Anmeldedaten, Ihre OAuth-Client-ID und Ihren OAuth-Clientschlüssel oder eine Agent-Identität und Anmeldedaten eingeben. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.

Anwendungsspezifische Anleitungen zum Einrichten und Herstellen einer Verbindung zum MCP-Server finden Sie unter Clientspezifische Anleitungen.

Allgemeine Informationen finden Sie in den folgenden Ressourcen:

Verfügbare Tools

Details zu verfügbaren MCP-Tools und deren Beschreibungen für den Compute Engine-MCP-Server finden Sie in der Compute Engine-MCP-Referenz.

Tools für Listen

Verwenden Sie den MCP-Inspector, um Tools aufzulisten, oder senden Sie eine tools/list-HTTP-Anfrage direkt an den Compute Engine-Remote-MCP-Server. Für die Methode tools/list ist keine Authentifizierung erforderlich.

POST /mcp HTTP/1.1
Host: compute.googleapis.com
Content-Type: application/json

{
  "jsonrpc": "2.0",
  "method": "tools/list",
}

Beispielanwendungsfälle

In den folgenden Anwendungsbeispielen wird beschrieben, wie Sie den Compute Engine-MCP-Server zum Verwalten von Compute Engine-Ressourcen verwenden können:

Ressourcen prüfen und verwalten Wenn Sie beispielsweise die Ressourcenzuweisung und -konfiguration in Ihrem Projekt nachvollziehen möchten, können Sie alle Compute-Instanzen auflisten. Sie können auch alle aktiven Compute-Instanzen in einer Zone finden, an die ein bestimmter Beschleuniger angehängt ist, und ihren Standort und Namen für die Ressourcenverwaltung anzeigen lassen.
Nicht verwendete Ressourcen bereinigen, um die Betriebskosten zu senken. Sie können beispielsweise Laufwerkssnapshots in einer Zone identifizieren und bereinigen, die nicht mehr mit einem Quelllaufwerk verknüpft sind, oder gestoppte VM-Instanzen mit teuren angehängten GPU-Ressourcen identifizieren und löschen.
Instanzleistung optimieren Ändern Sie beispielsweise die Größe einer unterdimensionierten VM-Instanz in einen größeren Maschinentyp derselben Familie und bestätigen Sie das erfolgreiche Update.
Spezialisierte VMs für KI-Arbeitslasten mit Zonenflexibilität bereitstellen. Sie können beispielsweise eine VM-Instanz mit einem bestimmten angehängten GPU-Beschleuniger in einer beliebigen Zone in einer angegebenen Region erstellen, in der sie verfügbar ist.
Fehlerbehebung und Validierung von Instanzkonfigurationen Rufen Sie beispielsweise Konfigurationsdetails für eine bestimmte VM-Instanz ab, in der der Job eingefroren ist, starten Sie sie neu und bestätigen Sie, dass der zugrunde liegende Beschleuniger und das Laufwerk angehängt sind.

Beispiel-Prompts

Nachfolgend finden Sie Beispielprompts, mit denen Sie Aufgaben mithilfe des Compute Engine-MCP-Servers ausführen können:

„Liste alle VMs in PROJECT_ID auf, einschließlich des VM-Namens und der Zone.“
„Zeige die Instanzdetails für VM_NAME an.“
„Suche in REGION nach allen Laufwerk-Snapshots, für die das Quelllaufwerk nicht mehr vorhanden ist.“
„Ändere den Maschinentyp von VM_NAME in den nächstgrößeren Maschinentyp in derselben Maschinenfamilie, sende eine Benachrichtigung, wenn er wieder online ist, und bestätige den neuen Maschinentyp.“
„Finde alle laufenden VMs in REGION mit NVIDIA-Beschleunigern und zeige die Zone und den Namen dieser VMs an.“
„Erstelle eine VM in ZONE mit einem angehängten NVIDIA T4-Beschleuniger. Geben Sie der VM den Namen my-nvidiat4-vm.“
„Finde alle beendeten VMs in REGION mit NVIDIA Tesla T4-Beschleunigern und lösche sie.“

Ersetzen Sie Folgendes:

PROJECT_ID: die Google Cloud Projekt-ID.
REGION: Der Name der Region, in der sich Ihre Ressourcen befinden.
ZONE: der Name der Zone, in der sich Ihre VMs befinden.
VM_NAME ist der Name Ihrer VM-Instanz.

Optionale Sicherheitskonfigurationen

Das MCP birgt neue Sicherheitsrisiken und ‑aspekte, da mit den MCP-Tools eine Vielzahl von Aktionen ausgeführt werden kann. Um diese Risiken zu minimieren und zu verwalten, bietetGoogle Cloud Standardeinstellungen und anpassbare Richtlinien, mit denen Sie die Verwendung von MCP-Tools in Ihrer Google Cloud-Organisation oder Ihrem Google Cloud-Projekt steuern können.

Weitere Informationen zur Sicherheit und Governance von MCP finden Sie unter KI-Sicherheit.

Model Armor verwenden

Model Armor ist einGoogle Cloud Dienst, der die Sicherheit Ihrer KI-Anwendungen verbessern soll. Dazu werden LLM-Prompts und ‑Antworten proaktiv geprüft, um vor verschiedenen Risiken zu schützen und eine verantwortungsbewusste Anwendung von KI zu unterstützen. Unabhängig davon, ob Sie KI in Ihrer Cloud-Umgebung oder bei externen Cloud-Anbietern bereitstellen, kann Model Armor Ihnen helfen, schädliche Eingaben zu verhindern, die Sicherheit von Inhalten zu überprüfen, sensible Daten zu schützen, die Compliance aufrechtzuerhalten und Ihre KI-Sicherheitsrichtlinien in Ihrer vielfältigen KI-Landschaft einheitlich durchzusetzen.

Wenn Model Armor mit aktiviertem Logging aktiviert ist, protokolliert Model Armor die gesamte Nutzlast. Dadurch können vertrauliche Informationen in Ihren Logs offengelegt werden.

Model Armor aktivieren

Sie müssen Model Armor APIs aktivieren, bevor Sie Model Armor verwenden können.

Console

Aktivieren Sie die Model Armor API.
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Weitere Informationen zum Zuweisen von Rollen
API aktivieren
Wählen Sie das Projekt aus, für das Sie Model Armor aktivieren möchten.

gcloud

Führen Sie die folgenden Schritte mit der Google Cloud CLI und der Model Armor API aus, bevor Sie beginnen:

Aktivieren Sie Cloud Shell in der Google Cloud Console.

Cloud Shell aktivieren

Unten in der Google Cloud Console wird eine Cloud Shell-Sitzung gestartet und eine Eingabeaufforderung angezeigt. Cloud Shell ist eine Shell-Umgebung, in der das Google Cloud CLI bereits installiert ist und Werte für Ihr aktuelles Projekt bereits festgelegt sind. Das Initialisieren der Sitzung kann einige Sekunden dauern.
Führen Sie den folgenden Befehl aus, um den API-Endpunkt für den Model Armor-Dienst festzulegen.
```
gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"
```
Ersetzen Sie LOCATION durch die Region, in der Sie Model Armor verwenden möchten.

Schutz für Google- und Google Cloud Remote-MCP-Server konfigurieren

Mit den Mindesteinstellungen für Model Armor können Sie Ihre MCP-Toolaufrufe und ‑Antworten schützen. Eine Mindesteinstellung definiert die Mindestsicherheitsfilter, die für das gesamte Projekt gelten. Mit dieser Konfiguration wird ein einheitlicher Satz von Filtern auf alle MCP-Tool-Aufrufe und ‑Antworten im Projekt angewendet.

Richten Sie eine Model Armor-Mindesteinstellung mit aktivierter MCP-Bereinigung ein. Weitere Informationen finden Sie unter Model Armor-Untergrenzeneinstellungen konfigurieren.

Hier ein Beispielbefehl:

gcloud model-armor floorsettings update \
--full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
--enable-floor-setting-enforcement=TRUE \
--add-integrated-services=GOOGLE_MCP_SERVER \
--google-mcp-server-enforcement-type=INSPECT_AND_BLOCK \
--enable-google-mcp-server-cloud-logging \
--malicious-uri-filter-settings-enforcement=ENABLED \
--add-rai-settings-filters='[{"confidenceLevel": "MEDIUM_AND_ABOVE", "filterType": "DANGEROUS"}]'

Ersetzen Sie dabei PROJECT_ID durch die ID Ihres Projekts in Google Cloud .

Beachten Sie die folgenden Einstellungen:

INSPECT_AND_BLOCK: Der Erzwingungstyp, der Inhalte für den Google MCP-Server prüft und Prompts und Antworten blockiert, die den Filtern entsprechen.
ENABLED: Die Einstellung, die einen Filter oder die Erzwingung ermöglicht.
MEDIUM_AND_ABOVE: Das Konfidenzniveau für die Filtereinstellungen „Verantwortungsbewusste Anwendung von KI – Gefährlich“. Sie können diese Einstellung ändern. Niedrigere Werte können jedoch zu mehr falsch positiven Ergebnissen führen. Weitere Informationen finden Sie unter Vertrauenswürdigkeitsstufen von Model Armor.

Scannen von MCP-Traffic mit Model Armor deaktivieren

Wenn Sie verhindern möchten, dass Model Armor den Traffic zu und von Google MCP-Servern automatisch auf Grundlage der Mindesteinstellungen des Projekts scannt, führen Sie den folgenden Befehl aus:

gcloud model-armor floorsettings update \
  --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
  --remove-integrated-services=GOOGLE_MCP_SERVER

Ersetzen Sie PROJECT_ID durch die Google Cloud Projekt-ID. Model Armor wendet die in den Mindesteinstellungen dieses Projekts definierten Regeln nicht automatisch auf den gesamten Google MCP-Server-Traffic an.

Die Mindesteinstellungen für Model Armor und die allgemeine Konfiguration können sich auf mehr als nur MCP auswirken. Da Model Armor in Dienste wie Vertex AI eingebunden ist, können sich Änderungen an den Mindesteinstellungen auf die Traffic-Analyse und Sicherheitsfunktionen aller eingebundenen Dienste auswirken, nicht nur auf MCP.

MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern

IAM-Ablehnungsrichtlinien (Identity and Access Management) helfen Ihnen, Google Cloud Remote-MCP-Server zu schützen. Konfigurieren Sie diese Richtlinien, um unerwünschten Zugriff auf MCP-Tools zu blockieren.

Sie können den Zugriff beispielsweise anhand der folgenden Kriterien verweigern oder zulassen:

Das Hauptkonto
Tool-Eigenschaften wie „Schreibgeschützt“
Die OAuth-Client-ID der Anwendung

Weitere Informationen finden Sie unter Verwendung von MCP mit Identity and Access Management steuern.

Nächste Schritte

Lesen Sie die Referenzdokumentation zu Compute Engine MCP.
Weitere Informationen zu Google Cloud-MCP-Servern

Compute Engine-Remote-MCP-Server verwenden Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?

Google- und Google Cloud Remote-MCP-Server

Hinweis

Check for the roles

Grant the roles

Check for the roles

Grant the roles

Erforderliche Rollen

Erforderliche Berechtigungen

Authentifizierung und Autorisierung

Compute Engine-OAuth-Bereiche für MCP

MCP-Client für die Verwendung des Compute Engine-MCP-Servers konfigurieren

Verfügbare Tools

Tools für Listen

Beispielanwendungsfälle

Beispiel-Prompts

Optionale Sicherheitskonfigurationen

Model Armor verwenden

Model Armor aktivieren

Console

gcloud

Schutz für Google- und Google Cloud Remote-MCP-Server konfigurieren

Scannen von MCP-Traffic mit Model Armor deaktivieren

MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern

Nächste Schritte

Compute Engine-Remote-MCP-Server verwenden