Compute Engine-Remote-MCP-Server verwenden

In diesem Dokument wird beschrieben, wie Sie den Compute Engine-Remote-MCP-Server (Model Context Protocol) verwenden, um eine Verbindung zu KI-Anwendungen wie der Gemini-Befehlszeile, ChatGPT, Claude und benutzerdefinierten Anwendungen herzustellen, die Sie entwickeln. Der Remote-MCP-Server von Compute Engine bietet eine umfassende Reihe von Funktionen, mit denen LLM-Agents eine Reihe von Infrastrukturverwaltungsaufgaben ausführen können, darunter:

  • VM-Instanzen verwalten
  • Instanzgruppenmanager und Instanzvorlagen verwalten.
  • Laufwerke und Snapshots verwalten
  • Informationen zu Reservierungen und Zusicherungen abrufen. .

    Der Compute Engine-Remote-MCP-Server wird aktiviert, wenn Sie die Compute Engine API aktivieren.

    Das Model Context Protocol (MCP) standardisiert, wie Large Language Models (LLMs) und KI-Anwendungen oder ‑Agents eine Verbindung zu externen Datenquellen herstellen. Mit MCP-Servern können Sie die zugehörigen Tools, Ressourcen und Prompts verwenden, um Aktionen auszuführen und aktualisierte Daten vom Backend-Dienst abzurufen.

    Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?

    Lokale MCP-Server
    werden in der Regel auf Ihrem lokalen Computer ausgeführt und verwenden die Standard-Ein- und Ausgabestreams (stdio) für die Kommunikation zwischen Diensten auf demselben Gerät.
    Remote-MCP-Server
    Wird auf der Infrastruktur des Dienstes ausgeführt und bietet einen HTTP-Endpunkt für KI-Anwendungen für die Kommunikation zwischen dem KI-MCP-Client und dem MCP-Server. Weitere Informationen zur MCP-Architektur finden Sie unter MCP-Architektur.

    Google- und Google Cloud Remote-MCP-Server

    Google- und Google Cloud Remote-MCP-Server bieten folgende Funktionen und Vorteile:

    • Vereinfachte, zentrale Suche.
    • Verwaltete globale oder regionale HTTP-Endpunkte.
    • Detaillierte Autorisierung.
    • Optionale Sicherheit für Prompts und Antworten mit Model Armor-Schutz.
    • Zentralisiertes Audit-Logging.

    Informationen zu anderen MCP-Servern sowie zu den Sicherheits- und Governance-Kontrollen, die für Google Cloud-MCP-Server verfügbar sind, finden Sie unter Google Cloud-MCP-Server – Übersicht.

    Hinweis

    1. Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
    2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

    3. Verify that billing is enabled for your Google Cloud project.

    4. Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. Click Grant access.
      4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

      5. Click Select a role, then search for the role.
      6. To grant additional roles, click Add another role and add each additional role.
      7. Click Save.
    5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

    6. Verify that billing is enabled for your Google Cloud project.

    7. Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. Click Grant access.
      4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

      5. Click Select a role, then search for the role.
      6. To grant additional roles, click Add another role and add each additional role.
      7. Click Save.
    8. Aktivieren Sie die Compute Engine API.

      Compute Engine-API aktivieren

    Erforderliche Rollen

    Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Google Cloud Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung des Compute Engine-Remote-MCP-Servers benötigen:

    Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

    Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Verwenden des Remote-MCP-Servers von Compute Engine erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:

    Erforderliche Berechtigungen

    Die folgenden Berechtigungen sind erforderlich, um den Compute Engine-Remote-MCP-Server zu verwenden:

    • MCP-Tool-Aufrufe ausführen: mcp.tools.call

    Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

    Außerdem benötigen Sie die Rollen und Berechtigungen, die zum Ausführen der Compute Engine-Vorgänge erforderlich sind. Weitere Informationen finden Sie unter Compute Engine-Rollen und -Berechtigungen.

    Authentifizierung und Autorisierung

    Compute Engine-MCP-Server verwenden das OAuth 2.0-Protokoll mit Identity and Access Management (IAM) für die Authentifizierung und Autorisierung. Alle Google Cloud Identitäten werden für die Authentifizierung bei MCP-Servern unterstützt.

    Wir empfehlen, eine separate Identität für Kundenservicemitarbeiter zu erstellen, die MCP-Tools verwenden, damit der Zugriff auf Ressourcen gesteuert und überwacht werden kann. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.

    Compute Engine-OAuth-Bereiche für MCP

    OAuth 2.0 verwendet Bereiche und Anmeldedaten, um zu ermitteln, ob ein authentifiziertes Hauptkonto autorisiert ist, eine bestimmte Aktion für eine Ressource auszuführen. Weitere Informationen zu OAuth 2.0-Bereichen bei Google finden Sie unter Mit OAuth 2.0 auf Google APIs zugreifen.

    Compute Engine hat die folgenden OAuth-Bereiche für das MCP-Tool:

    Bereichs-URI für die gcloud CLI Beschreibung
    https://www.googleapis.com/auth/compute.read-only Gewährt nur Lesezugriff auf Daten.
    https://www.googleapis.com/auth/compute.read-write Ermöglicht den Zugriff zum Lesen und Ändern von Daten.

    Möglicherweise sind zusätzliche Bereiche für die Ressourcen erforderlich, auf die während eines Tool-Aufrufs zugegriffen wird. Eine Liste der für Compute Engine erforderlichen Bereiche finden Sie unter Compute Engine API.

    MCP-Client für die Verwendung des Compute Engine-MCP-Servers konfigurieren

    KI-Anwendungen und ‑Agents wie Claude oder die Gemini CLI können einen MCP-Client instanziieren, der eine Verbindung zu einem einzelnen MCP-Server herstellt. Eine KI-Anwendung kann mehrere Clients haben, die eine Verbindung zu verschiedenen MCP-Servern herstellen. Damit eine Verbindung zu einem Remote-MCP-Server hergestellt werden kann, muss der MCP-Client die URL des Remote-MCP-Servers kennen.

    Suchen Sie in Ihrer KI-Anwendung nach einer Möglichkeit, eine Verbindung zu einem Remote-MCP-Server herzustellen. Sie werden aufgefordert, Details zum Server einzugeben, z. B. den Namen und die URL.

    Geben Sie für den Compute Engine-MCP-Server Folgendes ein:

    • Servername: Compute Engine-MCP-Server
    • Server-URL oder Endpunkt: https://compute.googleapis.com/mcp
    • Transport: HTTP
    • Authentifizierungsdetails: Je nachdem, wie Sie sich authentifizieren möchten, können Sie Ihre Google Cloud Anmeldedaten, Ihre OAuth-Client-ID und Ihren OAuth-Clientschlüssel oder eine Agent-Identität und Anmeldedaten eingeben. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.

    Hostspezifische Anleitungen zum Einrichten und Verbinden mit dem MCP-Server finden Sie hier:

    Allgemeine Informationen finden Sie in den folgenden Ressourcen:

    Verfügbare Tools

    Details zu verfügbaren MCP-Tools und deren Beschreibungen für den Compute Engine-MCP-Server finden Sie in der Compute Engine-MCP-Referenz.

    Tools für Listen

    Verwenden Sie den MCP-Inspector, um Tools aufzulisten, oder senden Sie eine tools/list-HTTP-Anfrage direkt an den Compute Engine-Remote-MCP-Server. Für die Methode tools/list ist keine Authentifizierung erforderlich.

    POST /mcp HTTP/1.1
    Host: compute.googleapis.com
    Content-Type: application/json
    
    {
      "jsonrpc": "2.0",
      "method": "tools/list",
    }
    

    Beispielanwendungsfälle

    In den folgenden Anwendungsbeispielen wird beschrieben, wie Sie den Compute Engine-MCP-Server zum Verwalten von Compute Engine-Ressourcen verwenden können:

    • Ressourcen prüfen und verwalten Wenn Sie beispielsweise die Ressourcenzuweisung und -konfiguration in Ihrem Projekt nachvollziehen möchten, können Sie alle Compute-Instanzen auflisten. Sie können auch alle aktiven Compute-Instanzen in einer Zone finden, an die ein bestimmter Beschleuniger angehängt ist, und ihren Standort und Namen für die Ressourcenverwaltung anzeigen lassen.
    • Nicht verwendete Ressourcen bereinigen, um die Betriebskosten zu senken. Sie können beispielsweise Festplatten-Snapshots in einer Zone identifizieren und bereinigen, die nicht mehr mit einem Quelllaufwerk verknüpft sind, oder gestoppte VM-Instanzen identifizieren und löschen, an die kostspielige GPU-Ressourcen angehängt sind.
    • Instanzleistung optimieren Ändern Sie beispielsweise die Größe einer unterdimensionierten VM-Instanz in einen größeren Maschinentyp derselben Familie und bestätigen Sie das erfolgreiche Update.
    • Spezialisierte VMs für KI-Arbeitslasten mit Zonenflexibilität bereitstellen. Sie können beispielsweise eine VM-Instanz mit einem bestimmten angehängten GPU-Beschleuniger in einer beliebigen Zone in einer angegebenen Region erstellen, in der sie verfügbar ist.
    • Fehlerbehebung und Validierung von Instanzkonfigurationen Rufen Sie beispielsweise Konfigurationsdetails für eine bestimmte VM-Instanz ab, in der der Job eingefroren ist, starten Sie sie neu und bestätigen Sie, dass der zugrunde liegende Beschleuniger und die Festplatte angehängt sind.

    Beispiel-Prompts

    Nachfolgend finden Sie Beispielprompts, mit denen Sie Aufgaben mithilfe des Compute Engine-MCP-Servers ausführen können:

    • Listen Sie alle VMs in PROJECT_ID auf, einschließlich des VM-Namens und der Zone.
    • Zeige die Instanzdetails für VM_NAME an.
    • Suchen Sie in REGION nach allen Laufwerk-Snapshots, für die das Quelllaufwerk nicht mehr vorhanden ist.
    • Ändere den Maschinentyp von VM_NAME in den nächstgrößeren Maschinentyp in derselben Maschinenfamilie, sende eine Benachrichtigung, wenn er wieder online ist, und bestätige den neuen Maschinentyp.
    • Suchen Sie alle laufenden VMs in REGION mit NVIDIA-Beschleunigern und geben Sie die Zone und den Namen dieser VMs an.
    • Erstellen Sie eine VM in ZONE mit einem angehängten NVIDIA T4-Beschleuniger. Geben Sie der VM den Namen my-nvidiat4-vm.
    • Suchen Sie alle beendeten VMs in REGION mit NVIDIA Tesla T4-Beschleunigern und löschen Sie sie.

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die Google Cloud Projekt-ID.
    • REGION: Der Name der Region, in der sich Ihre Ressourcen befinden.
    • ZONE: der Name der Zone, in der sich Ihre VMs befinden.
    • VM_NAME ist der Name Ihrer VM-Instanz.

    Optionale Sicherheitskonfigurationen

    MCP birgt neue Sicherheitsrisiken und ‑aspekte, da mit den MCP-Tools eine Vielzahl von Aktionen ausgeführt werden kann. Um diese Risiken zu minimieren und zu verwalten, bietetGoogle Cloud Standardeinstellungen und anpassbare Richtlinien, mit denen Sie die Verwendung von MCP-Tools in Ihrer Google Cloud-Organisation oder Ihrem Google Cloud-Projekt steuern können.

    Weitere Informationen zur Sicherheit und Governance von MCP finden Sie unter KI-Sicherheit.

    Model Armor verwenden

    Model Armor ist einGoogle Cloud -Dienst, der die Sicherheit Ihrer KI-Anwendungen verbessern soll. Das System überwacht und kontrolliert sowohl die Prompts als auch die Antworten des LLM, um Sie vor verschiedenen Risiken zu schützen und für verantwortungsbewusste Anwendung von KI zu sorgen. Unabhängig davon, ob Sie KI in Ihrer Cloud-Umgebung oder bei externen Cloud-Anbietern bereitstellen, kann Model Armor Ihnen helfen, schädliche Eingaben zu verhindern, die Sicherheit von Inhalten zu überprüfen, sensible Daten zu schützen, die Compliance aufrechtzuerhalten und Ihre KI-Sicherheitsrichtlinien in Ihrer vielfältigen KI-Landschaft einheitlich durchzusetzen.

    Model Armor ist nur in bestimmten Regionen verfügbar. Wenn Model Armor für ein Projekt aktiviert ist und ein Aufruf an dieses Projekt aus einer nicht unterstützten Region erfolgt, führt Model Armor einen regionenübergreifenden Aufruf aus. Weitere Informationen finden Sie unter Model Armor-Standorte.

    Model Armor aktivieren

    Sie müssen Model Armor APIs aktivieren, bevor Sie Model Armor verwenden können.

    Console

    1. Aktivieren Sie die Model Armor API.

      Rollen, die zum Aktivieren von APIs erforderlich sind

      Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Weitere Informationen zum Zuweisen von Rollen

      API aktivieren

    2. Wählen Sie das Projekt aus, für das Sie Model Armor aktivieren möchten.

    gcloud

    Führen Sie die folgenden Schritte mit der Google Cloud CLI und der Model Armor API aus, bevor Sie beginnen:

    1. Aktivieren Sie Cloud Shell in der Google Cloud Console.

      Cloud Shell aktivieren

      Unten in der Google Cloud Console wird eine Cloud Shell-Sitzung gestartet und eine Eingabeaufforderung angezeigt. Cloud Shell ist eine Shell-Umgebung, in der das Google Cloud CLI bereits installiert ist und Werte für Ihr aktuelles Projekt bereits festgelegt sind. Das Initialisieren der Sitzung kann einige Sekunden dauern.

    2. Führen Sie den folgenden Befehl aus, um den API-Endpunkt für den Model Armor-Dienst festzulegen.

      gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

      Ersetzen Sie LOCATION durch die Region, in der Sie Model Armor verwenden möchten.

    Schutz für Google- und Google Cloud Remote-MCP-Server konfigurieren

    Mit den Mindesteinstellungen für Model Armor können Sie Ihre MCP-Toolaufrufe und ‑Antworten schützen. Eine Mindesteinstellung definiert die Mindestsicherheitsfilter, die für das gesamte Projekt gelten. Mit dieser Konfiguration wird ein einheitlicher Satz von Filtern auf alle MCP-Tool-Aufrufe und ‑Antworten im Projekt angewendet.

    Richten Sie eine Model Armor-Mindesteinstellung mit aktivierter MCP-Bereinigung ein. Weitere Informationen finden Sie unter Model Armor-Untergrenzeneinstellungen konfigurieren.

    Hier ein Beispielbefehl:

    gcloud model-armor floorsettings update \
    --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
    --enable-floor-setting-enforcement=TRUE \
    --add-integrated-services=GOOGLE_MCP_SERVER \
    --google-mcp-server-enforcement-type=INSPECT_AND_BLOCK \
    --enable-google-mcp-server-cloud-logging \
    --malicious-uri-filter-settings-enforcement=ENABLED \
    --add-rai-settings-filters='[{"confidenceLevel": "MEDIUM_AND_ABOVE", "filterType": "DANGEROUS"}]'

    Ersetzen Sie dabei PROJECT_ID durch die ID Ihres Projekts in Google Cloud .

    Beachten Sie die folgenden Einstellungen:

    • INSPECT_AND_BLOCK: Der Erzwingungstyp, der Inhalte für den Google MCP-Server prüft und Prompts und Antworten blockiert, die den Filtern entsprechen.
    • ENABLED: Die Einstellung, die einen Filter oder die Erzwingung ermöglicht.
    • MEDIUM_AND_ABOVE: Das Konfidenzniveau für die Filter für verantwortungsbewusste KI – gefährlich. Sie können diese Einstellung ändern. Niedrigere Werte können jedoch zu mehr falsch positiven Ergebnissen führen. Weitere Informationen finden Sie unter Vertrauenswürdigkeitsstufen für Model Armor.

    Scannen von MCP-Traffic mit Model Armor deaktivieren

    Wenn Sie das Scannen von Google MCP-Traffic mit Model Armor beenden möchten, führen Sie den folgenden Befehl aus:

    gcloud model-armor floorsettings update \
      --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
      --remove-integrated-services=GOOGLE_MCP_SERVER
    

    Ersetzen Sie PROJECT_ID durch die Google Cloud Projekt-ID.

    Model Armor scannt keinen MCP-Traffic im Projekt.

    MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern

    IAM-Richtlinien (Identity and Access Management) zur Zugriffsbeschränkung helfen Ihnen, Google Cloud Remote-MCP-Server zu schützen. Konfigurieren Sie diese Richtlinien, um unerwünschten Zugriff auf MCP-Tools zu blockieren.

    Sie können den Zugriff beispielsweise anhand der folgenden Kriterien verweigern oder zulassen:

    • Der Prinzipal
    • Tool-Eigenschaften wie „Schreibgeschützt“
    • Die OAuth-Client-ID der Anwendung

    Weitere Informationen finden Sie unter MCP-Nutzung mit Identity and Access Management steuern.

    Nächste Schritte