Utilizza il server MCP remoto di Compute Engine

Questo documento mostra come utilizzare il server Model Context Protocol (MCP) remoto di Compute Engine per connettersi ad applicazioni AI, tra cui Gemini CLI, ChatGPT, Claude e applicazioni personalizzate che stai sviluppando. Il server MCP remoto di Compute Engine fornisce un insieme completo di funzionalità che consentono agli agenti LLM di eseguire una serie di attività di gestione dell'infrastruttura, tra cui:

  • Gestisci le istanze di macchine virtuali (VM).
  • Gestisci i gestori di gruppi di istanze e i modelli di istanza.
  • Gestisci dischi e snapshot.
  • Recupera informazioni su prenotazioni e impegni. .

    Il server MCP remoto di Compute Engine viene abilitato quando abiliti l'API Compute Engine.

    Il Model Context Protocol (MCP) standardizza il modo in cui i modelli linguistici di grandi dimensioni (LLM) e le applicazioni o gli agenti AI si connettono a origini dati esterne. I server MCP ti consentono di utilizzare i loro strumenti, risorse e prompt per eseguire azioni e ottenere dati aggiornati dal loro servizio di backend.

    Qual è la differenza tra i server MCP locali e remoti?

    Server MCP locali
    In genere vengono eseguiti sulla macchina locale e utilizzano i flussi di input e output standard (stdio) per la comunicazione tra i servizi sullo stesso dispositivo.
    Server MCP remoti
    Viene eseguito sull'infrastruttura del servizio e offre un endpoint HTTP alle applicazioni di AI per la comunicazione tra il client AI MCP e il server MCP. Per maggiori informazioni sull'architettura MCP, consulta la sezione Architettura MCP.

    Google e Google Cloud server MCP remoti

    Google e i Google Cloud server MCP remoti hanno le seguenti funzionalità e vantaggi:

    • Rilevamento semplificato e centralizzato.
    • Endpoint HTTP globali o regionali gestiti.
    • Autorizzazione granulare.
    • Sicurezza facoltativa di prompt e risposte con la protezione Model Armor.
    • Audit logging centralizzato.

    Per informazioni su altri server MCP e sui controlli di sicurezza e governance disponibili per i server MCP di Google Cloud, consulta la panoramica dei server MCP di Google Cloud.

    Prima di iniziare

    1. Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
    2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

    3. Verify that billing is enabled for your Google Cloud project.

    4. Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. Click Grant access.
      4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

      5. Click Select a role, then search for the role.
      6. To grant additional roles, click Add another role and add each additional role.
      7. Click Save.
    5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

    6. Verify that billing is enabled for your Google Cloud project.

    7. Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. Click Grant access.
      4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

      5. Click Select a role, then search for the role.
      6. To grant additional roles, click Add another role and add each additional role.
      7. Click Save.
    8. Abilita l'API Compute Engine

      Abilita l'API Compute Engine

    Ruoli obbligatori

    Per ottenere le autorizzazioni necessarie per utilizzare il server MCP remoto di Compute Engine, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto Google Cloud :

    • Effettua chiamate allo strumento MCP: MCP Tool User (roles/mcp.toolUser)

    Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

    Questi ruoli predefiniti contengono le autorizzazioni necessarie per utilizzare il server MCP remoto di Compute Engine. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

    Autorizzazioni obbligatorie

    Per utilizzare il server MCP remoto di Compute Engine sono necessarie le seguenti autorizzazioni:

    • Effettua chiamate allo strumento MCP: mcp.tools.call

    Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

    Devi anche disporre dei ruoli e delle autorizzazioni necessari per eseguire le operazioni di Compute Engine. Per saperne di più, consulta Ruoli e autorizzazioni di Compute Engine.

    Autenticazione e autorizzazione

    I server MCP di Compute Engine utilizzano il protocollo OAuth 2.0 con Identity and Access Management (IAM) per l'autenticazione e l'autorizzazione. Tutte le identitàGoogle Cloud sono supportate per l'autenticazione ai server MCP.

    Ti consigliamo di creare un'identità separata per gli agenti che utilizzano gli strumenti MCP in modo che l'accesso alle risorse possa essere controllato e monitorato. Per saperne di più sull'autenticazione, consulta Autenticarsi sui server MCP.

    Ambiti OAuth di Compute Engine MCP

    OAuth 2.0 utilizza ambiti e credenziali per determinare se un principal autenticato è autorizzato a eseguire un'azione specifica su una risorsa. Per saperne di più sugli ambiti OAuth 2.0 in Google, leggi Utilizzare OAuth 2.0 per accedere alle API di Google.

    Compute Engine ha i seguenti ambiti OAuth dello strumento MCP:

    URI dell'ambito per gcloud CLI Descrizione
    https://www.googleapis.com/auth/compute.read-only Consente solo l'accesso in lettura ai dati.
    https://www.googleapis.com/auth/compute.read-write Consente l'accesso per leggere e modificare i dati.

    Potrebbero essere necessari ambiti aggiuntivi per le risorse a cui si accede durante una chiamata allo strumento. Per visualizzare un elenco degli ambiti richiesti per Compute Engine, consulta API Compute Engine.

    Configura un client MCP per utilizzare il server MCP di Compute Engine

    Le applicazioni e gli agenti AI, come Claude o Gemini CLI, possono creare un client MCP che si connette a un singolo server MCP. Un'applicazione AI può avere più client che si connettono a server MCP diversi. Per connettersi a un server MCP remoto, il client MCP deve conoscere l'URL del server MCP remoto.

    Nella tua applicazione AI, cerca un modo per connetterti a un server MCP remoto. Ti viene chiesto di inserire i dettagli del server, ad esempio il nome e l'URL.

    Per il server MCP di Compute Engine, inserisci quanto segue in base alle tue esigenze:

    • Nome server: server MCP di Compute Engine
    • URL server o Endpoint: https://compute.googleapis.com/mcp
    • Trasporto: HTTP
    • Dettagli di autenticazione: a seconda di come vuoi autenticarti, puoi inserire le tue Google Cloud credenziali, l'ID client e il client secret OAuth oppure un'identità e le credenziali dell'agente. Per saperne di più sull'autenticazione, consulta Autenticarsi sui server MCP.

    Per indicazioni specifiche per l'host sulla configurazione e la connessione al server MCP, vedi quanto segue:

    Per indicazioni più generali, consulta le seguenti risorse:

    Strumenti disponibili

    Per visualizzare i dettagli degli strumenti MCP disponibili e le relative descrizioni per il server MCP di Compute Engine, consulta il riferimento MCP di Compute Engine.

    Strumenti per le liste

    Utilizza lo strumento di ispezione MCP per elencare gli strumenti o invia una richiesta HTTP tools/list direttamente al server MCP remoto di Compute Engine. Il metodo tools/list non richiede l'autenticazione.

    POST /mcp HTTP/1.1
    Host: compute.googleapis.com
    Content-Type: application/json
    
    {
      "jsonrpc": "2.0",
      "method": "tools/list",
    }
    

    Esempi di casi d'uso

    I seguenti casi d'uso di esempio descrivono come puoi utilizzare il server MCP di Compute Engine per gestire le risorse Compute Engine:

    • Ispezionare e gestire le risorse. Ad esempio, per comprendere l'allocazione e la configurazione delle risorse nel tuo progetto, puoi elencare tutte le istanze di Compute. Puoi anche trovare tutte le istanze di calcolo in esecuzione in una zona a cui è collegato un acceleratore specifico e mostrare la loro posizione e il loro nome per la gestione delle risorse.
    • Esegui la pulizia delle risorse non utilizzate per ridurre i costi operativi. Ad esempio, identifica e libera spazio dagli snapshot del disco in una zona che non sono più associati a un disco di origine oppure identifica ed elimina le istanze VM arrestate a cui sono collegate risorse GPU costose.
    • Ottimizza il rendimento dell'istanza. Ad esempio, ridimensiona un'istanza VM con provisioning insufficiente a un tipo di macchina più grande della stessa famiglia e conferma l'aggiornamento riuscito.
    • Esegui il provisioning di VM specializzate per i workload di AI con flessibilità di zona. Ad esempio, crea un'istanza VM con un acceleratore GPU specifico collegato, in qualsiasi zona di una regione specificata in cui è disponibile.
    • Risolvi i problemi e convalida le configurazioni delle istanze. Ad esempio, recupera i dettagli di configurazione per una VM specifica in cui il job è bloccato, riavviala e conferma che l'acceleratore e il disco sottostanti siano collegati.

    Prompt di esempio

    Di seguito sono riportati alcuni prompt di esempio che puoi utilizzare per eseguire attività utilizzando il server MCP di Compute Engine:

    • Elenca tutte le VM in PROJECT_ID, inclusi il nome e la zona della VM.
    • Mostra i dettagli dell'istanza per VM_NAME.
    • In REGION, trova tutti gli snapshot dei dischi per i quali il disco di origine non esiste più.
    • Cambia il tipo di macchina di VM_NAME con il tipo di macchina più grande successivo nella stessa famiglia di macchine, invia una notifica quando torna online e conferma il nuovo tipo di macchina.
    • Trova tutte le VM in esecuzione in REGION con acceleratori NVIDIA e mostra la zona e il nome di queste VM.
    • Crea una VM in ZONE con un acceleratore NVIDIA T4 collegato. Assegna alla VM il nome my-nvidiat4-vm.
    • Trova tutte le VM arrestate in REGION con acceleratori NVIDIA Tesla T4 ed eliminale.

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto Google Cloud .
    • REGION: il nome della regione in cui esistono le tue risorse.
    • ZONE: il nome della zona in cui si trovano le VM.
    • VM_NAME: il nome dell'istanza VM.

    Configurazioni di sicurezza facoltative

    MCP introduce nuovi rischi e considerazioni sulla sicurezza a causa dell'ampia varietà di azioni che puoi eseguire con gli strumenti MCP. Per ridurre al minimo e gestire questi rischi, Google Cloud offre impostazioni predefinite e criteri personalizzabili per controllare l'utilizzo degli strumenti MCP nella tua organizzazione o nel tuo progetto Google Cloud.

    Per saperne di più sulla sicurezza e sulla governance di MCP, consulta Sicurezza e protezione dell'AI.

    Utilizzare Model Armor

    Model Armor è un servizioGoogle Cloud progettato per migliorare la sicurezza delle tue applicazioni di AI. Funziona controllando in modo proattivo i prompt e le risposte degli LLM, proteggendo da vari rischi e supportando pratiche di AI responsabile. Che tu stia eseguendo il deployment dell'AI nel tuo ambiente cloud o su provider cloud esterni, Model Armor può aiutarti a prevenire input dannosi, verificare la sicurezza dei contenuti, proteggere i dati sensibili, mantenere la conformità e applicare le tue norme di sicurezza dell'AI in modo coerente nel tuo panorama AI diversificato.

    Model Armor è disponibile solo in località regionali specifiche. Se Model Armor è abilitato per un progetto e una chiamata a quel progetto proviene da una regione non supportata, Model Armor effettua una chiamata tra regioni. Per maggiori informazioni, vedi Località di Model Armor.

    Abilita Model Armor

    Prima di poter utilizzare Model Armor, devi abilitare le API Model Armor.

    Console

    1. Abilita l'API Model Armor.

      Ruoli richiesti per abilitare le API

      Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

      Abilitare l'API

    2. Seleziona il progetto in cui vuoi attivare Model Armor.

    gcloud

    Prima di iniziare, segui questi passaggi utilizzando Google Cloud CLI con l'API Model Armor:

    1. Nella console Google Cloud , attiva Cloud Shell.

      Attiva Cloud Shell

      Nella parte inferiore della console Google Cloud viene avviata una sessione di Cloud Shell e viene visualizzato un prompt della riga di comando. Cloud Shell è un ambiente shell con Google Cloud CLI già installata e con valori già impostati per il progetto corrente. L'inizializzazione della sessione può richiedere alcuni secondi.

    2. Esegui questo comando per impostare l'endpoint API per il servizio Model Armor.

      gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

      Sostituisci LOCATION con la regione in cui vuoi utilizzare Model Armor.

    Configurare la protezione per Google e Google Cloud server MCP remoti

    Per proteggere le chiamate e le risposte dello strumento MCP, puoi utilizzare le impostazioni di base di Model Armor. Un'impostazione di base definisce i filtri di sicurezza minimi che vengono applicati a tutto il progetto. Questa configurazione applica un insieme coerente di filtri a tutte le chiamate e le risposte degli strumenti MCP all'interno del progetto.

    Configura un'impostazione di base di Model Armor con la sanificazione MCP attivata. Per saperne di più, consulta Configurare le impostazioni di base di Model Armor.

    Vedi il seguente comando di esempio:

    gcloud model-armor floorsettings update \
    --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
    --enable-floor-setting-enforcement=TRUE \
    --add-integrated-services=GOOGLE_MCP_SERVER \
    --google-mcp-server-enforcement-type=INSPECT_AND_BLOCK \
    --enable-google-mcp-server-cloud-logging \
    --malicious-uri-filter-settings-enforcement=ENABLED \
    --add-rai-settings-filters='[{"confidenceLevel": "MEDIUM_AND_ABOVE", "filterType": "DANGEROUS"}]'

    Sostituisci PROJECT_ID con l'ID progetto Google Cloud .

    Tieni presente le seguenti impostazioni:

    • INSPECT_AND_BLOCK: il tipo di applicazione che ispeziona i contenuti per il server MCP di Google e blocca i prompt e le risposte che corrispondono ai filtri.
    • ENABLED: l'impostazione che attiva un filtro o l'applicazione.
    • MEDIUM_AND_ABOVE: il livello di confidenza per le impostazioni del filtro AI responsabile - Pericoloso. Puoi modificare questa impostazione, anche se valori più bassi potrebbero generare più falsi positivi. Per saperne di più, consulta Livelli di confidenza di Model Armor.

    Disattivare l'analisi del traffico MCP con Model Armor

    Se vuoi interrompere la scansione del traffico Google MCP con Model Armor, esegui questo comando:

    gcloud model-armor floorsettings update \
      --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
      --remove-integrated-services=GOOGLE_MCP_SERVER
    

    Sostituisci PROJECT_ID con l'ID progetto Google Cloud .

    Model Armor non eseguirà la scansione del traffico MCP nel progetto.

    Controllare l'utilizzo di MCP con i criteri di negazione IAM

    I criteri di negazione di Identity and Access Management (IAM) ti aiutano a proteggere Google Cloud i server MCP remoti. Configura queste policy per bloccare l'accesso indesiderato allo strumento MCP.

    Ad esempio, puoi negare o consentire l'accesso in base a:

    • Il preside
    • Proprietà degli strumenti come di sola lettura
    • L'ID client OAuth dell'applicazione

    Per saperne di più, consulta Controllare l'utilizzo di MCP con Identity and Access Management.

    Passaggi successivi