Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Usa el servidor de MCP remoto de Compute Engine

En este documento, se muestra cómo usar el servidor remoto del Protocolo de contexto del modelo (MCP) de Compute Engine para conectarte con aplicaciones de IA, incluidas la CLI de Gemini, ChatGPT, Claude y las aplicaciones personalizadas que desarrolles. El servidor de MCP remoto de Compute Engine proporciona un conjunto integral de capacidades que permiten a los agentes de LLM realizar una variedad de tareas de administración de infraestructura, incluidas las siguientes:

Administrar instancias de máquina virtual (VM)
Administrar administradores de grupos de instancias y plantillas de instancias
Administrar discos e instantáneas

Recupera información sobre las reservas y los compromisos. El servidor MCP remoto de Compute Engine se habilita cuando habilitas la API de Compute Engine.

El estándar del Protocolo de contexto del modelo (MCP) estandariza la forma en que los modelos de lenguaje grandes (LLM) y las aplicaciones o los agentes de IA se conectan a fuentes de datos externas. Los servidores de MCP te permiten usar sus herramientas, recursos y mensajes para realizar acciones y obtener datos actualizados de su servicio de backend.

¿Cuál es la diferencia entre los servidores de MCP locales y remotos?

Servidores de MCP locales: Por lo general, se ejecutan en tu máquina local y usan los flujos de entrada y salida estándar (stdio) para la comunicación entre servicios en el mismo dispositivo.
Servidores de MCP remotos: Se ejecutan en la infraestructura del servicio y ofrecen un extremo HTTP a las aplicaciones de IA para la comunicación entre el cliente de MCP de IA y el servidor de MCP. Para obtener más información sobre la arquitectura de MCP, consulta Arquitectura de MCP.

Servidores de MCP remotos y de Google Cloud Google

Los servidores de MCP remotos de Google y Google Cloud tienen las siguientes funciones y beneficios:

Descubrimiento simplificado y centralizado
Extremos HTTP administrados globales o regionales
Autorización detallada
Seguridad opcional de instrucciones y respuestas con protección de Model Armor
Registro de auditoría centralizado

Para obtener información sobre otros servidores de MCP y sobre los controles de seguridad y administración disponibles para los servidores de MCP de Google Cloud, consulta la descripción general de los servidores de MCP de Google Cloud.

Antes de comenzar

Accede a tu cuenta de Google Cloud . Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

Check for the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

Grant the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
Click Grant access.
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
Click Select a role, then search for the role.
To grant additional roles, click Add another role and add each additional role.
Click Save.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

Check for the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

Grant the roles

In the Google Cloud console, go to the IAM page.
Go to IAM
Select the project.
Click Grant access.
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
Click Select a role, then search for the role.
To grant additional roles, click Add another role and add each additional role.
Click Save.

Habilita la API de Compute Engine.
Habilitar la API de Compute Engine

Roles obligatorios

Para obtener los permisos que necesitas para usar el servidor MCP remoto de Compute Engine, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto Google Cloud :

Realizar llamadas a la herramienta de MCP: Usuario de la herramienta de MCP (roles/mcp.toolUser)

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Estos roles predefinidos contienen los permisos necesarios para usar el servidor MCP remoto de Compute Engine. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para usar el servidor MCP remoto de Compute Engine:

Realiza llamadas a la herramienta de MCP: mcp.tools.call

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

También necesitas los roles y permisos necesarios para realizar las operaciones de Compute Engine. Para obtener más información, consulta Roles y permisos de Compute Engine.

Autenticación y autorización

Los servidores de MCP de Compute Engine usan el protocolo OAuth 2.0 con Identity and Access Management (IAM) para la autenticación y la autorización. Se admiten todas las Google Cloud identidades para la autenticación en los servidores de MCP.

Te recomendamos que crees una identidad independiente para los agentes que usan herramientas de MCP, de modo que se pueda controlar y supervisar el acceso a los recursos. Para obtener más información sobre la autenticación, consulta Autenticación en servidores de MCP.

Permisos de OAuth de MCP de Compute Engine

OAuth 2.0 usa permisos y credenciales para determinar si un principal autenticado está autorizado a realizar una acción específica en un recurso. Si deseas obtener más información sobre los permisos de OAuth 2.0 en Google, consulta Usa OAuth 2.0 para acceder a las APIs de Google.

Compute Engine tiene los siguientes permisos de OAuth de la herramienta de MCP:

URI del alcance para gcloud CLI	Descripción
`https://www.googleapis.com/auth/compute.read-only`	Solo permite el acceso de lectura a los datos.
`https://www.googleapis.com/auth/compute.read-write`	Permite el acceso para leer y modificar datos.

Es posible que se requieran alcances adicionales en los recursos a los que se accede durante una llamada a la herramienta. Para ver una lista de los permisos necesarios para Compute Engine, consulta la API de Compute Engine.

Configura un cliente de MCP para que use el servidor de MCP de Compute Engine

Las aplicaciones y los agentes de IA, como Claude o Antigravity, pueden crear instancias de un cliente de MCP que se conecta a un solo servidor de MCP. Una aplicación de IA puede tener varios clientes que se conectan a diferentes servidores de MCP. Si tu aplicación no aparece en la guía específica para el cliente, puedes usar la siguiente información para conectarte desde la mayoría de las aplicaciones.

En tu aplicación de IA, busca una forma de agregar o conectarte a un servidor de MCP remoto. Para el servidor de MCP de Compute Engine, ingresa la siguiente información según sea necesario:

Nombre del servidor: Servidor de MCP de Compute Engine
URL del servidor o Extremo: https://compute.googleapis.com/mcp
Transporte: HTTP
Detalles de autenticación: Según cómo desees autenticarte, puedes ingresar tus Google Cloud credenciales, tu ID y secreto de cliente de OAuth, o bien la identidad y las credenciales de un agente. Para obtener más información sobre la autenticación, consulta Cómo autenticarse en los servidores de MCP.

Redirecciona los URI

En el caso de las aplicaciones basadas en la Web y algunas aplicaciones de escritorio, debes incluir en la lista de entidades permitidas un URI de redireccionamiento cuando crees un ID y un secreto de cliente para la autenticación. El servidor de autorización usa los URIs de redireccionamiento para enviar tokens a tu aplicación. La documentación de tu aplicación debe especificar el URI de redireccionamiento que debes usar. No se admiten los URIs de redireccionamiento personalizados.

Para obtener orientación específica de la aplicación sobre cómo configurar y conectarse al servidor de MCP, consulta Orientación específica del cliente.

Para obtener orientación más general, consulta los siguientes recursos:

Herramientas disponibles

Para ver los detalles de las herramientas de MCP disponibles y sus descripciones para el servidor de MCP de Compute Engine, consulta la referencia de MCP de Compute Engine.

Herramientas de lista

Usa el inspector de MCP para enumerar herramientas o envía una solicitud HTTP tools/list directamente al servidor MCP remoto de Compute Engine. El método tools/list no requiere autenticación.

POST /mcp HTTP/1.1
Host: compute.googleapis.com
Content-Type: application/json

{
  "jsonrpc": "2.0",
  "method": "tools/list",
}

Ejemplos de casos de uso

En los siguientes casos de uso de ejemplo, se describe cómo puedes usar el servidor del MCP de Compute Engine para administrar recursos de Compute Engine:

Inspecciona y administra recursos. Por ejemplo, para comprender la asignación y la configuración de recursos en tu proyecto, puedes enumerar todas las instancias de procesamiento. También puedes encontrar todas las instancias de procesamiento en ejecución en una zona que tengan un acelerador específico adjunto y mostrar su ubicación y nombre para la administración de recursos.
Limpia los recursos que no se usen para reducir los costos operativos. Por ejemplo, identifica y limpia las instantáneas de disco en una zona que ya no están asociadas con un disco de origen, o bien identifica y borra las instancias de VM detenidas que tienen recursos de GPU costosos adjuntos.
Optimiza el rendimiento de la instancia. Por ejemplo, cambia el tamaño de una instancia de VM con capacidad insuficiente a un tipo de máquina más grande de la misma familia y confirma que la actualización se realizó correctamente.
Aprovisiona VMs especializadas para cargas de trabajo de IA con flexibilidad de zona. Por ejemplo, crea una instancia de VM con un acelerador de GPU específico conectado en cualquier zona de una región especificada en la que esté disponible.
Soluciona problemas y valida la configuración de instancias. Por ejemplo, recupera los detalles de configuración de una instancia de VM específica en la que el trabajo está inactivo, reiníciala y confirma que el acelerador y el disco subyacentes estén conectados.

Ejemplos de instrucciones

A continuación, se muestran ejemplos de instrucciones que puedes usar para realizar tareas con el servidor de MCP de Compute Engine:

"Enumera todas las VMs en PROJECT_ID, incluidos el nombre y la zona de la VM".
"Muestra los detalles de la instancia de VM_NAME".
"En REGION, busca todas las instantáneas de disco para las que ya no existe el disco de origen".
Cambia el tipo de máquina de VM_NAME al siguiente tipo de máquina más grande de la misma familia de máquinas, envía una notificación cuando vuelva a estar en línea y confirma el nuevo tipo de máquina.
"Encuentra todas las VMs en ejecución en REGION con aceleradores de NVIDIA y muestra la zona y el nombre de estas VMs".
"Crea una VM en ZONE con un acelerador NVIDIA T4 conectado. Asigna el nombre my-nvidiat4-vm a la VM".
"Busca todas las VMs detenidas en REGION con aceleradores NVIDIA Tesla T4 y bórralas".

Reemplaza lo siguiente:

PROJECT_ID: Es el ID del proyecto de Google Cloud .
REGION: Es el nombre de la región en la que existen tus recursos.
ZONE: Es el nombre de la zona en la que existen tus VMs.
VM_NAME por el nombre de tu instancia de VM.

Configuraciones opcionales de seguridad

La MCP introduce nuevos riesgos y consideraciones de seguridad debido a la gran variedad de acciones que puedes realizar con las herramientas de MCP. Para minimizar y administrar estos riesgos,Google Cloud ofrece parámetros de configuración predeterminados y políticas personalizables para controlar el uso de las herramientas de MCP en tu organización o proyecto de Google Cloud.

Para obtener más información sobre la seguridad y la administración de la MCP, consulta Seguridad y protección de la IA.

Usa Model Armor

Model Armor es unGoogle Cloud servicio diseñado para mejorar la seguridad de tus aplicaciones de IA. Funciona analizando de forma proactiva las instrucciones y respuestas de los LLM, protegiendo contra diversos riesgos y respaldando prácticas de IA responsable. Ya sea que implementes IA en tu entorno de nube o en proveedores de servicios en la nube externos, Model Armor puede ayudarte a evitar entradas maliciosas, verificar la seguridad del contenido, proteger datos sensibles, mantener el cumplimiento y aplicar tus políticas de seguridad de la IA de manera coherente en todo tu diverso panorama de IA.

Cuando Model Armor está habilitado con el registro habilitado, Model Armor registra toda la carga útil. Esto podría exponer información sensible en tus registros.

Habilita Model Armor

Para poder usar las APIs de Model Armor, debes habilitarlas.

Console

Habilita la API de Model Armor.
Roles necesarios para habilitar las APIs
Para habilitar APIs, necesitas el permiso serviceusage.services.enable. Si creaste el proyecto, es probable que ya tengas este permiso a través del rol de propietario (roles/owner). De lo contrario, puedes obtener este permiso a través del rol de administrador de Service Usage (roles/serviceusage.serviceUsageAdmin). Obtén más información para otorgar roles.
Habilitar la API
Elige el proyecto en el que quieres activar Model Armor.

gcloud

Antes de empezar, sigue estos pasos a través de la Google Cloud CLI con la API de Model Armor:

En la consola de Google Cloud , activa Cloud Shell.

Activa Cloud Shell

En la parte inferior de la consola de Google Cloud , se inicia una sesión de Cloud Shell en la que se muestra una ventana de línea de comandos. Cloud Shell es un entorno de shell con Google Cloud CLI ya instalada y con valores ya establecidos para el proyecto actual. La sesión puede tardar unos segundos en inicializarse.
Ejecuta el siguiente comando para configurar el extremo de API del servicio de Model Armor.
```
gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"
```
Reemplaza LOCATION por la región en la que quieres usar Model Armor.

Configura la protección para los servidores de MCP remotos y de Google Google Cloud

Para proteger las llamadas y respuestas de las herramientas de MCP, puedes usar la configuración mínima de Model Armor. Un parámetro de configuración mínimo define los filtros de seguridad mínimos que se aplican en todo el proyecto. Esta configuración aplica un conjunto coherente de filtros a todas las llamadas y respuestas de herramientas de MCP dentro del proyecto.

Configura un ajuste mínimo de Model Armor con la limpieza de MCP habilitada. Para obtener más información, consulta Configura la configuración mínima de Model Armor.

Consulta el siguiente comando de ejemplo:

gcloud model-armor floorsettings update \
--full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
--enable-floor-setting-enforcement=TRUE \
--add-integrated-services=GOOGLE_MCP_SERVER \
--google-mcp-server-enforcement-type=INSPECT_AND_BLOCK \
--enable-google-mcp-server-cloud-logging \
--malicious-uri-filter-settings-enforcement=ENABLED \
--add-rai-settings-filters='[{"confidenceLevel": "MEDIUM_AND_ABOVE", "filterType": "DANGEROUS"}]'

Reemplaza PROJECT_ID por el ID del proyecto de Google Cloud .

Ten en cuenta los siguientes parámetros de configuración:

INSPECT_AND_BLOCK: Es el tipo de aplicación que inspecciona el contenido del servidor de MCP de Google y bloquea las instrucciones y las respuestas que coinciden con los filtros.
ENABLED: Es el parámetro de configuración que habilita un filtro o la aplicación.
MEDIUM_AND_ABOVE: Es el nivel de confianza para la configuración del filtro de IA responsable: Peligroso. Puedes modificar este parámetro de configuración, aunque los valores más bajos pueden generar más falsos positivos. Para obtener más información, consulta Niveles de confianza de Model Armor.

Inhabilita el análisis del tráfico de MCP con Model Armor

Para evitar que Model Armor analice automáticamente el tráfico hacia y desde los servidores de MCP de Google según la configuración mínima del proyecto, ejecuta el siguiente comando:

gcloud model-armor floorsettings update \
  --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
  --remove-integrated-services=GOOGLE_MCP_SERVER

Reemplaza PROJECT_ID por el ID del proyecto Google Cloud . Model Armor no aplica automáticamente las reglas definidas en la configuración de límite de este proyecto al tráfico de ningún servidor de MCP de Google.

La configuración general y la configuración mínima de Model Armor pueden afectar a más que solo el MCP. Dado que Model Armor se integra con servicios como Vertex AI, cualquier cambio que realices en la configuración mínima puede afectar el análisis del tráfico y los comportamientos de seguridad en todos los servicios integrados, no solo en el MCP.

Controla el uso del MCP con políticas de IAM de rechazo

Las políticas de denegación de Identity and Access Management (IAM) te ayudan a proteger los Google Cloud servidores de MCP remotos. Configura estas políticas para bloquear el acceso no deseado a las herramientas de MCP.

Por ejemplo, puedes rechazar o permitir el acceso según lo siguiente:

La entidad principal
Propiedades de la herramienta, como solo lectura
ID de cliente de OAuth de la aplicación

Para obtener más información, consulta Controla el uso del MCP con Identity and Access Management.

¿Qué sigue?

Consulta la documentación de referencia de MCP de Compute Engine.
Obtén más información sobre los servidores MCP de Google Cloud.

Usa el servidor de MCP remoto de Compute Engine Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

¿Cuál es la diferencia entre los servidores de MCP locales y remotos?

Servidores de MCP remotos y de Google Cloud Google

Antes de comenzar

Check for the roles

Grant the roles

Check for the roles

Grant the roles

Roles obligatorios

Permisos necesarios

Autenticación y autorización

Permisos de OAuth de MCP de Compute Engine

Configura un cliente de MCP para que use el servidor de MCP de Compute Engine

Redirecciona los URI

Herramientas disponibles

Herramientas de lista

Ejemplos de casos de uso

Ejemplos de instrucciones

Configuraciones opcionales de seguridad

Usa Model Armor

Habilita Model Armor

Console

gcloud

Configura la protección para los servidores de MCP remotos y de Google Google Cloud

Inhabilita el análisis del tráfico de MCP con Model Armor

Controla el uso del MCP con políticas de IAM de rechazo

¿Qué sigue?

Usa el servidor de MCP remoto de Compute Engine