Compute Engine 원격 MCP 서버 사용

이 문서에서는 Compute Engine 원격 모델 컨텍스트 프로토콜 (MCP) 서버를 사용하여 Gemini CLI, ChatGPT, Claude, 개발 중인 커스텀 애플리케이션을 비롯한 AI 애플리케이션에 연결하는 방법을 보여줍니다. Compute Engine 원격 MCP 서버는 LLM 에이전트가 다음과 같은 다양한 인프라 관리 작업을 수행할 수 있는 포괄적인 기능 집합을 제공합니다.

  • 가상 머신 (VM) 인스턴스 관리
  • 인스턴스 그룹 관리자 및 인스턴스 템플릿 관리
  • 디스크 및 스냅샷 관리
  • 예약 및 약정에 대한 정보 가져오기 .

    Compute Engine API를 사용 설정하면 Compute Engine 원격 MCP 서버가 사용 설정됩니다.

    모델 컨텍스트 프로토콜 (MCP)은 대규모 언어 모델 (LLM)과 AI 애플리케이션 또는 에이전트가 외부 데이터 소스에 연결하는 방식을 표준화합니다. MCP 서버를 사용하면 도구, 리소스, 프롬프트를 사용하여 작업을 수행하고 백엔드 서비스에서 업데이트된 데이터를 가져올 수 있습니다.

    로컬 MCP 서버와 원격 MCP 서버의 차이점은 무엇인가요?

    로컬 MCP 서버
    일반적으로 로컬 머신에서 실행되며 동일한 기기의 서비스 간 통신에 표준 입력 및 출력 스트림 (stdio)을 사용합니다.
    원격 MCP 서버
    서비스의 인프라에서 실행되며 AI MCP 클라이언트와 MCP 서버 간의 통신을 위해 AI 애플리케이션에 HTTP 엔드포인트를 제공합니다. MCP 아키텍처에 대한 자세한 내용은 MCP 아키텍처를 참조하세요.

    Google 및 Google Cloud 원격 MCP 서버

    Google 및 Google Cloud 원격 MCP 서버에는 다음과 같은 기능과 이점이 있습니다.

    • 간소화되고 중앙 집중식 검색
    • 관리형 전역 또는 리전 HTTP 엔드포인트
    • 세부적인 승인
    • Model Armor 보호를 통한 선택적 프롬프트 및 응답 보안
    • 중앙 집중식 감사 로깅

    다른 MCP 서버에 대한 정보와 Google Cloud MCP 서버에 사용할 수 있는 보안 및 거버넌스 제어에 대한 정보는 Google Cloud MCP 서버 개요를 참조하세요.

    시작하기 전에

    1. 계정에 로그인합니다. Google Cloud 를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. Google Cloud신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
    2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

    3. Verify that billing is enabled for your Google Cloud project.

    4. Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. Click Grant access.
      4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

      5. Click Select a role, then search for the role.
      6. To grant additional roles, click Add another role and add each additional role.
      7. Click Save.
    5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Roles required to select or create a project

      • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
      • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

      Go to project selector

    6. Verify that billing is enabled for your Google Cloud project.

    7. Make sure that you have the following role or roles on the project: Compute Instance Admin (v1), Compute Security Admin, Service Account User, Service Usage Admin

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. Click Grant access.
      4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

      5. Click Select a role, then search for the role.
      6. To grant additional roles, click Add another role and add each additional role.
      7. Click Save.
    8. Compute Engine API를 사용 설정합니다.

      Compute Engine API 사용 설정

    필요한 역할

    Compute Engine 원격 MCP 서버를 사용하는 데 필요한 권한을 얻으려면 관리자에게프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요. Google Cloud

    역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

    이러한 사전 정의된 역할에는 Compute Engine 원격 MCP 서버를 사용하는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.

    필수 권한

    Compute Engine 원격 MCP 서버를 사용하려면 다음 권한이 필요합니다.

    • MCP 도구 호출: mcp.tools.call

    커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.

    Compute Engine 작업을 수행하는 데 필요한 역할 및 권한도 필요합니다. 자세한 내용은 Compute Engine 역할 및 권한을 참조하세요.

    인증 및 승인

    Compute Engine MCP 서버는 인증 및 승인을 위해 Identity and Access Management (IAM) 와 함께 OAuth 2.0 프로토콜을 사용합니다. 모든 Google Cloud ID 가 MCP 서버 인증에 지원됩니다.

    리소스에 대한 액세스를 제어하고 모니터링할 수 있도록 MCP 도구를 사용하는 에이전트에 대해 별도의 ID를 만드는 것이 좋습니다. 인증에 대한 자세한 내용은 MCP 서버 인증을 참조하세요.

    Compute Engine MCP OAuth 범위

    OAuth 2.0은 범위와 사용자 인증 정보를 사용하여 인증된 보안 주체가 리소스에 대해 특정 작업을 수행할 권한이 있는지 확인합니다. Google의 OAuth 2.0 범위에 대한 자세한 내용은 OAuth 2.0을 사용하여 Google API에 액세스를 참조하세요.

    Compute Engine에는 다음과 같은 MCP 도구 OAuth 범위가 있습니다.

    gcloud CLI의 범위 URI 설명
    https://www.googleapis.com/auth/compute.read-only 데이터 읽기 액세스만 허용합니다.
    https://www.googleapis.com/auth/compute.read-write 데이터 읽기 및 수정 액세스를 허용합니다.

    도구 호출 중에 액세스되는 리소스에 추가 범위가 필요할 수 있습니다. Compute Engine에 필요한 범위 목록을 보려면 Compute Engine API를 참조하세요.

    Compute Engine MCP 서버를 사용하도록 MCP 클라이언트 구성

    Claude 또는 Gemini CLI와 같은 AI 애플리케이션 및 에이전트는 단일 MCP 서버에 연결되는 MCP 클라이언트를 인스턴스화할 수 있습니다. AI 애플리케이션에는 서로 다른 MCP 서버에 연결되는 여러 클라이언트가 있을 수 있습니다. 원격 MCP 서버에 연결하려면 MCP 클라이언트가 원격 MCP 서버의 URL을 알고 있어야 합니다.

    AI 애플리케이션에서 원격 MCP 서버에 연결하는 방법을 찾습니다. 이름 및 URL과 같은 서버에 대한 세부정보를 입력하라는 메시지가 표시됩니다.

    Compute Engine MCP 서버의 경우 필요에 따라 다음을 입력합니다.

    • 서버 이름: Compute Engine MCP 서버
    • 서버 URL 또는 엔드포인트: https://compute.googleapis.com/mcp
    • 전송: HTTP
    • 인증 세부정보: 인증하려는 방법에 따라 사용자 인증 정보, OAuth 클라이언트 ID 및 비밀번호 또는 에이전트 ID 및 사용자 인증 정보를 입력할 수 있습니다. Google Cloud 인증에 대한 자세한 내용은 MCP 서버 인증을 참조하세요.

    MCP 서버 설정 및 연결에 대한 호스트별 안내는 다음을 참조하세요.

    일반적인 안내는 다음 리소스를 참조하세요.

    사용 가능한 도구

    Compute Engine MCP 서버에 사용 가능한 MCP 도구 및 설명의 세부정보를 보려면 Compute Engine MCP 참조를 확인하세요.

    도구 나열

    MCP 검사기를 사용하여 도구를 나열하거나 tools/list HTTP 요청을 Compute Engine 원격 MCP 서버로 직접 보냅니다. tools/list 메서드에는 인증이 필요하지 않습니다.

    POST /mcp HTTP/1.1
    Host: compute.googleapis.com
    Content-Type: application/json
    
    {
      "jsonrpc": "2.0",
      "method": "tools/list",
    }
    

    사용 사례

    다음 샘플 사용 사례에서는 Compute Engine MCP 서버를 사용하여 Compute Engine 리소스를 관리하는 방법을 설명합니다.

    • 리소스 검사 및 관리. 예를 들어 프로젝트의 리소스 할당 및 구성을 파악하려면 모든 컴퓨팅 인스턴스를 나열하면 됩니다. 또한 특정 가속기가 연결된 영역에서 실행 중인 모든 컴퓨팅 인스턴스를 찾고 리소스 관리를 위해 위치와 이름을 표시할 수 있습니다.
    • 미사용 리소스를 정리하여 운영 비용 절감. 예를 들어 더 이상 소스 디스크와 연결되지 않은 영역의 디스크 스냅샷을 식별하고 정리하거나 비용이 많이 드는 GPU 리소스가 연결된 중지된 VM 인스턴스를 식별하고 삭제합니다.
    • 인스턴스 성능 최적화. 예를 들어 프로비저닝이 부족한 VM 인스턴스의 크기를 동일한 제품군의 더 큰 머신 유형으로 조정하고 업데이트가 성공적으로 완료되었는지 확인합니다.
    • 영역 유연성을 갖춘 AI 워크로드용 특수 VM 프로비저닝. 예를 들어 지정된 리전의 사용 가능한 영역에 특정 GPU 가속기가 연결된 VM 인스턴스를 만듭니다.
    • 인스턴스 구성 문제 해결 및 검증. 예를 들어 작업이 중지된 특정 VM 인스턴스의 구성 세부정보를 가져오고, 재부팅하고, 기본 가속기와 디스크가 연결되어 있는지 확인합니다.

    샘플 프롬프트

    다음은 Compute Engine MCP 서버를 사용하여 작업을 수행하는 데 사용할 수 있는 샘플 프롬프트입니다.

    • VM 이름 및 영역을 포함하여 PROJECT_ID의 모든 VM을 나열합니다.
    • VM_NAME의 인스턴스 세부정보를 표시합니다.
    • REGION에서 소스 디스크가 더 이상 존재하지 않는 모든 디스크 스냅샷을 찾습니다.
    • VM_NAME의 머신 유형을 동일한 머신 제품군의 다음으로 큰 머신 유형으로 변경하고, 다시 온라인 상태가 되면 알림을 보내고, 새 머신 유형을 확인합니다.
    • NVIDIA 가속기가 있는 REGION에서 실행 중인 모든 VM을 찾고 이러한 VM의 영역과 이름을 표시합니다.
    • NVIDIA T4 가속기가 연결된 ZONE에 VM을 만듭니다. VM 이름을 my-nvidiat4-vm으로 지정합니다.
    • NVIDIA Tesla T4 가속기가 있는 REGION에서 중지된 모든 VM을 찾아 삭제합니다.

    다음을 바꿉니다.

    • PROJECT_ID: Google Cloud 프로젝트 ID
    • REGION: 리소스가 있는 리전의 이름
    • ZONE: VM이 있는 영역의 이름
    • VM_NAME: VM 인스턴스의 이름

    선택적 보안 및 안전 구성

    MCP는 MCP 도구로 수행할 수 있는 다양한 작업으로 인해 새로운 보안 위험과 고려사항을 도입합니다. 이러한 위험을 최소화하고 관리하기 위해 Google Cloud 조직 또는 프로젝트에서 MCP 도구 사용을 제어하는 기본 설정과 맞춤설정 가능한 정책을 제공합니다. Google Cloud

    MCP 보안 및 거버넌스에 대한 자세한 내용은 AI 보안 및 안전을 참조하세요.

    Model Armor 사용

    Model Armor는 AI 애플리케이션의 보안과 안전을 강화하도록 설계된 Google Cloud 서비스입니다. LLM 프롬프트와 응답을 사전에 검사하여 다양한 위험으로부터 보호하고 책임감 있는 AI 관행을 지원합니다. 클라우드 환경 또는 외부 클라우드 제공업체에 AI를 배포하는 경우 Model Armor를 사용하면 악의적인 입력을 방지하고, 콘텐츠 안전을 확인하고, 민감한 정보를 보호하고, 규정 준수를 유지하고, 다양한 AI 환경에서 AI 안전 및 보안 정책을 일관되게 적용할 수 있습니다.

    Model Armor는 특정 리전 위치에서만 사용할 수 있습니다. 프로젝트에 Model Armor가 사용 설정되어 있고 지원되지 않는 리전에서 해당 프로젝트로 호출이 발생하면 Model Armor가 리전 간 호출을 수행합니다. 자세한 내용은 Model Armor 위치를 참조하세요.

    Model Armor 사용 설정

    Model Armor를 사용하려면 먼저 Model Armor API를 사용 설정해야 합니다.

    콘솔

    1. Model Armor API를 사용 설정합니다.

      API 사용 설정에 필요한 역할

      API를 사용 설정하려면 serviceusage.services.enable 권한이 포함된 서비스 사용량 관리자 IAM 역할(roles/serviceusage.serviceUsageAdmin)이 필요합니다. 역할 부여 방법 알아보기

      API 사용 설정하기

    2. Model Armor를 활성화할 프로젝트를 선택합니다.

    gcloud

    시작하기 전에 Model Armor API와 함께 Google Cloud CLI를 사용하여 다음 단계를 따르세요.

    1. 콘솔에서 Cloud Shell을 활성화합니다. Google Cloud

      Cloud Shell 활성화

      콘솔 하단에 Cloud Shell 세션이 시작되고 명령줄 프롬프트가 표시됩니다. Google Cloud Cloud Shell은 Google Cloud CLI가 사전 설치된 셸 환경으로, 현재 프로젝트의 값이 이미 설정되어 있습니다. 세션이 초기화되는 데 몇 초 정도 걸릴 수 있습니다.

    2. 다음 명령어를 실행하여 Model Armor 서비스의 API 엔드포인트를 설정합니다.

      gcloud config set api_endpoint_overrides/modelarmor "https://modelarmor.LOCATION.rep.googleapis.com/"

      LOCATION을 Model Armor를 사용하려는 리전으로 바꿉니다.

    Google 및 Google Cloud 원격 MCP 서버 보호 구성

    MCP 도구 호출 및 응답을 보호하려면 Model Armor 최소 기준 설정을 사용하면 됩니다. 최소 기준 설정은 프로젝트 전체에 적용되는 최소 보안 필터를 정의합니다. 이 구성은 프로젝트 내의 모든 MCP 도구 호출 및 응답에 일관된 필터 집합을 적용합니다.

    MCP 삭제가 사용 설정된 Model Armor 최소 기준 설정을 구성합니다. 자세한 내용은 Model Armor 최소 기준 설정 구성을 참조하세요.

    다음 명령어 예를 살펴보세요.

    gcloud model-armor floorsettings update \
    --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
    --enable-floor-setting-enforcement=TRUE \
    --add-integrated-services=GOOGLE_MCP_SERVER \
    --google-mcp-server-enforcement-type=INSPECT_AND_BLOCK \
    --enable-google-mcp-server-cloud-logging \
    --malicious-uri-filter-settings-enforcement=ENABLED \
    --add-rai-settings-filters='[{"confidenceLevel": "MEDIUM_AND_ABOVE", "filterType": "DANGEROUS"}]'

    PROJECT_ID를 Google Cloud 프로젝트 ID로 바꿉니다.

    다음 설정을 참고하세요.

    • INSPECT_AND_BLOCK: Google MCP 서버의 콘텐츠를 검사하고 필터와 일치하는 프롬프트와 응답을 차단하는 적용 유형입니다.
    • ENABLED: 필터 또는 적용을 사용 설정하는 설정입니다.
    • MEDIUM_AND_ABOVE: 책임감 있는 AI - 위험 필터 설정의 신뢰 수준입니다. 이 설정을 수정할 수 있지만, 값이 낮으면 거짓양성이 더 많이 발생할 수 있습니다. 자세한 내용은 Model Armor 신뢰 수준을 참조하세요.

    Model Armor로 MCP 트래픽 검사 사용 중지

    Model Armor로 Google MCP 트래픽 검사를 중지하려면 다음 명령어를 실행하세요.

    gcloud model-armor floorsettings update \
      --full-uri='projects/PROJECT_ID/locations/global/floorSetting' \
      --remove-integrated-services=GOOGLE_MCP_SERVER
    

    PROJECT_ID를 Google Cloud 프로젝트 ID로 바꿉니다.

    Model Armor는 프로젝트에서 MCP 트래픽을 검사하지 않습니다.

    IAM 거부 정책으로 MCP 사용 제어

    Identity and Access Management (IAM) 거부 정책은 원격 MCP 서버를 보호 Google Cloud 하는 데 도움이 됩니다. 원치 않는 MCP 도구 액세스를 차단하도록 이러한 정책을 구성합니다.

    예를 들어 다음을 기준으로 액세스를 거부하거나 허용할 수 있습니다.

    • 보안 주체
    • 읽기 전용과 같은 도구 속성
    • 애플리케이션의 OAuth 클라이언트 ID

    자세한 내용은 Identity and Access Management로 MCP 사용 제어를 참조하세요.

    다음 단계