Agent Platform Workbench 인스턴스에 예약 사용

이 문서에서는 Compute Engine 예약 을 사용하여 Gemini Enterprise Agent Platform Workbench 인스턴스에 실행에 필요한 가상 머신 (VM) 리소스가 충분한지 확인하는 방법을 설명합니다.

예약은 Compute Engine 기능입니다. 예약을 사용하면 필요할 때마다 동일한 하드웨어(메모리 및 vCPU)와 선택적 리소스(GPU 및 로컬 SSD 디스크)를 사용하여 VM을 만들 수 있는 리소스를 확보할 수 있습니다.

예약을 만들 때 Compute Engine은 지정된 영역에서 요청된 용량을 사용할 수 있는지 확인합니다. 사용할 수 있으면 Compute Engine이 리소스를 예약하고, 예약을 만든 후 다음 작업이 수행됩니다.

  • 예약된 리소스는 즉시 사용할 수 있으며 예약이 삭제될 때까지 계속 사용할 수 있습니다.

  • 예약된 리소스는 예약이 삭제될 때까지 적용 가능한 할인을 포함하여 실행 중인 VM과 동일한 주문형 가격으로 청구됩니다. 예약에는 예약된 리소스 비용이 이미 청구되었기 때문에 예약을 사용하는 동안 VM에 중복 리소스 요금이 발생하지 않습니다. 자세한 내용은 Compute Engine 영역별 리소스 예약을 참조하세요.

제한사항 및 요구사항

Agent Platform Workbench 인스턴스에 예약이 사용될 때는 Compute Engine 예약의 모든 제한사항이 적용됩니다. 자세한 내용은 예약 작동 방식 을 참조하세요.

또한 Agent Platform Workbench 인스턴스에 예약을 사용할 때는 다음과 같은 제한사항 및 요구사항이 적용됩니다.

  • 예약은 다음 중 하나여야 합니다.

    • Agent Platform Workbench 인스턴스와 동일한 프로젝트에 있습니다.
    • Agent Platform Workbench 인스턴스와 동일한 프로젝트와 공유됩니다.
  • 예약을 사용하려면 예약의 VM 속성이 Agent Platform Workbench 인스턴스와 정확하게 일치해야 합니다. 예를 들어 예약에 e2-standard-8 머신 유형이 지정된 경우에는 e2-standard-8 머신 유형을 사용하는 경우에만 Agent Platform Workbench 인스턴스가 해당 예약을 사용할 수 있습니다. 요구사항 참조.

시작하기 전에

  1. 예약은 요구사항제한사항을 참고하세요.
  2. 공유 예약은 할당량 요구사항 제한사항을 참고하세요.
  3. 계정에 로그인합니다. Google Cloud 를 처음 사용하는 경우 Google Cloud, 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

필요한 역할

Agent Platform Workbench 인스턴스에 예약을 사용하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

예약 만들기

Compute Engine 예약을 만듭니다. 이 예약은 단일 프로젝트 예약 또는 공유 예약일 수 있습니다. 예약은 주문형 또는 미래용 예약일 수 있습니다. 자세한 내용은 예약 유형 선택을 참고하세요.

새 인스턴스에 예약 사용

예약을 사용하는 Agent Platform Workbench 인스턴스를 만들려면 콘솔 또는 REST API를 사용하면 됩니다. Google Cloud

콘솔

예약을 사용하는 Agent Platform Workbench 인스턴스를 만들려면 다음을 수행하세요.

  1. 콘솔에서 인스턴스 페이지로 이동합니다. Google Cloud

    인스턴스로 이동

  2. 새로 만들기를 클릭합니다.

  3. 새 인스턴스 대화상자에서 고급 옵션을 클릭합니다.

  4. 인스턴스 만들기 대화상자의 머신 유형 섹션에서 예약과 일치하는 머신 유형 및 GPU 구성을 선택합니다.

  5. CPU 플랫폼 및 GPU예약 메뉴에서 사용할 예약을 선택합니다.

  6. 만들기 를 클릭합니다.

    Agent Platform Workbench에서 인스턴스를 만들고 자동으로 시작합니다. 인스턴스를 사용할 수 있으면 Agent Platform Workbench에서 JupyterLab 열기 링크를 활성화합니다.

REST

요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • PROJECT_ID: 프로젝트 ID입니다.
  • LOCATION: 인스턴스가 있는 영역입니다.
  • INSTANCE_NAME: 인스턴스의 이름입니다.
  • MACHINE_TYPE: 인스턴스의 머신 유형입니다.
  • RESERVATION_TYPE: 예약 유형이며 RESERVATION_ANY 또는 RESERVATION_SPECIFIC이어야 합니다.
  • RESERVATION_NAME: 유형을 사용할 때 예약의 이름입니다.RESERVATION_SPECIFIC
    • 동일한 프로젝트의 예약의 경우 예약 ID를 사용할 수 있습니다.
    • 다른 프로젝트의 예약의 경우 전체 예약 경로를 사용해야 합니다. 예를 들면 projects/PROJECT_ID/reservations/RESERVATION_NAME입니다.

HTTP 메서드 및 URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

JSON 요청 본문:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
요청이 성공하면 응답 본문에 Operation의 인스턴스가 포함됩니다.

자세한 내용은projects.locations.instances.create REST API 문서를 참조하세요.

예약 사용 중지

예약 사용을 중지하려면 예약을 삭제하면 됩니다.

다른 리소스에 예약을 계속 사용하고 싶지만 기존 Agent Platform Workbench 인스턴스에 사용되지 않도록 하려면 인스턴스를 삭제해야 합니다.

결제

Compute Engine 예약을 사용하면 다음 요금이 청구됩니다.

  • Compute Engine 가격 책정의 Compute Engine 리소스(해당하는 약정 사용 할인(CUD) 포함). 이러한 청구에는 SKU에 goog-vertex-ai-product: workbench-instances 라벨이 있습니다. Compute Engine 가격 책정을 참조하세요.

  • 인프라 사용량 외에도 Agent Platform Workbench 관리 수수료가 있습니다. Agent Platform Workbench 가격 책정을 참조하세요.

문제 해결

Agent Platform Workbench 인스턴스에서 예약을 사용하는 것과 관련된 오류를 진단하고 해결하는 방법은 Agent Platform Workbench 인스턴스 문제 해결을 참조하세요.

다음 단계