이 문서에서는 A4X 머신 유형을 사용하는 관리형 인스턴스 그룹 (MIG)을 만드는 방법을 설명합니다. 이 가속기 최적화 머신 유형에 대해 자세히 알아보려면 A4X를 참고하세요.
여러 가상 머신 (VM)을 단일 항목으로 관리하려면 MIG를 만드세요. MIG에 대해 자세히 알아보려면 Compute Engine 문서의 관리형 인스턴스 그룹을 참고하세요.
VM 또는 클러스터를 만드는 다른 방법을 알아보려면 배포 옵션 개요를 참고하세요.
제한사항
A4X VM으로 MIG를 만들 때는 머신 유형과 MIG 모두의 제한사항을 고려하세요.
A4X VM 제한사항
다음과 같은 머신별 제한사항이 적용됩니다.
- 이러한 머신 유형을 사용하는 인스턴스에는 지속 사용 할인 또는 가변형 약정 사용 할인이 적용되지 않습니다. 또한 A4X Max 머신 유형은 리소스 기반 약정 사용 할인을 지원하지 않습니다.
- 특정 리전 및 영역에서만 인스턴스를 만들 수 있습니다.
- Persistent Disk (리전 또는 영역)를 사용할 수 없습니다. Google Cloud Hyperdisk만 사용할 수 있습니다.
- 이러한 머신 유형은 NVIDIA Grace 플랫폼에서만 사용할 수 있습니다.
- A4X Max 또는 A4X에서는 머신 유형 변경이 지원되지 않습니다. 이러한 머신 유형 중 하나로 전환하거나 이러한 머신 유형에서 전환하려면 새 A4X Max 또는 A4X 인스턴스를 만들어야 합니다.
- 이러한 머신 유형에서는 Windows 운영체제를 실행할 수 없습니다.
- A4X 인스턴스의 경우
ethtool -S를 사용하여 GPU 네트워킹을 모니터링하면_phy로 끝나는 실제 포트 카운터가 업데이트되지 않습니다. 이는 MRDMA 가상 함수 (VF) 아키텍처를 사용하는 인스턴스의 예상 동작입니다. 자세한 내용은 MRDMA 기능 및 네트워크 모니터링 도구를 참고하세요. - A4X Max 및 A4X 인스턴스는 다음을 지원하지 않습니다.
- 2026년 2월 4일 이전에 생성된 Hyperdisk ML 디스크는 A4X 머신 유형에 연결할 수 없습니다.
MIG 제한사항
A4X VM으로 MIG를 만들 때는 다음 제한사항이 적용됩니다.
리전 MIG를 만드는 경우 MIG는 VPC 네트워크의 프로필이 포함된 영역에서만 VM을 만들 수 있습니다.
MIG에서 인스턴스 유연성을 구성할 수 없습니다.
MIG에 워크로드 정책을 적용하면 그룹에 VM이 있을 때 MIG에서 정책을 변경할 수 없습니다. VM이 있는 MIG의 정책을 변경하려면 먼저 MIG를 0으로 크기 조절해야 합니다.
배치 정책을 지정하는 인스턴스 템플릿을 사용하여 워크로드 정책을 사용하는 MIG를 만들 수는 없습니다.
예약에 따름 프로비저닝 모델을 사용해야 합니다. 다른 프로비저닝 모델은 지원되지 않습니다.
크기 조절 요청을 사용하여 MIG에 VM을 추가할 수 없습니다. VM을 추가하려면 MIG의 대상 크기를 설정해야 합니다.
시작하기 전에
MIG를 만들기 전에 아직 완료하지 않았다면 다음 단계를 완료하세요.
- 소비 옵션 선택: 소비 옵션 선택에 따라 GPU 리소스를 획득하고 사용하는 방식이 결정됩니다.
자세한 내용은 사용 옵션 선택을 참고하세요.
- 용량 획득: 용량을 획득하는 프로세스는 각 소비 옵션마다 다릅니다.
선택한 소비 옵션의 용량을 확보하는 프로세스를 알아보려면 용량 개요를 참고하세요.
필요한 역할
MIG를 만드는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 Compute 인스턴스 관리자 (v1) (roles/compute.instanceAdmin.v1) IAM 역할을 부여해 달라고 요청하세요.
역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
이 사전 정의된 역할에는 MIG를 만드는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.
필수 권한
MIG를 만들려면 다음 권한이 필요합니다.
-
MIG를 만들려면 프로젝트에 대해
compute.instanceGroupManagers.create권한이 필요합니다.
커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.
A4X 기본사항
A4X 클러스터는 대규모의 차단되지 않는 네트워크 성능을 지원하기 위해 블록과 하위 블록의 계층 구조로 구성됩니다. 이 토폴로지를 이해하는 것은 용량을 예약하고 워크로드를 배포할 때 중요합니다.
- A4X 인스턴스
- A4X 인스턴스는 GPU가 4개 연결된 단일 A4X 머신 유형입니다.
- NVLink 도메인 또는 하위 블록
- NVLink 도메인(하위 블록이라고도 함)은 A4X 용량의 기본 단위입니다. NVLink 도메인은 다중 노드 NVLink 시스템을 사용하여 연결된 18개의 A4X 인스턴스 (72개의 GPU)로 구성됩니다.
1x72토폴로지를 지정하는 워크로드 정책을 적용하여 A4X NVLink 도메인 또는 하위 블록을 만듭니다. - Block
- A4X 블록은 최대 450개의 A4X 인스턴스 (1,800개의 GPU)로 구성된 25개의 하위 블록(NVLink 도메인)으로 구성됩니다. 하위 블록은 효율적인 확장을 위해 레일 정렬됩니다. 각 하위 블록에는 MIG가 필요합니다. 따라서 단일 A4X 블록의 경우 MIG를 25개 만들 수 있습니다.
다음 표에는 A4X 인스턴스에 지원되는 토폴로지 옵션이 나와 있습니다.
토폴로지 (acceleratorTopology) |
GPU 수 | 인스턴스 수 |
|---|---|---|
1x72 |
72 | 18 |
개요
A4X 머신 유형으로 MIG를 만드는 단계는 다음과 같습니다.
VPC 네트워크 만들기
A4X 머신 유형의 네트워크를 설정하려면 다음 네트워크 인터페이스용으로 3개의 VPC 네트워크를 만들어야 합니다.
- gVNIC 네트워크 인터페이스(NIC)용으로 일반 VPC 네트워크 2개를 만듭니다. 이 네트워크는 호스트 간 통신에 사용됩니다.
- 여러 A4X 하위 블록을 만들 때 CX-7 NIC용으로 RoCE 네트워크 프로필을 사용하는 VPC 네트워크 1개가 필요합니다. 이 RoCE VPC 네트워크에는 4개의 서브넷이 있어야 하며, 각 CX-7 NIC마다 하나의 서브넷을 사용합니다. 이러한 NIC는 RDMA over Converged Ethernet (RoCE)을 사용하여 여러 A4X 하위 블록으로 확장하는 데 필수적인 고대역폭 및 저지연 통신을 제공합니다. 단일 A4X 하위 블록의 경우 단일 하위 블록 내에서 GPU 간 직접 통신은 멀티 노드 NVLink로 처리되므로 이 VPC 네트워크를 건너뛸 수 있습니다.
NIC 구성에 대한 자세한 내용은 네트워크 대역폭 및 NIC 구성 검토를 참조하세요.
네트워크는 안내 가이드에 따라 수동으로 만들거나, 제공된 스크립트를 사용하여 자동으로 만들 수 있습니다.
안내 가이드
네트워크를 만들려면 다음 안내를 수행하면 됩니다.
- gVNIC용 일반 VPC 네트워크를 만들려면 가상 프라이빗 클라우드 네트워크 만들기 및 관리를 참조하세요.
- RoCE VPC 네트워크를 만들려면 RDMA NIC용 가상 프라이빗 클라우드 네트워크 만들기를 참조하세요.
이러한 VPC 네트워크의 경우 최대 전송 단위(MTU)를 더 큰 값으로 설정하는 것이 좋습니다.
A4X 머신 유형의 경우 권장 MTU는 8896바이트입니다.
다른 GPU 머신 유형에 권장되는 MTU 설정을 검토하려면 GPU 머신 유형의 MTU 설정을 참조하세요.
스크립트
네트워크를 만들려면 다음 단계를 따르세요.
이러한 VPC 네트워크의 경우 최대 전송 단위(MTU)를 더 큰 값으로 설정하는 것이 좋습니다.
A4X 머신 유형의 경우 권장 MTU는 8896바이트입니다.
다른 GPU 머신 유형에 권장되는 MTU 설정을 검토하려면 GPU 머신 유형의 MTU 설정을 참조하세요.
다음 스크립트를 사용하여 gVNIC용 일반 VPC 네트워크를 만드세요.
#!/bin/bash # Create regular VPC networks and subnets for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=192.168.$N.0/24 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=192.168.0.0/16 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGEA4X 하위 블록이 여러 개 필요한 경우 다음 스크립트를 사용하여 각 A4X 인스턴스에 있는 4개의 CX-7 NIC용 RoCE VPC 네트워크와 서브넷을 만드세요.
# List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 3); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=192.168.$((N+2)).0/24 & # offset to avoid overlap with gVNICs done다음을 바꿉니다.
GVNIC_NAME_PREFIX: gVNIC용 일반 VPC 네트워크와 서브넷에 사용할 커스텀 이름 프리픽스입니다.RDMA_NAME_PREFIX: CX-7 NIC용 RoCE VPC 네트워크 및 서브넷에 사용할 커스텀 이름 프리픽스입니다.ZONE: 사용할 머신 유형이 제공되는 영역을 지정합니다(예:us-central1-a). 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참조하세요.REGION: 서브넷을 만들려는 리전입니다. 이 리전은 지정된 영역과 일치해야 합니다. 예를 들어 영역이us-central1-a이면 리전은us-central1입니다.IP_RANGE: SSH 방화벽 규칙에 사용할 IP 범위입니다.
- 선택사항: VPC 네트워크 리소스가 성공적으로 생성되었는지 확인하려면 Google Cloud 콘솔에서 네트워크 설정을 확인하세요.
- Google Cloud 콘솔에서 VPC 네트워크 페이지로 이동합니다.
- 이전 단계에서 만든 네트워크를 목록에서 찾아봅니다.
- 서브넷, 방화벽 규칙, 기타 네트워크 설정을 보려면 네트워크 이름을 클릭합니다.
워크로드 정책 만들기
워크로드 정책을 만든 후에는 업데이트할 수 없습니다. 워크로드 정책을 변경하려면 새 정책을 만들어야 합니다.
워크로드 정책을 만들려면 다음 옵션 중 하나를 선택합니다.
gcloud
워크로드 정책을 만들려면
gcloud compute resource-policies create workload-policy 명령어를 사용합니다.
액셀러레이터 간 네트워크 구성의 경우 명령어에 --accelerator-topology 플래그를 지정합니다.
A4X 머신 유형의 경우 다음 명령어를 사용합니다. 1x72의 가속기 토폴로지는 블록 내에서 NVLink를 통해 연결된 GPU가 72개임을 나타냅니다.
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--type=high-throughput \
--accelerator-topology=1x72 \
--region=REGION
다음을 바꿉니다.
WORKLOAD_POLICY_NAME: 워크로드 정책의 이름입니다.REGION: 워크로드 정책을 만들려는 리전입니다. MIG를 만들려는 리전과 사용할 머신 유형을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참고하세요.
REST
워크로드 정책을 만들려면 resourcePolicies.insert 메서드에 POST 요청을 실행합니다.
acceleratorTopology 필드를 지정합니다.
A4X 머신 유형에 대해 다음 요청을 합니다. 1x72의 액셀러레이터 토폴로지는 블록 내에서 NVLink를 통해 연결된 72개의 GPU를 나타냅니다.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME"
"workloadPolicy": {
"type": "HIGH_THROUGHPUT",
"acceleratorTopology": "1x72"
}
}
다음을 바꿉니다.
PROJECT_ID: 프로젝트 ID입니다.REGION: 워크로드 정책을 만들려는 리전입니다. MIG를 만들려는 리전과 제공되는 사용할 머신 유형을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참조하세요.WORKLOAD_POLICY_NAME: 워크로드 정책의 이름입니다.
인스턴스 템플릿 만들기
인스턴스 템플릿을 만들어 MIG의 VM 속성을 지정합니다.
인스턴스 템플릿을 만들려면 다음 옵션 중 하나를 선택합니다.
다음 명령어는 인스턴스의 액세스 범위도 설정합니다. 권한 관리를 간소화하려면 인스턴스의 액세스 범위를cloud-platform 액세스로 설정한 다음 IAM 역할을 사용하여 인스턴스가 액세스할 수 있는 서비스를 정의하는 것이 좋습니다. 자세한 내용은 범위 권장사항을 참고하세요.
gcloud
리전 인스턴스 템플릿을 만들려면 gcloud compute instance-templates create 명령어를 사용합니다.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=a4x-highgpu-4g \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--reservation-affinity=specific \
--reservation=RESERVATION \
--provisioning-model=RESERVATION_BOUND \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE \
--restart-on-failure
다음을 바꿉니다.
INSTANCE_TEMPLATE_NAME: 인스턴스 템플릿의 이름IMAGE_FAMILY: 사용할 OS 이미지의 이미지 계열로 바꿉니다. 지원되는 운영체제 목록은 지원되는 운영체제를 참조하세요.IMAGE_PROJECT: OS 이미지의 프로젝트 ID로 바꿉니다.REGION: 인스턴스 템플릿을 만들 리전입니다. 사용할 머신 유형이 제공되는 리전을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참고하세요.DISK_SIZE: 부팅 디스크의 크기(GB 단위).GVNIC_NAME_PREFIX: gVNIC NIC를 사용하는 표준 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.RDMA_NAME_PREFIX: RDMA NIC를 사용하는 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.-
RESERVATION: 예약 이름, 블록 또는 예약 내의 하위 블록입니다. 예약 이름 또는 사용 가능한 블록을 확인하려면 예약된 용량 보기를 참조하세요. 인스턴스 배치 요구사항에 따라 다음 중 하나를 선택합니다.- 단일 블록에 인스턴스를 만들려면 다음 안내를 따르세요.
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME - 특정 블록에 인스턴스를 만들려면 다음 안내를 따르세요.
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME - 특정 하위 블록에 인스턴스를 만들려면 다음을 실행하세요.
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
- 단일 블록에 인스턴스를 만들려면 다음 안내를 따르세요.
REST
리전 인스턴스 템플릿을 만들려면 regionInstanceTemplates.insert 메서드에 POST 요청을 보냅니다.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"a4x-highgpu-4g",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
}
],
"reservationAffinity":{
"consumeReservationType":"SPECIFIC_RESERVATION",
"key":"compute.googleapis.com/reservation-name",
"values":[
"RESERVATION"
]
},
"scheduling":{
"provisioningModel":"RESERVATION_BOUND",
"instanceTerminationAction":"DELETE",
"onHostMaintenance": "TERMINATE",
"automaticRestart":true
}
}
}
다음을 바꿉니다.
INSTANCE_TEMPLATE_NAME: 인스턴스 템플릿의 이름IMAGE_FAMILY: 사용할 OS 이미지의 이미지 계열로 바꿉니다. 지원되는 운영체제 목록은 지원되는 운영체제를 참조하세요.IMAGE_PROJECT: OS 이미지의 프로젝트 ID로 바꿉니다.REGION: 인스턴스 템플릿을 만들 리전입니다. 사용할 머신 유형이 제공되는 리전을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참조하세요.DISK_SIZE: 부팅 디스크의 크기(GB 단위).NETWORK_PROJECT_ID: 네트워크의 프로젝트 ID로 바꿉니다.GVNIC_NAME_PREFIX: gVNIC NIC를 사용하는 표준 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.REGION: 서브네트워크 리전으로 바꿉니다.RDMA_NAME_PREFIX: RDMA NIC를 사용하는 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.-
RESERVATION: 예약 이름, 블록 또는 예약 내의 하위 블록입니다. 예약 이름 또는 사용 가능한 블록을 확인하려면 예약된 용량 보기를 참조하세요. 인스턴스 배치 요구사항에 따라 다음 중 하나를 선택합니다.- 단일 블록에 인스턴스를 만들려면 다음 안내를 따르세요.
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME - 특정 블록에 인스턴스를 만들려면 다음 안내를 따르세요.
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME - 특정 하위 블록에 인스턴스를 만들려면 다음을 실행하세요.
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
- 단일 블록에 인스턴스를 만들려면 다음 안내를 따르세요.
MIG 만들기
A4X 머신 유형을 사용하는 경우 타겟 크기를 지정하여 MIG를 만들어야 합니다.
1x72의 GPU 토폴로지를 얻으려면 인스턴스가 18개인 MIG를 만드세요. MIG를 만들 때 acceleratorTopology 필드를 지정하는 워크로드 정책을 적용합니다. 정책을 적용하면 Compute Engine이 NVLink 도메인을 사용하기 위해 하나의 하위 블록에 18개의 인스턴스를 모두 만듭니다.
하위 블록에 18개 인스턴스를 모두 수용할 용량이 부족한 경우 즉시 생성할 수 없는 관리 인스턴스는 용량이 확보될 때까지 CREATING 상태로 유지됩니다. 이러한 관리형 인스턴스는 용량이 있을 때 MIG가 만드는 VM을 나타냅니다.
acceleratorTopology 필드가 1x72로 설정된 워크로드 정책을 적용하면 MIG에서 18개가 넘는 인스턴스를 만들 수 없습니다. 인스턴스를 18개 이상 지정하면 MIG 생성이 실패합니다. 여러 NVLink 도메인을 만들려면 도메인마다 별도의 MIG를 만들고 각 MIG에 동일한 워크로드 정책을 적용합니다.
MIG를 만들려면 다음 옵션 중 하나를 선택합니다.
gcloud
지정된 대상 크기로 MIG를 만들려면 instance-groups managed
create 명령어를 사용합니다.
다음과 같이 영역 또는 리전 MIG를 만듭니다.
- 영역 MIG를 만들려면 다음 명령어를 사용합니다.
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE
- 리전 MIG를 만들려면 다음 명령어를 사용합니다.
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --region=REGION
MIG_NAME: MIG 이름입니다.INSTANCE_TEMPLATE_URL: MIG에서 VM을 만드는 데 사용할 인스턴스 템플릿의 URL입니다. URL에는 인스턴스 템플릿의 ID 또는 이름이 포함될 수 있습니다. 다음 값 중 하나를 지정합니다.- 리전 인스턴스 템플릿의 경우:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - 전역 인스턴스 템플릿의 경우:
INSTANCE_TEMPLATE_ID
- 리전 인스턴스 템플릿의 경우:
TARGET_SIZE: MIG에 사용할 VM 수입니다.1x72의 가속기 토폴로지의 경우 타겟 크기를18로 설정합니다.WORKLOAD_POLICY_URL: 워크로드 정책의 URL입니다. 예를 들면projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy입니다.ZONE: MIG를 만들려는 영역입니다. 워크로드 정책의 리전 내 영역을 지정합니다.REGION: MIG를 만들려는 리전입니다. 워크로드 정책과 동일한 리전을 지정합니다. 리전 MIG의 경우 리전 대신--zones플래그를 사용하여 해당 리전의 영역을 지정할 수 있습니다.
REST
지정된 대상 크기로 MIG를 만들려면 POST 요청을 수행합니다.
다음과 같이 영역 또는 리전 MIG를 만듭니다.
- 영역 MIG를 만들려면
instanceGroupManagers.insert메서드에POST요청을 수행합니다.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - 리전 MIG를 만들려면
regionInstanceGroupManagers.insert메서드에POST요청을 수행합니다.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } }
PROJECT_ID: 프로젝트 ID입니다.ZONE: MIG를 만들려는 영역입니다. 워크로드 정책의 리전 내 영역을 지정합니다.REGION: MIG를 만들려는 리전입니다. 워크로드 정책과 동일한 리전을 지정합니다.INSTANCE_TEMPLATE_URL: MIG에서 VM을 만드는 데 사용할 인스턴스 템플릿의 URL입니다. URL에는 인스턴스 템플릿의 ID 또는 이름이 포함될 수 있습니다. 다음 값 중 하나를 지정합니다.- 리전 인스턴스 템플릿의 경우:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - 전역 인스턴스 템플릿의 경우:
INSTANCE_TEMPLATE_ID
- 리전 인스턴스 템플릿의 경우:
MIG_NAME: MIG 이름입니다.TARGET_SIZE: MIG에 사용할 VM 수입니다.1x72의 가속기 토폴로지에서 타겟 크기를18로 설정합니다.WORKLOAD_POLICY_URL: 워크로드 정책의 URL입니다. 예를 들면projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy입니다.