Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

A4X로 AI에 최적화된 MIG 만들기

이 문서에서는 A4X 머신 유형을 사용하는 관리형 인스턴스 그룹 (MIG)을 만드는 방법을 설명합니다. 이 가속기 최적화 머신 유형에 대해 자세히 알아보려면 A4X를 참고하세요.

여러 가상 머신 (VM)을 단일 항목으로 관리하려면 MIG를 만드세요. MIG에 대해 자세히 알아보려면 Compute Engine 문서의 관리형 인스턴스 그룹을 참고하세요.

VM 또는 클러스터를 만드는 다른 방법을 알아보려면 배포 옵션 개요를 참고하세요.

제한사항

A4X VM으로 MIG를 만들 때는 머신 유형과 MIG 모두에 대한 제한사항을 고려하세요.

A4X VM 제한사항

다음과 같은 머신별 제한사항이 적용됩니다.

이 머신 유형을 사용하는 인스턴스에는 지속 사용 할인 또는 가변형 약정 사용 할인이 적용되지 않습니다.
특정 리전 및 영역에서만 인스턴스를 만들 수 있습니다.
Persistent Disk (리전 또는 영역)를 사용할 수 없습니다. Google Cloud Hyperdisk만 사용할 수 있습니다.
이 머신 유형은 NVIDIA Grace 플랫폼에서만 사용할 수 있습니다.
A4X에서는 머신 유형 변경이 지원되지 않습니다. 이 머신 유형으로 전환하거나 이 머신 유형에서 전환하려면 새 인스턴스를 만들어야 합니다.
이 머신 유형에서는 Windows 운영체제를 실행할 수 없습니다. 지원되는 Linux 운영체제 목록은 GPU 인스턴스용 지원되는 운영체제를 참고하세요.
A4X 인스턴스의 경우 ethtool -S를 사용하여 GPU 네트워킹을 모니터링하면 _phy로 끝나는 실제 포트 카운터가 업데이트되지 않습니다. 이는 MRDMA 가상 함수 (VF) 아키텍처를 사용하는 인스턴스의 예상 동작입니다. 자세한 내용은 MRDMA 기능 및 네트워크 모니터링 도구를 참고하세요.
A4X 인스턴스는 다음을 지원하지 않습니다.
2026년 2월 4일 이전에 생성된 Hyperdisk ML 디스크는 A4X 머신 유형에 연결할 수 없습니다.

MIG 제한사항

A4X 머신 유형을 사용하여 MIG를 만들 때는 다음 제한사항이 적용됩니다.

RDMA 네트워킹을 사용하는 리전 MIG를 만드는 경우 MIG는 RDMA용 네트워크 프로필을 구성한 영역에서만 A4X 인스턴스를 만들 수 있습니다.
MIG에서 인스턴스 유연성을 구성할 수 없습니다.
MIG에 워크로드 정책을 적용하는 경우 그룹에 A4X 인스턴스가 있으면 MIG에서 정책을 변경할 수 없습니다. 정책을 변경하려면 먼저 MIG를 0으로 크기 조절해야 합니다.
배치 정책을 지정하는 인스턴스 템플릿을 사용하여 워크로드 정책을 사용하는 MIG를 만들 수 없습니다.

예약에 따름 프로비저닝 모델을 사용해야 합니다. 다른 프로비저닝 모델은 지원되지 않습니다.
크기 조절 요청을 사용하여 MIG에 A4X 인스턴스를 추가할 수 없습니다. 인스턴스를 추가하려면 MIG의 대상 크기를 설정해야 합니다.

시작하기 전에

MIG를 만들기 전에 아직 완료하지 않았다면 다음 단계를 완료하세요.

소비 옵션 선택: 소비 옵션 선택에 따라 GPU 리소스를 확보하고 사용하는 방식이 결정됩니다. 자세한 내용은 소비 옵션 선택을 참고하세요.
용량 확보: 용량을 확보하는 프로세스는 소비 옵션마다 다릅니다. 선택한 소비 옵션의 용량을 확보하는 프로세스에 대해 알아보려면 용량 개요를 참고하세요.
참고: A4X Max 또는 A4X 용량을 요청하면 모든 용량 모드로 확보됩니다. 이 모드는 A4X Max 또는 A4X 머신 유형에 지원되는 유일한 예약 작동 모드입니다. 모든 용량 모드에 관한 자세한 내용은 예약 작동 모드를 참고하세요.

필요한 역할

MIG를 만드는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 Compute 인스턴스 관리자 (v1) (roles/compute.instanceAdmin.v1) IAM 역할을 부여해 달라고 요청하세요. 역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

이 사전 정의된 역할에는 MIG를 만드는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.

필수 권한

MIG를 만들려면 다음 권한이 필요합니다.

MIG를 만들려면 프로젝트에 대해 compute.instanceGroupManagers.create 권한이 필요합니다.

커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.

A4X 기본사항

A4X 클러스터는 대규모의 차단되지 않는 네트워크 성능을 지원하기 위해 블록과 하위 블록의 계층 구조로 구성됩니다. 이 토폴로지를 이해하는 것은 용량을 예약하고 워크로드를 배포할 때 중요합니다.

A4X 인스턴스: A4X 인스턴스는 GPU가 4개 연결된 단일 A4X 머신 유형입니다.
하위 블록: 하위 블록은 A4X 용량의 기본 단위입니다. A4X의 경우 하위 블록은 18개의 A4X 인스턴스 (72개의 GPU)로 구성됩니다. 이러한 인스턴스는 NVLink 도메인을 형성하고 다중 노드 NVLink 시스템을 사용하여 연결됩니다. 1x72 토폴로지를 지정하는 워크로드 정책을 적용하여 A4X 하위 블록을 만듭니다.
Block: A4X 블록은 최대 450개의 A4X 인스턴스 (1,800개의 GPU)로 구성된 25개의 하위 블록 (NVLink 도메인)으로 구성됩니다. 하위 블록은 효율적인 확장을 위해 레일 정렬됩니다. 각 하위 블록에는 MIG가 필요합니다. 따라서 단일 A4X 블록의 경우 MIG를 25개 만들 수 있습니다.

다음 표에는 A4X 인스턴스에 지원되는 토폴로지 옵션이 나와 있습니다.

토폴로지 (`acceleratorTopology`)	GPU 수	인스턴스 수
`1x72`	72	18

개요

A4X 머신 유형으로 MIG를 만드는 단계는 다음과 같습니다.

VPC 네트워크 만들기
워크로드 정책 만들기
인스턴스 템플릿 만들기
MIG 만들기

VPC 네트워크 만들기

도움말: 빠른 테스트를 설정하는 경우 이 단계를 건너뛰고 대신 단일 NIC --network-interface=nic-type=GVNIC를 지정할 수 있습니다.

A4X 머신 유형의 네트워크를 설정하려면 다음 네트워크 인터페이스용으로 3개의 VPC 네트워크를 만들어야 합니다.

gVNIC 네트워크 인터페이스 (NIC)용으로 일반 VPC 네트워크 2개를 만듭니다. 이 네트워크는 호스트 간 통신에 사용됩니다.
여러 A4X 하위 블록을 생성할 때 CX-7 NIC용 RoCE 네트워크 프로필이 있는 VPC 네트워크 1개가 필요합니다. RoCE VPC 네트워크에는 4개의 서브넷이 있어야 하며, 각 CX-7 NIC마다 하나의 서브넷을 사용합니다. 이러한 NIC는 통합 이더넷을 통한 RDMA (RoCE)를 사용하여 여러 A4X 하위 블록으로 확장하는 데 필수적인 고대역폭 및 저지연 통신을 제공합니다. 단일 A4X 하위 블록의 경우 단일 하위 블록 내에서 GPU 간 직접 통신이 다중 노드 NVLink에 의해 처리되므로 이 VPC 네트워크를 건너뛸 수 있습니다.

NIC 구성에 대한 자세한 내용은 네트워크 대역폭 및 NIC 구성 검토를 참조하세요.

네트워크는 안내 가이드에 따라 수동으로 만들거나, 제공된 스크립트를 사용하여 자동으로 만들 수 있습니다.

안내 가이드

네트워크를 만들려면 다음 안내를 수행하면 됩니다.

gVNIC용 일반 VPC 네트워크를 만들려면 가상 프라이빗 클라우드 네트워크 만들기 및 관리를 참조하세요.
RoCE VPC 네트워크를 만들려면 RDMA NIC용 가상 프라이빗 클라우드 네트워크 만들기를 참조하세요.

이러한 VPC 네트워크의 경우 최대 전송 단위(MTU)를 더 큰 값으로 설정하는 것이 좋습니다. A4X 머신 유형의 경우 권장 MTU는 8896바이트입니다. 다른 GPU 머신 유형에 권장되는 MTU 설정을 검토하려면 GPU 머신 유형의 MTU 설정을 참조하세요.

스크립트

네트워크를 만들려면 다음 단계를 따르세요.

다음 스크립트를 사용하여 gVNIC용 일반 VPC 네트워크를 만드세요.

  
    #!/bin/bash

    # Create regular VPC networks and subnets for the gVNICs
    for N in $(seq 0 1); do
      gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \
        --subnet-mode=custom \
        --mtu=8896

      gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \
        --network=GVNIC_NAME_PREFIX-net-$N \
        --region=REGION \
        --range=192.168.$N.0/24

      gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \
        --network=GVNIC_NAME_PREFIX-net-$N \
        --action=ALLOW \
        --rules=tcp:0-65535,udp:0-65535,icmp \
        --source-ranges=192.168.0.0/16
    done

    # Create SSH firewall rules
    gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \
      --network=GVNIC_NAME_PREFIX-net-0 \
      --action=ALLOW \
      --rules=tcp:22 \
      --source-ranges=IP_RANGE

    # Assumes that an external IP is only created for vNIC 0
    gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \
      --network=GVNIC_NAME_PREFIX-net-0 \
      --action=ALLOW \
      --rules=icmp \
      --source-ranges=IP_RANGE

A4X 하위 블록이 여러 개 필요한 경우 다음 스크립트를 사용하여 각 A4X 인스턴스에 있는 4개의 CX-7 NIC용 RoCE VPC 네트워크와 서브넷을 만드세요.

중요: 배포가 단일 A4X 하위 블록으로만 구성된 경우 이 단계를 건너뛰어도 됩니다.
```
  
    #!/bin/bash

    # List and make sure network profiles exist in the machine type's zone
    gcloud compute network-profiles list --filter "location.name=ZONE"

    # Create network for RDMA NICs
    gcloud compute networks create RDMA_NAME_PREFIX-mrdma \
      --network-profile=ZONE-vpc-roce \
      --subnet-mode custom \
      --mtu=8896

    # Create subnets
    for N in $(seq 0 3); do
      gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \
        --network=RDMA_NAME_PREFIX-mrdma \
        --region=REGION \
        --range=192.168.$((N+2)).0/24 # offset to avoid overlap with gVNICs
    done

  
```
다음을 바꿉니다.
- GVNIC_NAME_PREFIX: gVNIC용 일반 VPC 네트워크와 서브넷에 사용할 커스텀 이름 프리픽스입니다.
- RDMA_NAME_PREFIX: CX-7 NIC용 RoCE VPC 네트워크 및 서브넷에 사용할 커스텀 이름 프리픽스입니다.
- ZONE: 사용할 머신 유형이 제공되는 영역을 지정합니다(예: us-central1-a). 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참조하세요.
- REGION: 서브넷을 만들려는 리전입니다. 이 리전은 지정된 영역과 일치해야 합니다. 예를 들어 영역이 us-central1-a이면 리전은 us-central1입니다.
- IP_RANGE: SSH 방화벽 규칙에 사용할 IP 범위입니다.
선택사항: VPC 네트워크 리소스가 성공적으로 생성되었는지 확인하려면 Google Cloud 콘솔에서 네트워크 설정을 확인하세요.
1. Google Cloud 콘솔에서 VPC 네트워크 페이지로 이동합니다.
  VPC 네트워크로 이동
2. 이전 단계에서 만든 네트워크를 목록에서 찾아봅니다.
3. 서브넷, 방화벽 규칙, 기타 네트워크 설정을 보려면 네트워크 이름을 클릭합니다.

워크로드 정책 만들기

테스트를 위해 MIG에 단일 A4X 인스턴스를 만들려면 이 단계를 건너뛰세요. 그렇지 않으면 워크로드 정책을 만들어 A4X 인스턴스로 MIG를 만들어야 합니다.

워크로드 정책을 만들려면 다음 옵션 중 하나를 선택합니다.

gcloud

워크로드 정책을 만들려면 gcloud compute resource-policies create workload-policy 명령어를 사용합니다.

액셀러레이터 간 네트워크 구성의 경우 명령어에 --accelerator-topology 플래그를 지정합니다.

A4X 머신 유형에는 다음 명령어를 사용합니다. 1x72의 가속기 토폴로지는 블록 내에서 NVLink를 통해 72개의 GPU가 연결되어 있음을 나타냅니다.

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --type=high-throughput \
    --accelerator-topology=1x72 \
    --region=REGION

다음을 바꿉니다.

WORKLOAD_POLICY_NAME: 워크로드 정책의 이름입니다.
REGION: 워크로드 정책을 만들려는 리전입니다. MIG를 만들려는 리전과 사용할 머신 유형을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참고하세요.

REST

워크로드 정책을 만들려면 resourcePolicies.insert 메서드에 POST 요청을 실행합니다.

액셀러레이터 간 네트워크 구성의 경우 요청에서 acceleratorTopology 필드를 지정합니다.

A4X 머신 유형에 대해 다음 요청을 합니다. 1x72의 액셀러레이터 토폴로지는 블록 내에서 NVLink를 통해 72개의 GPU가 연결되어 있음을 나타냅니다.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
  {
    "name": "WORKLOAD_POLICY_NAME"
    "workloadPolicy": {
      "type": "HIGH_THROUGHPUT",
      "acceleratorTopology": "1x72"
    }
  }

다음을 바꿉니다.

PROJECT_ID: 프로젝트 ID입니다.
REGION: 워크로드 정책을 만들려는 리전입니다. MIG를 만들려는 리전과 제공되는 사용할 머신 유형을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참조하세요.
WORKLOAD_POLICY_NAME: 워크로드 정책의 이름입니다.

인스턴스 템플릿 만들기

인스턴스 템플릿을 만들어 MIG의 VM 속성을 지정합니다.

인스턴스 템플릿을 만들려면 다음 옵션 중 하나를 선택합니다.

다음 명령어는 인스턴스의 액세스 범위도 설정합니다. 권한 관리를 간소화하려면 인스턴스의 액세스 범위를 cloud-platform 액세스로 설정한 다음 IAM 역할을 사용하여 인스턴스에서 액세스할 수 있는 서비스를 정의하는 것이 좋습니다. 자세한 내용은 범위 권장사항을 참고하세요.

gcloud

리전 인스턴스 템플릿을 만들려면 gcloud compute instance-templates create 명령어를 사용합니다.

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=a4x-highgpu-4g \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address 
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE \
    --restart-on-failure

다음을 바꿉니다.

INSTANCE_TEMPLATE_NAME: 인스턴스 템플릿의 이름
IMAGE_FAMILY: 사용할 OS 이미지의 이미지 계열로 바꿉니다. 지원되는 운영체제 목록은 지원되는 운영체제를 참조하세요.
IMAGE_PROJECT: OS 이미지의 프로젝트 ID로 바꿉니다.
REGION: 인스턴스 템플릿을 만들 리전입니다. 사용할 머신 유형이 제공되는 리전을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참고하세요.
DISK_SIZE: 부팅 디스크의 크기(GB 단위).
GVNIC_NAME_PREFIX: gVNIC NIC를 사용하는 표준 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.
RDMA_NAME_PREFIX: RDMA NIC를 사용하는 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.
RESERVATION: 예약 이름, 블록 또는 예약 내의 하위 블록입니다. 예약 이름 또는 사용 가능한 블록을 확인하려면 예약된 용량 보기를 참조하세요. 인스턴스 배치 요구사항에 따라 다음 중 하나를 선택합니다.
- 단일 블록에 A4X 인스턴스를 만들려면 다음 단계를 따르세요.
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
    
```
- 특정 블록에 A4X 인스턴스를 만들려면 다음을 실행하세요.
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    
```
- 특정 하위 블록에 A4X 인스턴스를 만들려면 다음을 실행하세요.
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
    
```
도움말: 예약이 현재 프로젝트에 속해 있는 경우 예약 값에서 projects/RESERVATION_OWNER_PROJECT_ID/reservations/를 생략할 수 있습니다.

REST

리전 인스턴스 템플릿을 만들려면 regionInstanceTemplates.insert 메서드에 POST 요청을 보냅니다.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "machineType":"a4x-highgpu-4g",
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "serviceAccounts": [
      {
        "email": "default",
        "scopes": [
          "https://www.googleapis.com/auth/cloud-platform"
        ]
      }
    ],
    "networkInterfaces": [
      {
        "accessConfigs": [
          {
            "name": "external-nat",
            "type": "ONE_TO_ONE_NAT"
          }
        ],
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
      }
    ],
    "reservationAffinity":{
        "consumeReservationType":"SPECIFIC_RESERVATION",
        "key":"compute.googleapis.com/reservation-name",
        "values":[
          "RESERVATION"
        ]
      },
    "scheduling":{
        "provisioningModel":"RESERVATION_BOUND",
        "instanceTerminationAction":"DELETE",
        "onHostMaintenance": "TERMINATE",
        "automaticRestart":true
      }
  }
}

다음을 바꿉니다.

INSTANCE_TEMPLATE_NAME: 인스턴스 템플릿의 이름
IMAGE_FAMILY: 사용할 OS 이미지의 이미지 계열로 바꿉니다. 지원되는 운영체제 목록은 지원되는 운영체제를 참조하세요.
IMAGE_PROJECT: OS 이미지의 프로젝트 ID로 바꿉니다.
REGION: 인스턴스 템플릿을 만들 리전입니다. 사용할 머신 유형이 제공되는 리전을 지정합니다. 리전에 대한 자세한 내용은 리전 및 영역별 GPU 가용성을 참조하세요.
DISK_SIZE: 부팅 디스크의 크기(GB 단위).
NETWORK_PROJECT_ID: 네트워크의 프로젝트 ID로 바꿉니다.
GVNIC_NAME_PREFIX: gVNIC NIC를 사용하는 표준 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.
REGION: 서브네트워크 리전으로 바꿉니다.
RDMA_NAME_PREFIX: RDMA NIC를 사용하는 VPC 네트워크 및 서브넷을 만들 때 지정한 이름 프리픽스입니다.
RESERVATION: 예약 이름, 블록 또는 예약 내의 하위 블록입니다. 예약 이름 또는 사용 가능한 블록을 확인하려면 예약된 용량 보기를 참조하세요. 인스턴스 배치 요구사항에 따라 다음 중 하나를 선택합니다.
- 단일 블록에 A4X 인스턴스를 만들려면 다음 단계를 따르세요.
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
    
```
- 특정 블록에 A4X 인스턴스를 만들려면 다음을 실행하세요.
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
    
```
- 특정 하위 블록에 A4X 인스턴스를 만들려면 다음을 실행하세요.
```
    projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
    
```
도움말: 예약이 현재 프로젝트에 속해 있는 경우 예약 값에서 projects/RESERVATION_OWNER_PROJECT_ID/reservations/를 생략할 수 있습니다.

MIG 만들기

A4X 머신 유형을 사용하는 경우 타겟 크기를 지정하여 MIG를 만들어야 합니다.

1x72의 GPU 토폴로지를 얻으려면 A4X 인스턴스 18개로 MIG를 만듭니다. MIG를 만들 때 acceleratorTopology 필드를 지정하는 워크로드 정책을 적용합니다. 정책을 적용하면 Compute Engine에서 NVLink 도메인을 사용하기 위해 하나의 하위 블록에 A4X 인스턴스 18개를 모두 만듭니다. 하위 블록에 인스턴스 18개를 모두 수용할 수 있는 용량이 없으면 즉시 만들 수 없는 관리 인스턴스는 용량이 확보될 때까지 CREATING 상태로 유지됩니다. 이러한 관리 인스턴스는 용량이 있을 때 MIG가 만드는 컴퓨팅 인스턴스를 나타냅니다.

acceleratorTopology 필드가 1x72로 설정된 워크로드 정책을 적용하면 MIG에서 A4X 인스턴스를 18개 이상 만들 수 없습니다. 인스턴스를 18개 이상 지정하면 MIG 생성이 실패합니다. 여러 NVLink 도메인을 만들려면 도메인마다 별도의 MIG를 만들고 각 MIG에 동일한 워크로드 정책을 적용합니다.

MIG를 만들려면 다음 옵션 중 하나를 선택합니다.

gcloud

지정된 대상 크기로 MIG를 만들려면 instance-groups managed create 명령어를 사용합니다.

다음과 같이 영역 또는 리전 MIG를 만듭니다.

영역 MIG를 만들려면 다음 명령어를 사용합니다.

gcloud compute instance-groups managed create MIG_NAME \
  --template=INSTANCE_TEMPLATE_URL \
  --size=TARGET_SIZE \
  --workload-policy=WORKLOAD_POLICY_URL \
  --zone=ZONE

리전 MIG를 만들려면 다음 명령어를 사용합니다.

gcloud compute instance-groups managed create MIG_NAME \
    --template=INSTANCE_TEMPLATE_URL \
    --size=TARGET_SIZE \
    --workload-policy=WORKLOAD_POLICY_URL \
    --region=REGION

다음을 바꿉니다.

MIG_NAME: MIG 이름
INSTANCE_TEMPLATE_URL: MIG에서 인스턴스를 만드는 데 사용할 인스턴스 템플릿의 URL. URL에는 인스턴스 템플릿의 ID 또는 이름이 포함될 수 있습니다. 다음 값 중 하나를 지정합니다.
- 리전 인스턴스 템플릿의 경우: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- 전역 인스턴스 템플릿의 경우: INSTANCE_TEMPLATE_ID
TARGET_SIZE: MIG에 사용할 인스턴스 수입니다. 1x72의 가속기 토폴로지의 경우 대상 크기를 18로 설정합니다.
WORKLOAD_POLICY_URL: 워크로드 정책의 URL입니다(예: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy).
ZONE: MIG를 만들려는 영역입니다. 워크로드 정책의 리전 내 영역을 지정합니다.
REGION: MIG를 만들려는 리전입니다. 워크로드 정책과 동일한 리전을 지정합니다. 리전 MIG의 경우 리전 대신 --zones 플래그를 사용하여 해당 리전의 영역을 지정할 수 있습니다.

REST

지정된 대상 크기로 MIG를 만들려면 POST 요청을 수행합니다.

다음과 같이 영역 또는 리전 MIG를 만듭니다.

영역 MIG를 만들려면 instanceGroupManagers.insert 메서드에 POST 요청을 수행합니다.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
{
  "versions": [
    {
      "instanceTemplate": "INSTANCE_TEMPLATE_URL"
    }
  ],
  "name": "MIG_NAME",
  "targetSize": TARGET_SIZE,
  "resourcePolicies": {
    "workloadPolicy": "WORKLOAD_POLICY_URL"
  }
}

리전 MIG를 만들려면 regionInstanceGroupManagers.insert 메서드에 POST 요청을 수행합니다.

  POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
  {
    "name": "MIG_NAME",
    "instanceTemplate": "INSTANCE_TEMPLATE_URL",
    "targetSize": TARGET_SIZE,
    "resourcePolicies": {
      "workloadPolicy": "WORKLOAD_POLICY_URL"
    }
  }

다음을 바꿉니다.

PROJECT_ID: 프로젝트 ID입니다.
ZONE: MIG를 만들려는 영역입니다. 워크로드 정책의 리전 내 영역을 지정합니다.
REGION: MIG를 만들려는 리전입니다. 워크로드 정책과 동일한 리전을 지정합니다.
INSTANCE_TEMPLATE_URL: MIG에서 인스턴스를 만드는 데 사용할 인스턴스 템플릿의 URL. URL에는 인스턴스 템플릿의 ID 또는 이름이 포함될 수 있습니다. 다음 값 중 하나를 지정합니다.
- 리전 인스턴스 템플릿의 경우: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- 전역 인스턴스 템플릿의 경우: INSTANCE_TEMPLATE_ID
MIG_NAME: MIG 이름
TARGET_SIZE: MIG에 사용할 인스턴스 수입니다. 1x72의 가속기 토폴로지의 경우 타겟 크기를 18로 설정합니다.
WORKLOAD_POLICY_URL: 워크로드 정책의 URL입니다(예: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy).

A4X로 AI에 최적화된 MIG 만들기 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

제한사항

A4X VM 제한사항

MIG 제한사항

시작하기 전에

필요한 역할

필수 권한

A4X 기본사항

개요

VPC 네트워크 만들기

안내 가이드

스크립트

워크로드 정책 만들기

gcloud

REST

인스턴스 템플릿 만들기

gcloud

REST

MIG 만들기

gcloud

REST

다음 단계

A4X로 AI에 최적화된 MIG 만들기