使用 A4X 大量建立 AI 最佳化執行個體

本文說明如何大量建立使用 A4X 機器類型的虛擬機器 (VM) 執行個體。如要進一步瞭解這款加速器最佳化機器類型,請參閱 A4X

如要瞭解建立 VM 或叢集的其他方式,請參閱「部署選項總覽」。

限制

大量建立 A4X VM 時,須遵守下列限制:

事前準備

大量建立 VM 之前,請先完成下列步驟 (如果尚未完成):

  1. 選擇使用選項:您選擇的使用選項會決定取得及使用 GPU 資源的方式。

    詳情請參閱「選擇消耗量選項」。

  2. 取得容量:取得容量的程序因消費選項而異。

    如要瞭解如何取得所選用量方案的容量,請參閱容量總覽

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

In the Google Cloud console, activate Cloud Shell.

Activate Cloud Shell

At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

REST

如要在本機開發環境中使用本頁的 REST API 範例,請使用您提供給 gcloud CLI 的憑證。

    Install the Google Cloud CLI. After installation, initialize the Google Cloud CLI by running the following command:

    gcloud init

    If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

詳情請參閱 Google Cloud 驗證說明文件中的「Authenticate for using REST」。

必要的角色

如要取得大量建立 VM 的權限,請要求管理員授予您專案的 Compute 執行個體管理員 (v1) (roles/compute.instanceAdmin.v1) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

這個預先定義的角色具備大量建立 VM 的權限。如要查看確切的必要權限,請展開「Required permissions」(必要權限) 部分:

所需權限

如要大量建立 VM,您必須具備下列權限:

  • 專案的 compute.instances.create
  • 如要使用自訂映像檔建立 VM: compute.images.useReadOnly 在映像檔上
  • 如要使用快照建立 VM: compute.snapshots.useReadOnly 快照
  • 如要使用執行個體範本建立 VM,請按照下列步驟操作: compute.instanceTemplates.useReadOnly 在執行個體範本上
  • 如要為 VM 指定子網路: compute.subnetworks.use 專案或所選子網路的
  • 如要為 VM 指定靜態 IP 位址: 專案的 compute.addresses.use
  • 使用虛擬私有雲網路時,如要將外部 IP 位址指派給 VM: compute.subnetworks.useExternalIp 專案或所選子網路的權限
  • 如要將舊版網路指派給 VM,請按照下列步驟操作: compute.networks.use 專案的
  • 使用舊版網路時,如要將外部 IP 位址指派給 VM,請在專案中設定 compute.networks.useExternalIp
  • 如要為 VM 設定 VM 執行個體中繼資料,請在專案中執行下列指令: compute.instances.setMetadata
  • 如要為 VM 設定標記,請按照下列步驟操作: compute.instances.setTags 在 VM 上
  • 如要為 VM 設定標籤,請按照下列步驟操作: compute.instances.setLabels 在 VM 上
  • 如要設定 VM 使用的服務帳戶,請執行下列操作: compute.instances.setServiceAccount 在 VM 上
  • 為 VM 建立新磁碟: 專案的 compute.disks.create
  • 如要以唯讀或讀寫模式附加現有磁碟: 磁碟的 compute.disks.use
  • 如要以唯讀模式附加現有磁碟: compute.disks.useReadOnly 磁碟的

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

A4X 基礎知識

A4X 叢集會整理成區塊和子區塊的階層,以利大規模、無阻斷的網路效能。預留容量及部署工作負載時,瞭解這項拓撲是關鍵。

A4X 執行個體
A4X 執行個體是單一 A4X 機器類型,連接了 4 個 GPU。
NVLink 網域或子區塊
NVLink 網域 (也稱為子區塊) 是 A4X 容量的基本單位。NVLink 網域包含 18 個 A4X 執行個體 (72 個 GPU),並使用多節點 NVLink 系統互連。您可以套用指定 1x72 拓撲的密集配置政策,建立 A4X NVLink 網域或子區塊。
封鎖
一個 A4X 區塊由 25 個子區塊 (NVLink 網域) 組成,最多可容納 450 個 A4X 執行個體 (1,800 個 GPU)。子區塊會與軌道對齊,以利有效擴充。每個子區塊都需要緊湊的刊登位置政策。因此,您可以在單一 A4X 區塊中建立 25 項精簡刊登位置政策。

下表列出 A4X 執行個體支援的拓撲選項:

拓撲 (gpuTopology) GPU 數量 執行個體數量
1x72 72 18

總覽

使用 A4X 機器類型大量建立執行個體時,請按照下列步驟操作:

  1. 建立虛擬私有雲網路
  2. 建立密集配置政策
  3. 大量建立執行個體

建立虛擬私有雲網路

如要為 A4X 機型設定網路,請為下列網路介面建立三個虛擬私有雲網路:

  • gVNIC 網路介面 (NIC) 適用 2 個一般虛擬私有雲網路。這些位址用於主機間的通訊。
  • 建立多個 A4X 子區塊時,CX-7 NIC 需要 1 個具備 RoCE 網路設定檔的 VPC 網路。RoCE 虛擬私有雲網路需要有 4 個子網路,每個 CX-7 NIC 各有一個子網路。這些 NIC 使用 RDMA over Converged Ethernet (RoCE),提供高頻寬、低延遲的通訊,對於擴展至多個 A4X 子區塊至關重要。如果是單一 A4X 子區塊,您可以略過這個 VPC 網路,因為在單一子區塊中,GPU 對 GPU 的直接通訊是由多節點 NVLink 處理。

如要進一步瞭解 NIC 配置,請參閱「查看網路頻寬和 NIC 配置」。

您可以按照操作說明手動建立網路,也可以使用提供的指令碼自動建立網路。

操作指南

如要建立網路,請按照下列操作說明進行:

對於這些虛擬私有雲網路,建議您將最大傳輸單元 (MTU) 設為較大的值。如果是 A4X 機型,建議的 MTU 為 8896 位元組。 如要查看其他 GPU 機型的建議 MTU 設定,請參閱「GPU 機型的 MTU 設定」。

指令碼

如要建立網路,請按照下列步驟操作。

對於這些虛擬私有雲網路,建議您將最大傳輸單元 (MTU) 設為較大的值。如果是 A4X 機型,建議的 MTU 為 8896 位元組。 如要查看其他 GPU 機型的建議 MTU 設定,請參閱「GPU 機型的 MTU 設定」。

  1. 請使用下列指令碼為 gVNIC 建立一般 VPC 網路。

      
        #!/bin/bash
    
        # Create regular VPC networks and subnets for the gVNICs
        for N in $(seq 0 1); do
          gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \
            --subnet-mode=custom \
            --mtu=8896
    
          gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \
            --network=GVNIC_NAME_PREFIX-net-$N \
            --region=REGION \
            --range=192.168.$N.0/24
    
          gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \
            --network=GVNIC_NAME_PREFIX-net-$N \
            --action=ALLOW \
            --rules=tcp:0-65535,udp:0-65535,icmp \
            --source-ranges=192.168.0.0/16
        done
    
        # Create SSH firewall rules
        gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \
          --network=GVNIC_NAME_PREFIX-net-0 \
          --action=ALLOW \
          --rules=tcp:22 \
          --source-ranges=IP_RANGE
    
        # Assumes that an external IP is only created for vNIC 0
        gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \
          --network=GVNIC_NAME_PREFIX-net-0 \
          --action=ALLOW \
          --rules=icmp \
          --source-ranges=IP_RANGE
    
      
  2. 如需多個 A4X 子區塊,請使用下列指令碼,為每個 A4X 執行個體上的四個 CX-7 NIC 建立 RoCE 虛擬私有雲網路和子網路。

      
        # List and make sure network profiles exist in the machine type's zone
        gcloud compute network-profiles list --filter "location.name=ZONE"
    
        # Create network for CX-7
        gcloud compute networks create RDMA_NAME_PREFIX-mrdma \
          --network-profile=ZONE-vpc-roce \
          --subnet-mode custom \
          --mtu=8896
    
        # Create subnets
        for N in $(seq 0 3); do
          gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \
            --network=RDMA_NAME_PREFIX-mrdma \
            --region=REGION \
            --range=192.168.$((N+2)).0/24 & # offset to avoid overlap with gVNICs
        done
    
      

    更改下列內容:

    • GVNIC_NAME_PREFIX:用於 gVNIC 的一般虛擬私有雲網路和子網路的自訂名稱前置字元。
    • RDMA_NAME_PREFIX:用於 CX-7 NIC 的 RoCE 虛擬私有雲網路和子網路的自訂名稱前置字元。
    • ZONE:指定要使用的機型所在的可用區域,例如 us-central1-a。如需地區相關資訊,請參閱「各個地區和區域的 GPU 供應情形」。
    • REGION:要建立子網路的區域。這個區域必須與指定的可用區相符。舉例來說,如果可用區是 us-central1-a,則區域為 us-central1
    • IP_RANGE:用於 SSH 防火牆規則的 IP 範圍。
  3. 選用:如要確認虛擬私有雲網路資源是否建立成功,請在 Google Cloud 控制台中檢查網路設定:
    1. 前往 Google Cloud 控制台的「VPC Networks」(虛擬私有雲網路) 頁面。

      前往「VPC networks」(虛擬私有雲網路)

    2. 在清單中搜尋您在上一個步驟中建立的網路。
    3. 如要查看子網路、防火牆規則和其他網路設定,請按一下網路名稱。

建立密集配置政策

如要建立精簡的刊登位置政策,請選取下列任一選項:

gcloud

如要建立精簡的放置位置政策,請使用 gcloud beta compute resource-policies create group-placement 指令

gcloud beta compute resource-policies create group-placement POLICY_NAME \
    --collocation=collocated \
    --gpu-topology=1x72 \
    --region=REGION

更改下列內容:

  • POLICY_NAME:密集配置政策的名稱。
  • REGION:要建立密集配置政策的區域。指定您要使用的機器類型適用的區域。如要瞭解地區,請參閱「各個地區和區域的 GPU 供應情形」。

REST

如要建立密集配置政策,請對 betaresourcePolicies.insert 方法發出 POST 要求。

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/resourcePolicies
  {
    "name": "POLICY_NAME",
    "groupPlacementPolicy": {
      "collocation": "COLLOCATED",
      "gpuTopology": "1x72"
    }
  }

更改下列內容:

  • PROJECT_ID:專案 ID
  • POLICY_NAME:密集配置政策的名稱。
  • REGION:要建立密集配置政策的區域。指定您要使用的機器類型適用的區域。如要瞭解地區,請參閱「各個地區和區域的 GPU 供應情形」。

大量建立 A4X 執行個體

如要取得 1x72 的 GPU 拓撲,請建立 18 個執行個體。建立執行個體時,請套用指定 gpuTopology 欄位的緊湊配置政策。套用這項政策後,Compute Engine 會在一個子區塊中建立所有 18 個執行個體,以使用 NVLink 網域。

如果子區塊沒有足夠的容量容納所有 18 個執行個體,大量建立作業就會失敗,且不會建立任何執行個體。

如果工作負載可使用少於 18 個執行個體運作,則可將 minCount 欄位設為工作負載所需的執行個體數量下限。如要使用任何可用容量,請將 minCount 欄位設為 1

如要大量建立 A4X 執行個體,請選取下列任一選項。

下列指令也會設定執行個體的存取範圍。為簡化權限管理,Google 建議您將執行個體的存取權範圍設為 cloud-platform 存取權,然後使用 IAM 角色定義執行個體可存取的服務。詳情請參閱「範圍最佳做法」。

gcloud

如要大量建立 VM,請使用 gcloud compute instances bulk create 指令

gcloud compute instances bulk create \
    --name-pattern=NAME_PATTERN \
    --count=COUNT \
    --machine-type=a4x-highgpu-4g \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE \
    --restart-on-failure \
    --resource-policies=POLICY_NAME

更改下列內容:

  • NAME_PATTERN:VM 的名稱模式。舉例來說,如果使用 vm-# 做為名稱模式,就會產生 vm-1vm-2 等名稱的 VM,最多可達 --count 指定的 VM 數量。
  • COUNT:要建立的 VM 數量。
  • IMAGE_FAMILY:您要使用的 OS 映像檔映像檔系列。 如需支援的作業系統清單,請參閱「支援的作業系統」。
  • IMAGE_PROJECT:OS 映像檔的專案 ID。
  • REGION:指定要使用的機器類型所在的區域。您必須使用與密集配置政策相同的區域。如需地區相關資訊,請參閱「各區域和可用區的 GPU 供應情形」。
  • DISK_SIZE:開機磁碟的大小,單位為 GB。
  • GVNIC_NAME_PREFIX:建立使用 gVNIC NIC 的標準虛擬私有雲網路和子網路時,您指定的前置字元名稱。
  • RDMA_NAME_PREFIX:建立使用 RDMA NIC 的虛擬私有雲網路和子網路時指定的名稱前置字元。
  • RESERVATION:預留項目名稱、區塊或預留項目內的子區塊。如要取得預留名稱或可用區塊,請參閱「查看預留容量」。根據執行個體放置位置的需求,選擇下列其中一個選項:
    • 如要在任何單一區塊上建立執行個體,請執行下列操作:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
          
    • 如要在特定區塊上建立執行個體,請執行下列步驟:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
          
    • 如要在特定子區塊中建立執行個體:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
          
  • TERMINATION_ACTION:Compute Engine 在預訂期間結束時,是停止 (STOP) 還是刪除 (DELETE) VM。

  • POLICY_NAME:密集配置政策的名稱。

REST

如要大量建立 VM,請對 instances.bulkInsert 方法發出 POST 要求。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/bulkInsert
{
  "namePattern":"NAME_PATTERN",
  "count":"COUNT",
  "instanceProperties":{
    "machineType":"a4x-highgpu-4g",
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "serviceAccounts": [
      {
        "email": "default",
        "scopes": [
          "https://www.googleapis.com/auth/cloud-platform"
        ]
      }
    ],
    "networkInterfaces": [
      {
        "accessConfigs": [
          {
            "name": "external-nat",
            "type": "ONE_TO_ONE_NAT"
          }
        ],
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
        "nicType": "GVNIC",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
      },
      {
        "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
        "nicType": "MRDMA",
        "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
      }
    ],
    "reservationAffinity":{
        "consumeReservationType":"SPECIFIC_RESERVATION",
        "key":"compute.googleapis.com/reservation-name",
        "values":[
          "RESERVATION"
        ]
      },
    "scheduling":{
        "provisioningModel":"RESERVATION_BOUND",
        "instanceTerminationAction":"DELETE",
        "onHostMaintenance": "TERMINATE",
        "automaticRestart":true
      },
    "resourcePolicies": [
      "projects/PROJECT_ID/regions/REGION/resourcePolicies/POLICY_NAME"
    ]
  }
}

更改下列內容:

  • PROJECT_ID:您要在當中建立 VM 的專案 ID。
  • ZONE:指定您要使用的機型所在的區域。您必須使用與密集配置政策位於相同區域的可用區。 如需地區相關資訊,請參閱「各區域和可用區的 GPU 供應情形」。
  • NAME_PATTERN:VM 的名稱模式。舉例來說,如果使用 vm-# 做為名稱模式,就會產生 vm-1vm-2 等名稱的 VM,最多可達 --count 指定的 VM 數量。
  • COUNT:要建立的 VM 數量。
  • VM_NAME:VM 的名稱。
  • DISK_SIZE:開機磁碟的大小,單位為 GB。
  • IMAGE_PROJECT:OS 映像檔的專案 ID。
  • IMAGE_FAMILY:您要使用的 OS 映像檔映像檔系列。 如需支援的作業系統清單,請參閱「支援的作業系統」。
  • NETWORK_PROJECT_ID:網路的專案 ID。
  • GVNIC_NAME_PREFIX:建立使用 gVNIC NIC 的標準虛擬私有雲網路和子網路時,您指定的前置字元名稱。
  • REGION:子網路的區域。
  • RDMA_NAME_PREFIX:建立使用 RDMA NIC 的虛擬私有雲網路和子網路時指定的名稱前置字元。
  • RESERVATION:預留項目名稱、區塊或預留項目內的子區塊。如要取得預留名稱或可用區塊,請參閱「查看預留容量」。根據執行個體放置位置的需求,選擇下列其中一個選項:
    • 如要在任何單一區塊上建立執行個體,請執行下列操作:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
          
    • 如要在特定區塊上建立執行個體,請執行下列步驟:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
          
    • 如要在特定子區塊中建立執行個體:
          projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
          
  • TERMINATION_ACTION:Compute Engine 在預訂期間結束時,是停止 (STOP) 還是刪除 (DELETE) VM。

  • PROJECT_ID:精簡放置政策的專案 ID。
  • REGION:密集配置政策的區域。
  • POLICY_NAME:密集配置政策的名稱。

如要進一步瞭解大量建立 VM 時的設定選項,請參閱 Compute Engine 說明文件中的「大量建立 VM」。

後續步驟