使用「取決於預留項目」模式建立執行個體

本文說明如何使用與預留項目綁定的佈建模型,建立獨立的 Compute Engine 執行個體。這個佈建模型可讓您使用預先保留的容量,建立 A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High (配備 8 個 GPU)、A3 Edge 或 H4D 執行個體。

如要瞭解如何使用與預留項目綁定的佈建模型建立運算執行個體,請參閱 AI Hypercomputer 說明文件中的「部署選項總覽」。

事前準備

  • 如果尚未設定驗證,請先完成設定。 驗證可確認您的身分,以便存取 Google Cloud 服務和 API。如要從本機開發環境執行程式碼或範例,請選取下列其中一個選項,向 Compute Engine 進行驗證:

    選取這個頁面上的分頁,瞭解如何使用範例:

    控制台

    使用 Google Cloud 控制台存取 Google Cloud 服務和 API 時,無須設定驗證。

    gcloud

    1. 安裝 Google Cloud CLI。 完成後,執行下列指令來初始化 Google Cloud CLI:

      gcloud init

      若您採用的是外部識別資訊提供者 (IdP),請先使用聯合身分登入 gcloud CLI

  • 設定預設地區和區域
  • REST

    如要在本機開發環境中使用本頁的 REST API 範例,請使用您提供給 gcloud CLI 的憑證。

      安裝 Google Cloud CLI。

      若您採用的是外部識別資訊提供者 (IdP),請先使用聯合身分登入 gcloud CLI

    詳情請參閱 Google Cloud 驗證說明文件中的「使用 REST 進行驗證」。

必要的角色

如要取得使用預留項目繫結佈建模型建立運算執行個體所需的權限,請要求系統管理員授予您專案的 Compute 執行個體管理員 (v1) (roles/compute.instanceAdmin.v1) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

這個預先定義的角色具備使用預留項目繫結佈建模型建立運算執行個體所需的權限。如要查看確切的必要權限,請展開「Required permissions」(必要權限) 部分:

所需權限

如要使用預留項目綁定佈建模型建立運算執行個體,必須具備下列權限:

  • 專案的 compute.instances.create
  • 如要使用自訂映像檔建立 VM: compute.images.useReadOnly 在映像檔上
  • 如要使用快照建立 VM: compute.snapshots.useReadOnly 快照
  • 如要使用執行個體範本建立 VM,請按照下列步驟操作: compute.instanceTemplates.useReadOnly 在執行個體範本上
  • 如要為 VM 指定子網路,請在專案或所選子網路上授予 compute.subnetworks.use 權限。
  • 如要為 VM 指定靜態 IP 位址: 專案的 compute.addresses.use
  • 使用虛擬私有雲網路時,如要將外部 IP 位址指派給 VM: compute.subnetworks.useExternalIp 專案或所選子網路的權限
  • 如要將舊版網路指派給 VM,請按照下列步驟操作: compute.networks.use 專案的
  • 使用舊版網路時,如要將外部 IP 位址指派給 VM,請在專案中設定 compute.networks.useExternalIp
  • 如要為 VM 設定 VM 執行個體中繼資料,請在專案中執行下列指令: compute.instances.setMetadata
  • 如要為 VM 設定標記,請按照下列步驟操作: compute.instances.setTags 在 VM 上
  • 如要為 VM 設定標籤,請按照下列步驟操作: compute.instances.setLabels 在 VM 上
  • 如要設定 VM 使用的服務帳戶,請按照下列步驟操作: compute.instances.setServiceAccount 在 VM 上
  • 為 VM 建立新磁碟: compute.disks.create 專案
  • 如要以唯讀或讀寫模式附加現有磁碟: 磁碟的 compute.disks.use
  • 如要以唯讀模式連接現有磁碟: compute.disks.useReadOnly 磁碟的權限

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

建立使用「取決於預留項目」佈建模式的執行個體

如要使用受預留項目限制的佈建模式建立 A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High (含 8 個 GPU) 或 H4D 執行個體,必須等到要使用的自動建立預留項目達到開始時間。此外,您打算建立的運算執行個體必須符合下列所有需求:

以下範例會在日曆模式中建立五個 A3 Ultra 執行個體的未來預留項目要求,然後建立 A3 Ultra 執行個體,並使用系統為要求自動建立的預留項目。

如要使用「取決於預留項目」佈建模式建立範例運算執行個體,請選取下列任一選項:

控制台

  1. 建立五個 A3 Ultra 執行個體的要求範例,並提交審查:

    1. 前往 Google Cloud 控制台的「Reservations」(預留項目) 頁面。

      前往「Reservations」(預留項目) 頁面

    2. 點選「Future reservations」(未來預留項目) 分頁標籤

    3. 按一下 「Create future reservation」(建立未來預留項目)。「Create a future reservation」(建立未來預留項目) 頁面隨即顯示。

    4. 按一下「GPU」分頁標籤,然後在「GPU type」(GPU 類型) 清單中,選取「NVIDIA H200 141GB」。這項動作會指定 A3 Ultra 執行個體。

    5. 在「Total capacity needed」(所需總容量) 欄位中輸入 5

    6. 在「預留期間」部分,指定預留期間的開始時間和長度。

    7. 按一下「搜尋容量」,然後在「可用容量」部分,選取其中一部可用機器。

    8. 點選「建立」

  2. 在要求開始時間,如要建立 A3 Ultra 執行個體來使用自動建立的範例預留項目,請按照下列步驟操作:

    1. 前往 Google Cloud 控制台的「Create an instance」(建立執行個體) 頁面。

      前往「建立執行個體」

    2. 在「Name」(名稱) 欄位中,輸入運算執行個體的名稱。在本範例中,請輸入 example-instance

    3. 指定自動建立預留資源的「Region」(區域) 和「Zone」(可用區)。在本範例中,請分別選取「us-central1」和「us-central1-b」

    4. 按一下「GPU」分頁標籤,然後在「GPU type」(GPU 類型) 清單中,選取「NVIDIA H200 141GB」。這項動作會指定 A3 Ultra 執行個體,並將佈建模式設為「取決於預留項目」

    5. 在導覽選單中,按一下「進階」

    6. 在「Reservations」(預留項目) 部分,選取「Choose a reservation」(選取預留項目),然後點選「Choose a reservation」(選取預留項目)

    7. 在「選擇預留項目」窗格中,執行下列操作:

      1. 選取自動建立的範例預留項目。

      2. 按一下「選擇」

    8. 在「佈建模式」部分,展開「VM 佈建模式進階設定」部分。

    9. 在「On VM termination」(在 VM 終止時) 清單中,選取「Stop」(停止) (預設) 或「Delete」(刪除)

    10. 點選「建立」

gcloud

  1. 如要建立五個 A3 Ultra 執行個體的要求範例,並提交審查,請使用 gcloud beta compute future-reservations create 指令

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-setting=local \
        --start-time=2026-03-05T00:00:00Z \
        --end-time=2026-03-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-b
    

    假設 Google Cloud 核准要求,Compute Engine 會自動建立空白預留項目。在 2026 年 3 月 5 日的請求開始時間,Compute Engine 會增加預留項目中的預留 GPU 執行個體數量。接著即可使用預留項目。

  2. 在要求開始時間,如要建立 A3 Ultra 執行個體來使用範例自動建立的預留項目,請使用 gcloud compute instances create 指令搭配下列旗標:

    • --instance-termination-action 標記。

    • --provisioning-model 旗標設為 RESERVATION_BOUND

    • --reservation 標記。

    • --reservation-affinity 旗標設為 specific

    指令類似於下列內容。如要瞭解建立 A3 Ultra 執行個體的完整需求,請參閱「建立 A3 Ultra 或 A4 執行個體」。

    gcloud compute instance create example-a3ultra-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-b \
        ...
    

    這項指令包含下列值:

    • TERMINATION_ACTION:在預訂期結束時,Compute Engine 是要停止 (STOP) 還是刪除 (DELETE) 運算執行個體。

    • RESERVATION_URL:預訂網址,格式如下:

      • 如果專案中已有自動建立的預留項目: example-reservation.

      • 如果自動建立的預留項目位於其他專案: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. 如要建立五個 A3 Ultra 執行個體的要求範例,並提交審查,請對 Beta 版 futureReservations.insert 方法發出 POST 要求:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2026-03-05T00:00:00Z",
        "endTime": "2026-03-19T00:00:00Z"
      }
    }
    

    假設 Google Cloud 核准要求,Compute Engine 會自動建立空白預留項目。在 2026 年 3 月 5 日的請求開始時間,Compute Engine 會增加預留項目中的預留 GPU 執行個體數量。接著即可使用預留項目。

  2. 在要求開始時間,如要建立 A3 Ultra 執行個體來使用範例自動建立的預留項目,請對 instances.insert 方法提出 POST 要求。在要求主體中加入下列欄位:

    • reservationAffinity.consumeReservationType 欄位設為 SPECIFIC_RESERVATION

    • reservationAffinity.key 欄位設為 compute.googleapis.com/reservation-name

    • reservationAffinity.values」欄位設為預訂網址。

    • scheduling.instanceTerminationAction 欄位。

    • scheduling.provisioningModel 欄位設為 RESERVATION_BOUND

    要求類似於下列內容。如要瞭解建立 A3 Ultra 執行個體的完整需求,請參閱「建立 A3 Ultra 或 A4 執行個體」。

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
        "name": "example-a3ultra-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    要求主體包含下列值:

    • RESERVATION_URL:預訂網址,格式如下:

      • 如果專案中已有自動建立的預留項目: example-reservation.

      • 如果自動建立的預留項目位於其他專案: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION:在預訂期結束時,Compute Engine 是要停止 (STOP) 還是刪除 (DELETE) 運算執行個體。

後續步驟

歡迎試用

如果您未曾使用過 Google Cloud,歡迎建立帳戶,親自體驗實際使用 Compute Engine 的成效。新客戶還能獲得價值 $300 美元的免費抵免額,能用於執行、測試及部署工作負載。

免付費試用 Compute Engine