アカウント チームを通じて容量を予約する

このドキュメントでは、AI Hypercomputer の使用オプションで将来の予約を使用して容量を取得する方法について説明します。 AI Hypercomputer のすべての容量オプションについては、 容量の概要をご覧ください。

ワークロードに必要なリソースを確実に確保するには、Google に将来の 予約をリクエストします。このアクションを使用すると、選択した特定の日時から始まる定義済みの期間に容量ブロックを予約できます。 リクエストに基づいて、Google により 将来の予約リクエストのドラフトが作成されます。このドラフト リクエストを確認して送信し、 Google Cloud が承認すると、Compute Engine は空の予約を自動的に作成します(自動作成)。 次に、選択した開始時刻に、Compute Engine はリクエストされた容量を 自動作成された予約にプロビジョニングします。予約期間が終了するまで、予約を使用して Compute Engine インスタンス を作成できます。

制限事項

このセクションでは、将来の予約リクエストと、リクエストに対して自動作成された 予約の制限事項について説明します。

将来の予約リクエストの制限事項

Google が将来の予約リクエストのドラフトを作成した後、次の制限が適用されます 。

  • 共有タイプなど、リクエストの詳細を変更することはできません。
  • リクエストが送信され、承認されて状態が PROVISIONING に変わると、リクエストのキャンセルや削除はできません。使用量に関係なく、リクエストの 開始時間からリクエストした容量の料金を支払う必要があります。

自動作成の予約に関する制限事項

Compute Engine がリクエストされた容量を満たすオンデマンド予約を作成すると、 次の制限が適用されます。

  • 予約を使用または変更できるのは、リクエストの開始時刻以降です。
  • 予約を変更できるのは、次のとおりです。

    予約内の他のプロパティを変更するには、アカウント チームにお問い合わせください。

  • 予約を手動で削除することはできません。容量を予約するときに、予約期間の終了時に予約を自動的に削除しないように指定した場合は、アカウント チームに連絡して予約を削除する必要があります。

始める前に

必要なロール

将来の予約リクエストを作成するために必要な権限を取得するには、プロジェクトに対するCompute の将来の予約ユーザー roles/compute.futureReservationUser)IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには、将来の予約リクエストを作成するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

将来の予約リクエストを作成するには、次の権限が必要です。

  • Compute Engine で予約を自動作成できるようにする: プロジェクトに対する compute.reservations.create 権限
  • 将来の予約リクエストを作成する: プロジェクトに対する compute.futureReservations.create 権限
  • インスタンス テンプレートを指定する: インスタンス テンプレートに対する compute.instanceTemplates.useReadOnly

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

Quota

将来の予約リクエスト プロセスの一環として、Google は予約済み リソースの割り当てを管理します。割り当てをリクエストする必要はありません。承認された将来の予約が開始される際に、 予約された リソースの割り当てがプロジェクトに不足している場合、Google は割り当てを自動的に増やします。

概要

容量ブロックを予約する手順は次のとおりです。

  1. アカウント チームを通じて容量をリクエストする 。予約するリソースのタイプ と数を指定するには、アカウント チームにお問い合わせください。
  2. 予約リクエストのドラフトを確認して送信する 。Google が将来の 予約リクエストのドラフトを作成したら、確認します。問題がなければ、審査をリクエストします。 Google Cloud がすぐに承認します。

アカウント チームを通じて容量をリクエストする

アカウント チームに連絡し、次の情報を提供して、Google が将来の予約リクエストのドラフトを作成できるようにします。

  • プロジェクト番号: アカウント チームがリクエストを作成し、 Compute Engine が容量をプロビジョニングするプロジェクトの番号。
  • マシンタイプ: 予約するマシンタイプ。次のいずれかを指定できます。
    • A4X Max(a4x-maxgpu-4g-metal
    • A4X(a4x-highgpu-4g
    • A4(a4-highgpu-8g
    • A3 Ultra(a3-ultragpu-8g
    • A3 Mega(a3-megagpu-8g
    • A3 High(a3-highgpu-8g
  • ゾーン: 容量を予約するゾーン。 GPU マシンタイプで使用可能なリージョンとゾーンを確認するには、 アクセラレータの可用性をご覧ください。
  • 合計数: 予約するコンピューティング インスタンスの合計数。予約できるのは、 2 の倍数のコンピューティング インスタンスのみです。ブロックサイズとブロックあたりのコンピューティング インスタンス数は、 マシンタイプと可用性によって異なります。リクエストの詳細については、アカウント チームにお問い合わせください。
  • 開始時間: 予約期間の開始時間。この時点で、予約済み 容量の使用を開始できます。開始時間を RFC 3339 タイムスタンプの形式で指定します。
    YYYY-MM-DDTHH:MM:SSOFFSET
    

    次のように置き換えます。

    • YYYY-MM-DD: 4 桁の年、2 桁の月、 2 桁の日でハイフン(-)で区切られた日付。
    • HH:MM:SS:24 時間形式の 2 桁の時間、2 桁の分、2 桁の秒でコロン(:)で区切られた時刻。
    • OFFSET: 協定世界時(UTC)のオフセット形式で示されるタイムゾーン。たとえば、太平洋標準時(PST)を使用する場合は -08:00 を指定します。オフセットを使用しない場合は、 Z を指定します。
  • 終了時間: 予約期間の終了時間。RFC 3339 タイムスタンプの形式で指定します。このとき、Compute Engine は次の処理を行います。
    • Compute Engine は自動作成された予約を削除します。
    • コンピューティング インスタンスに指定した 終了アクションに基づいて、 Compute Engine は 自動作成の予約を使用して作成した コンピューティング インスタンスを 停止または削除します。
  • 予約名: 予約した容量を提供するために Compute Engine が作成する予約の名前。Compute Engine は、 明示的にターゲットに設定された予約のみを作成できます。
  • 予約の自動削除: 予約期間の終了時に Compute Engine が自動作成された予約を自動的に 削除するかどうか。予約を手動で 削除する場合は、アカウント チームに連絡して予約を削除する必要があります。
  • メンテナンス スケジューリング タイプ: Compute Engine がクラスタ内のコンピューティング インスタンスのホスト メンテナンスをスケジュールする方法。次のいずれかのオプションを指定します。
    • 予約済みブロック内のすべての A4X Max、A4X、A4、A3 Ultra インスタンスでメンテナンスを同期するには、GROUPED を使用します。
    • A4 または A3 Ultra インスタンスに異なるメンテナンス スケジュールを使用するには、INDEPENDENT を使用します。
  • 予約の運用モード: ホストエラーまたはホストの障害レポート後に、ユーザーまたは Google Cloud がコンピューティング インスタンスの復元プロセスを管理するかどうか。使用するモードは、予約するマシンタイプによって異なります:
    • すべての容量モード(ALL_CAPACITY。このモードは、A4X Max マシンタイプと A4X マシンタイプ 専用です。コンピューティング インスタンスのメンテナンスと復元プロセスを手動で管理する必要があります。ただし、予約内のすべてのマシンにフルアクセスでき、コンピューティング インスタンスのトポロジとメンテナンスをより きめ細かく制御できます。
    • マネージド モード(HIGHLY_AVAILABLE_CAPACITY。このモードは、A4、A3 Ultra、 A3 Mega、A3 High マシンタイプ専用です。 が、障害のあるマシンを自動的に置き換えることで、コンピューティング インスタンスのメンテナンスと 復元プロセスを管理します。 Google Cloud この アプローチにより、コンピューティング インスタンスの可用性が向上し、新しいホストでインスタンスをすばやく再起動できます 。ただし、Compute Engine がマシンを交換すると、コンピューティング インスタンスのトポロジが変更されることがあります。
  • 共有タイプ: 自動作成された 予約を使用できるのが自分のプロジェクトのみか(LOCAL)、他のプロジェクトも予約を使用できるか (SPECIFIC_PROJECTS)。このプロパティは、リクエストの送信後に変更できません。予約済み容量を組織内の他のプロジェクトと共有するには、次の操作を行います。
    1. まだ確認していない場合は、Google がリクエストを作成するプロジェクトで共有予約の作成が許可されていることを確認します。
    2. 予約済み容量を共有するプロジェクトの番号を指定します。組織で最大 100 個のプロジェクトを指定できます。
  • コミットメント名: 予約期間が 1 年以上の場合は、リソースベースのコミットメントを購入して、予約済みリソースに関連付ける必要があります。予約期間が 1 年以上 3 年未満の場合、コミットメント により 1 年間の確約利用割引(CUD)料金が適用されます。予約期間が 3 年以上 6 年未満の場合、コミットメントにより 3 年間の CUD 料金が適用されます。

    予約した容量を他のプロジェクトと共有する場合、それらのプロジェクトが割引を受けるのは、容量を予約したプロジェクトと同じ Cloud 請求先アカウントを使用している場合のみです。 詳細については、リソースベースのコミットメントで CUD の共有を有効にするをご覧ください。

    コミットメントの開始日と終了日は予約と同じですが、有効化の時間は異なる場合があります 。予約の開始時刻を米国およびカナダの太平洋時間の午前 0 時に指定すると、 コミットメントは選択した開始日の午前 0 時に有効になります。別の開始時刻を指定すると、コミットメントは選択した開始日の翌日の午前 0 時に有効になります。

Google が将来の予約リクエストのドラフトを作成すると、アカウント チームから連絡があります。

予約リクエストのドラフトを確認して送信する

予約するリソースのタイプと量をアカウント チームに提供すると、Google が将来の予約リクエストのドラフトを作成します。ドラフトのリクエストを確認し、内容が正しければ 審査をリクエストします。リクエストの開始時刻より前にリクエストを送信する必要があります。

将来の予約リクエストのドラフトを確認して送信するには、次のいずれかのオプションを選択します。

コンソール

  1. Google Cloud コンソールで、[予約] ページに移動します。

    [予約] に移動

  2. [将来の予約] タブをクリックします。[将来の予約] 表には、プロジェクトの将来の予約リクエストがそれぞれ一覧表示されます。表の各列はプロパティを表します。
  3. [名前] 列で、Google が作成したドラフト リクエストの名前をクリックします。将来の予約リクエストの詳細が表示されたページが開きます。A
  4. [基本情報] セクションで、[日付] や [共有タイプ] といったリクエストの詳細が正しいことを確認します。また、コミットメントをリクエストした場合は、コミットメントが 指定されていることを確認します。これらの情報に誤りがある場合は、アカウント チームにお問い合わせください。
  5. すべて正しく入力されていることを確認したら、リクエストを送信します。

    1. [Edit draft] をクリックします。ドラフト リクエストを変更するページが表示されます。
    2. [作成] をクリックします。The [Reservation] page appears. Google Cloud が数分以内にリクエストを承認すると、Compute Engine はリクエストされたリソースを使用して空の予約を作成します。

gcloud

  1. プロジェクトの将来の予約リクエストのリストを確認するには、 gcloud compute future-reservations list コマンド--filter フラグを PROCUREMENT_STATUS=DRAFTING に設定します:
    gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
    
  2. コマンド出力で、アカウント チームに提供した名前の予約リクエストを探します。
  3. ドラフト リクエストの詳細を確認するには、 gcloud compute future-reservations describe コマンドを使用します:
    gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \
        --zone=ZONE
    

    次のように置き換えます。

    • FUTURE_RESERVATION_NAME: 将来の予約リクエストのドラフトの名前 。
    • ZONE: Google がリクエストを作成したゾーン。

    出力は次のようになります。

    autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z'
    creationTimestamp: '2025-11-27T11:14:58.305-08:00'
    deploymentType: DENSE
    id: '7979651787097007552'
    kind: compute#futureReservation
    name: example-draft-request
    planningStatus: DRAFT
    reservationName: example-reservation
    schedulingType: INDEPENDENT
    selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request
    selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552
    specificReservationRequired: true
    specificSkuProperties:
      instanceProperties:
        guestAccelerators:
        -   acceleratorCount: 8
          acceleratorType: nvidia-h200-141gb
        localSsds:
        -   diskSizeGb: '375'
          interface: NVME
        ...
      machineType: a3-ultragpu-8g
    totalCount: '2'
    status:
      autoCreatedReservations:
      -   https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation
      fulfilledCount: '2'
      lockTime: '2026-01-27T19:15:00Z'
      procurementStatus: DRAFTING
    timeWindow:
      endTime: '2026-02-10T19:20:00Z'
      startTime: '2026-01-27T19:20:00Z'
    zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b
    
  4. コマンド出力で、予約期間や共有 タイプなどのリクエストの詳細が正しいことを確認します。また、コミットメントを購入した場合は、それが指定されていることを確認します。詳細情報が間違っている場合は、 アカウント チームにお問い合わせください。
  5. 審査を受けるためにドラフト リクエストを送信するには、 gcloud compute future-reservations update コマンド--planning-status フラグを SUBMITTED に設定して使用します:
    gcloud compute future-reservations update FUTURE_RESERVATION_NAME \
        --planning-status=SUBMITTED \
        --zone=ZONE
    

    数分以内に、 Google Cloud がリクエストを承認し、 Compute Engine がリクエストされたリソースを使用して空の予約を作成します。

REST

  1. プロジェクト内の将来の予約リクエストのリストを確認するには、futureReservations.list メソッドGET リクエストを送信します。リクエスト URL に filter クエリ パラメータを含め、status.procurementStatus=DRAFTING に設定します。
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
    

    次のように置き換えます。

    • PROJECT_ID: Google が将来の予約のドラフト リクエストを作成したプロジェクトの ID。
    • ZONE: リクエストが存在するゾーン。
  2. リクエストの出力で、アカウント チームに提供した名前の予約リクエストを探します。
  3. ドラフト リクエストの詳細を表示するには、GET リクエストを ベータ版 futureReservations.get メソッドに送信します:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
    

    FUTURE_RESERVATION_NAME は、将来の予約リクエストのドラフトの名前に置き換えます。

    出力は次のようになります。

    {
      "specificSkuProperties": {
        "instanceProperties": {
          "machineType": "a3-ultragpu-8g",
          "guestAccelerators": [
            {
              "acceleratorType": "nvidia-h200-141gb",
              "acceleratorCount": 8
            }
          ],
          "localSsds": [
            {
              "diskSizeGb": "375",
              "interface": "NVME"
            },
            ...
          ]
        },
        "totalCount": "2"
      },
      "kind": "compute#futureReservation",
      "id": "7979651787097007552",
      "creationTimestamp": "2025-11-27T11:14:58.305-08:00",
      "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request",
      "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552",
      "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b",
      "name": "example-draft-request",
      "timeWindow": {
        "startTime": "2026-01-27T19:20:00Z",
        "endTime": "2026-02-10T19:20:00Z"
      },
      "status": {
        "procurementStatus": "DRAFTING",
        "lockTime": "2026-01-27T19:15:00Z"
      },
      "planningStatus": "DRAFT",
      "specificReservationRequired": true,
      "reservationName": "example-reservation",
      "deploymentType": "DENSE",
      "schedulingType": "INDEPENDENT",
      "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z"
    }
    
  4. 出力で、予約期間や共有タイプなどのリクエストの詳細が正しいことを確認します。 また、コミットメントをリクエストした場合は、コミットメントが指定されていることを確認します。詳細情報が間違っている場合は、 アカウント チームにお問い合わせください。
  5. 審査を受けるためにドラフト リクエストを送信するには、PATCH リクエストを ベータ版 futureReservations.update メソッドに送信します。 リクエスト URL に updateMask クエリ パラメータを含め、 に設定します: planningStatus
    PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "planningStatus": "SUBMITTED"
    }
    

    数分以内に、 Google Cloud がリクエストを承認し、Compute Engine がリクエストされたリソースを使用して空の予約を作成します。

次のステップ