このドキュメントでは、AI Hypercomputer の使用オプションで将来の予約を使用する場合に容量を取得する方法について説明します。AI Hypercomputer のすべての容量オプションについては、容量の概要をご覧ください。
ワークロードに必要なリソースを確実に確保するには、Google に将来の予約をリクエストします。このアクションを使用すると、選択した特定の日時から始まる定義済みの期間に容量ブロックを予約できます。リクエストに基づいて、将来の予約リクエストのドラフトが作成されます。このドラフト リクエストを確認して送信し、 Google Cloudが承認すると、Compute Engine は空の予約を自動的に作成します。次に、選択した開始時刻に、Compute Engine はリクエストされた容量を自動作成された予約にプロビジョニングします。予約期間が終了するまで、予約を使用して Compute Engine インスタンスを作成できます。
制限事項
このセクションでは、将来の予約リクエストと、リクエストに対して自動作成された予約の制限事項について説明します。
将来の予約リクエストの制限事項
Google が将来の予約リクエストのドラフトを作成した後、次の制限が適用されます。
- 共有タイプなど、リクエストの詳細を変更することはできません。
- リクエストが送信され、承認されて状態が
PROVISIONINGに変わると、リクエストのキャンセルや削除はできません。使用量に関係なく、リクエストの開始時間からリクエストした容量の料金を支払う必要があります。
自動作成の予約に関する制限事項
Compute Engine がリクエストされた容量を満たすオンデマンド予約を作成すると、次の制限が適用されます。
- 予約を使用または変更できるのは、リクエストの開始時刻以降です。
-
予約を変更できるのは、次の場合に限られます。
予約内の他のプロパティを変更するには、Google のアカウント担当者にお問い合わせください。
- 予約を手動で削除することはできません。容量を予約するときに、予約期間の終了時に予約を自動的に削除しないように指定した場合は、Google のアカウント担当者 に連絡して予約を削除する必要があります。
始める前に
まだ行っていない場合は、使用可能な VM とクラスタの構成を確認します。
-
このページのサンプルをどのように使うかに応じて、タブを選択してください。
コンソール
Google Cloud コンソールを使用して Google Cloud サービスと API にアクセスする場合、認証を設定する必要はありません。
gcloud
Google Cloud コンソールで Cloud Shell をアクティブにします。
Google Cloud コンソールの下部にある Cloud Shell セッションが開始し、コマンドライン プロンプトが表示されます。Cloud Shell はシェル環境です。Google Cloud CLI がすでにインストールされており、現在のプロジェクトの値もすでに設定されています。セッションが初期化されるまで数秒かかることがあります。
REST
このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。
Google Cloud CLI をインストールします。
外部 ID プロバイダ(IdP)を使用している場合は、まず連携 ID を使用して gcloud CLI にログインする必要があります。
詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。
必要なロール
将来の予約リクエストを作成するために必要な権限を取得するには、プロジェクトに対する Compute の将来の予約ユーザー(roles/compute.futureReservationUser)IAM ロールを付与するよう管理者に依頼してください。
ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。
この事前定義ロールには、将来の予約リクエストを作成するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。
必要な権限
将来の予約リクエストを作成するには、次の権限が必要です。
-
Compute Engine で予約を自動作成できるようにする: プロジェクトに対する
compute.reservations.create権限 -
将来の予約リクエストを作成する: プロジェクトに対する
compute.futureReservations.create権限 - インスタンス テンプレートを指定する: インスタンス テンプレートに対する
compute.instanceTemplates.useReadOnly
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
割り当て
将来の予約リクエスト プロセスの一環として、Google は予約済みリソースの割り当てを管理します。割り当てをリクエストする必要はありません。承認された将来の予約が開始される際に、予約されたリソースの割り当てがプロジェクトで不足している場合、Google は割り当てを自動的に増やします。
概要
容量ブロックを予約する手順は次のとおりです。
- アカウント チームを通じて容量をリクエストします。予約するリソースのタイプと数を指定するには、アカウント担当者にお問い合わせください。
- 予約リクエストのドラフトを確認して送信します。Google が将来の予約リクエストのドラフトを作成したら、確認します。正しく入力されていることを確認したら、審査をリクエストします。 Google Cloud がすぐに承認します。
アカウント チームを通じて容量をリクエストする
Google のアカウント担当者に連絡し、次の情報を提供して、Google が将来の予約リクエストのドラフトを作成できるようにします。
- プロジェクト番号: お客様のアカウント担当の Google チームがリクエストを作成し、Compute Engine が容量をプロビジョニングするプロジェクトの番号。
- マシンタイプ: 予約するマシンタイプ。次のいずれかを指定できます。
- A4X Max(
a4x-maxgpu-4g-metal) - A4X(
a4x-highgpu-4g) - A4(
a4-highgpu-8g) - A3 Ultra(
a3-ultragpu-8g) - A3 Mega(
a3-megagpu-8g) - A3 High(
a3-highgpu-8g)
- A4X Max(
- ゾーン: 容量を予約するゾーン。 GPU マシンタイプで使用可能なリージョンとゾーンを確認するには、アクセラレータの可用性をご覧ください。
- 合計数: 予約するコンピューティング インスタンスの合計数。予約できるのは、2 の倍数のコンピューティング インスタンスのみです。ブロックサイズとブロックあたりのコンピューティング インスタンス数は、マシンタイプと可用性によって異なります。リクエストの詳細については、Google のアカウント担当者にお問い合わせください。
- 開始時間: 予約期間の開始時間。この時点で予約済み容量の使用を開始できます。開始時間を RFC 3339 タイムスタンプの形式で指定します。
YYYY-MM-DDTHH:MM:SSOFFSET
次のように置き換えます。
YYYY-MM-DD: 年(4 桁)、月(2 桁)、日(2 桁)をハイフン(-)で区切った形式の日付。HH:MM:SS: 24 時間制の 2 桁の時間、2 桁の分、2 桁の秒をコロン(:)で区切った形式の時刻。OFFSET: 協定世界時(UTC)のオフセット形式で示されるタイムゾーン。たとえば、太平洋標準時(PST)を使用する場合は-08:00を指定します。オフセットを使用しない場合は、Zを指定します。
- 終了時間: 予約期間の終了時間。RFC 3339 タイムスタンプの形式で指定します。このとき、Compute Engine は次の処理を行います。
- Compute Engine は自動作成された予約を削除します。
- コンピューティング インスタンスに指定した 終了アクションに基づいて、Compute Engine は自動作成の予約を使用して作成したコンピューティング インスタンスを停止または削除します。
- 予約名: 予約した容量を提供するために Compute Engine が作成する予約の名前。Compute Engine は、 明示的にターゲットに設定された予約のみを作成できます。
- 予約の自動削除: 予約期間の終了時に Compute Engine が自動作成された予約を自動的に削除するかどうか。予約を手動で削除する場合は、Google のアカウント担当者に連絡して予約を削除する必要があります。
- メンテナンス スケジューリング タイプ: Compute Engine がクラスタ内のコンピューティング インスタンスのホスト メンテナンスをスケジュールする方法。次のいずれかのオプションを指定します。
- 予約済みブロック内のすべての A4X Max、A4X、A4、A3 Ultra インスタンスでメンテナンスを同期するには、
GROUPEDを使用します。 - A4 インスタンスまたは A3 Ultra インスタンスに異なるメンテナンス スケジュールを使用するには、
INDEPENDENTを使用します。
- 予約済みブロック内のすべての A4X Max、A4X、A4、A3 Ultra インスタンスでメンテナンスを同期するには、
- 予約の運用モード: ホストエラーまたはホストの障害レポート後に、ユーザーまたは Google Cloud がコンピューティング インスタンスの復元プロセスを管理するかどうか。使用するモードは、予約するマシンタイプによって異なります。
- すべての容量モード(
ALL_CAPACITY)。このモードは、A4X Max マシンタイプと A4X マシンタイプ専用です。コンピューティング インスタンスのメンテナンスと復元プロセスは手動で管理する必要があります。ただし、予約内のすべてのマシンにフルアクセスでき、コンピューティング インスタンスのトポロジとメンテナンスをよりきめ細かく制御できます。 - マネージド モード(
HIGHLY_AVAILABLE_CAPACITY)。このモードは、A4、A3 Ultra、A3 Mega、A3 High のマシンタイプ専用です。 Google Cloud が障害のあるマシンを自動的に置き換えることで、コンピューティング インスタンスのメンテナンスとリカバリー プロセスを管理します。このアプローチにより、コンピューティング インスタンスの可用性が向上し、新しいホストでインスタンスをすばやく再起動できます。ただし、Compute Engine がマシンを交換すると、コンピューティング インスタンスのトポロジが変更されることがあります。
- すべての容量モード(
- 共有タイプ: 自動作成された予約を使用できるのが自分のプロジェクトのみか(
LOCAL)、他のプロジェクトも予約を使用できるか(SPECIFIC_PROJECTS)。このプロパティは、リクエストの送信後に変更できません。予約済み容量を組織内の他のプロジェクトと共有するには、次の操作を行います。- まだ確認していない場合は、Google がリクエストを作成するプロジェクトで共有予約の作成が許可されていることを確認します。
- 予約済み容量を共有するプロジェクトの番号を指定します。組織で最大 100 個のプロジェクトを指定できます。
コミットメント名: 予約期間が 1 年以上の場合は、リソースベースのコミットメントを購入して、予約済みリソースに関連付ける必要があります。予約期間が 1 年以上 3 年未満の場合、コミットメントにより 1 年間の確約利用割引(CUD)料金が適用されます。予約期間が 3 年以上 6 年未満の場合、コミットメントにより 3 年間の CUD 料金が適用されます。
予約した容量を他のプロジェクトと共有する場合、それらのプロジェクトが割引を受けるのは、容量を予約したプロジェクトと同じ Cloud 請求先アカウントを使用している場合のみです。詳細については、リソースベースのコミットメントで CUD の共有を有効にするをご覧ください。
コミットメントの開始日と終了日は予約と同じですが、有効化の時間は異なる場合があります。予約の開始時刻を米国およびカナダの太平洋時間の午前 0 時に指定すると、コミットメントは選択した開始日の午前 0 時に有効になります。別の開始時刻を指定すると、コミットメントは選択した開始日の翌日の午前 0 時に有効になります。
Google が将来の予約リクエストのドラフトを作成すると、Google のアカウント担当者から連絡があります。
予約リクエストのドラフトを確認して送信する
予約するリソースのタイプと量を Google のアカウント担当者 に提供すると、Google が 将来の予約 リクエストの ドラフト を作成します。ドラフトのリクエストを確認し、内容が正しければ審査をリクエストします。リクエストの開始時刻より前にリクエストを送信する必要があります。
将来の予約リクエストのドラフトを確認して送信するには、次のいずれかのオプションを選択します。
コンソール
Google Cloud コンソールで、[予約] ページに移動します。
- [将来の予約] タブをクリックします。[将来の予約] 表には、プロジェクトの将来の予約リクエストがそれぞれ一覧表示されます。表の各列はプロパティを表します。
- [名前] 列で、Google が作成したドラフト リクエストの名前をクリックします。将来の予約リクエストの詳細が表示されたページが開きます。
- [基本情報] セクションで、日付や共有タイプといったリクエストの詳細が正しいことを確認します。また、コミットメントをリクエストした場合は、コミットメントが指定されていることを確認します。これらの情報に誤りがある場合は、Google のアカウント担当者にお問い合わせください。
すべて正しく入力されていることを確認したら、リクエストを送信します。
- [下書きを編集] をクリックします。ドラフト リクエストを変更するページが表示されます。
- [作成] をクリックします。[予約] ページが表示されます。 Google Cloud が数分以内にリクエストを承認すると、Compute Engine はリクエストされたリソースを使用して空の予約を作成します。
gcloud
- プロジェクトの将来の予約リクエストのリストを表示するには、
--filterフラグをPROCUREMENT_STATUS=DRAFTINGに設定してgcloud compute future-reservations listコマンドを使用します。gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- コマンド出力で、お客様のアカウント担当の Google チームに提供した名前の予約リクエストを探します。
- ドラフト リクエストの詳細を表示するには、
gcloud compute future-reservations describeコマンドを使用します。gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONE次のように置き換えます。
FUTURE_RESERVATION_NAME: 将来の予約リクエストのドラフトの名前。ZONE: Google がリクエストを作成したゾーン。
出力は次のようになります。
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b - コマンド出力で、予約期間や共有タイプなどのリクエストの詳細が正しいことを確認します。また、コミットメントを購入した場合は、それが指定されていることを確認します。詳細情報が間違っている場合は、Google のアカウント担当者にお問い合わせください。
- 審査を受けるためにドラフト リクエストを送信するには、
--planning-statusフラグをSUBMITTEDに設定してgcloud compute future-reservations updateコマンドを使用します。gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONE数分以内に、 Google Cloud がリクエストを承認し、Compute Engine がリクエストされたリソースを使用して空の予約を作成します。
REST
- プロジェクト内の将来の予約リクエストのリストを確認するには、
futureReservations.listメソッドにGETリクエストを送信します。リクエスト URL にfilterクエリ パラメータを含め、status.procurementStatus=DRAFTINGに設定します。GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
次のように置き換えます。
PROJECT_ID: Google が将来の予約のドラフト リクエストを作成したプロジェクトの ID。ZONE: リクエストが存在するゾーン。
- リクエストの出力で、Google のアカウント担当者に提供した名前の予約リクエストを探します。
- ドラフト リクエストの詳細を表示するには、ベータ版
futureReservations.getメソッドにGETリクエストを送信します。GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
FUTURE_RESERVATION_NAMEは、将来の予約リクエストのドラフトの名前に置き換えます。出力は次のようになります。
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - 出力で、予約期間や共有タイプなどのリクエストの詳細が正しいことを確認します。また、コミットメントをリクエストした場合は、コミットメントが指定されていることを確認します。詳細情報が間違っている場合は、Google のアカウント担当者にお問い合わせください。
- 審査を受けるためにドラフト リクエストを送信するには、ベータ版の
futureReservations.updateメソッドにPATCHリクエストを送信します。リクエスト URL にupdateMaskクエリ パラメータを含め、planningStatusに設定します。PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }数分以内に、 Google Cloud がリクエストを承認し、Compute Engine がリクエストされたリソースを使用して空の予約を作成します。