All Capacity モードで TPU 容量をリクエストする

All Capacity モードの予約をリクエストするには、 Google Cloud アカウント チームにお問い合わせください。

All Capacity モードで TPU 容量をリクエストする(プロジェクト共有オプションを使用)

必要な入力情報を添えて、アカウント チームにお問い合わせください。アカウント チームが、 Google Cloud コンソールで確認できる将来の予約をドラフト状態で作成します。

組織内の他の Google Cloudプロジェクトで共有できる予約をリクエストできます。Vertex AI などの別の Google Cloud サービスと共有できる予約をリクエストすることもできます。アカウント チームに提供する入力情報の一部として、予約の共有設定を指定します。

プロパティ 説明
プロジェクト番号 アカウント チームがリクエストを作成し、Compute Engine が容量をプロビジョニングするプロジェクトの番号(ID ではない)。
TPU 世代 Trillium または Ironwood
ゾーン 容量を予約するゾーン。
チップ数 予約する TPU チップの数。
開始時間 予約期間の開始時間
終了時間 予約期間の終了時間
予約名 予約した容量を提供するために Compute Engine が作成する予約の名前
予約の自動削除 予約期間の終了時に Compute Engine が自動作成された予約を自動的に削除するかどうか。予約を手動で削除する場合は、アカウント チームに連絡して予約を削除する必要があります。
共有タイプ 自動作成された予約を使用できるのが自分のプロジェクトのみか(LOCAL)、他のプロジェクトも予約を使用できるか(SPECIFIC_PROJECTS)。リクエストを送信した後にこの設定を変更することはできません。予約済み容量を組織内の他のプロジェクトと共有するには、次の操作を行います。
  1. まだ確認していない場合は、Google がリクエストを作成するプロジェクトで共有予約の作成が許可されていることを確認します。
  2. 予約済み容量を共有するプロジェクトの ID を指定します。組織で最大 100 個のプロジェクトを指定できます。
コミットメント名 予約期間が 1 年以上の場合は、リソースベースのコミットメントを購入して、予約済みリソースに関連付ける必要があります。コミットメントは、1 年間または 3 年間のプランで購入できます。予約した容量を他のプロジェクトと共有する場合、それらのプロジェクトが割引を受けるのは、容量を予約したプロジェクトと同じ Cloud 請求先アカウントを使用している場合のみです。詳細については、リソースベースのコミットメントで CUD の共有を有効にするをご覧ください。

All Capacity モードの予約には、次のプロパティがプリセットされています。

プロパティ 説明
メンテナンスのスケジュール設定のタイプ Compute Engine がクラスタ内の VM のホスト メンテナンスをスケジュールする方法。TPU Cluster Director は GROUPED オプションのみをサポートします。つまり、予約のサブブロック内のすべての TPU VM でメンテナンスが同期されます。
予約の運用モード ホストエラーまたは障害のあるホストの報告後に Google Cloud が VM 復元プロセスを管理する方法。TPU Cluster Director は ALL_CAPACITY オプションのみをサポートします。つまり、VM のメンテナンスと復元プロセスを自分で管理する必要があります。ただし、予約内のすべてのマシンにフルアクセスでき、VM トポロジとメンテナンスをよりきめ細かく制御できます。
デプロイタイプ 容量のデプロイタイプ。TPU Cluster Director は DENSE のみをサポートします。

容量予約のドラフトを確認する

Google Cloud プロジェクトで TPU Cluster Director の容量を受け取るには、アカウント チームが作成した予約のドラフトを確認する必要があります。予約リクエストのドラフトを確認して送信するの手順に沿って、予約を確認します。

容量リクエストのステータスを確認する

TPU Cluster Director の容量リクエストのステータスを確認できます。リクエストが承認されると、リクエストされた開始時刻にリクエストされた期間だけ容量が割り当てられます。請求は予約の開始時刻に開始します。

詳しくは、将来の予約を表示するをご覧ください。

将来の予約リクエスト(exfr1 という名前の予約)の詳細を表示するには、Google Cloud CLI で次のコマンドを実行します。

gcloud compute future-reservations describe exfr1 \
    --zone=us-central1-a

出力は次のようになります。

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'exfr1'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

既存の容量リクエストを拡張する

既存の予約を通じて追加容量を受け取ることができます。容量を追加すると、予約の共有ポリシーなど、予約のすべてのプロパティが継承されます。追加容量を含む CUD をリクエストできます。新しい CUD は同じ予約を参照します。アカウント チームが予約の拡大手続きを代行します。

Google Cloud コンソールで予約の詳細を表示する

将来の予約が完了すると、 Google Cloud コンソールの [予約] ページで予約を確認し、詳細を表示できます。デプロイタイプが Dense の TPU 予約は、TPU Cluster Director の予約であることを示します。