このドキュメントでは、予約で制限されたプロビジョニング モデルを使用する Compute Engine インスタンスの概要と、メリット、作成要件について説明します。
コンピューティング インスタンスを作成するときは、基盤となる プロビジョニング モデルを指定する必要があります。このモデルは、コンピューティング インスタンスが使用するリソースの可用性、料金、ライフサイクルを定義します。予約で制限されたプロビジョニング モデルを使用すると、カレンダーモードの将来の予約または AI Hypercomputer の将来の予約の予約容量を使用して、コンピューティング インスタンスを作成できます。
予約で制限されたプロビジョニング モデルには、次の利点があります。
費用管理: 予約済み容量を使用して コンピューティング インスタンスを作成する場合、追加料金は発生しません。ディスクや IP アドレスなど、予約の一部ではないリソースについてのみ課金されます。
ライフサイクル管理: コンピューティング インスタンスの作成時に指定した終了アクションに基づいて、Compute Engine は予約期間の終了時にコンピューティング インスタンスを停止または削除します。
予約で制限されたプロビジョニング モデルを使用するインスタンスについて
以降のセクションでは、予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成するときに適用する要件について説明します。
コンピューティング インスタンス作成の前提条件
予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、まずリソースを予約する必要があります。リソースは次のように予約できます。
最大 80 個の A4、A3 Ultra、A3 Mega、8 個の GPU を搭載した A3 High、または H4D インスタンスを最大 90 日間予約するには、 カレンダー モードで将来の予約リクエストを使用します。
81 個以上の A4X Max、A4X、A4、A3 Ultra、A3 Mega、8 個の GPU を搭載した A3 High、または H4D インスタンスを 91 日以上の期間予約するには、AI Hypercomputer の 将来の予約リクエストを使用します。
が将来の予約リクエストを承認すると、 Compute Engine は予約期間の開始時に予約を自動的に作成します。 Google Cloud その後、予約を使用してコンピューティング インスタンスを作成できます。
コンピューティング インスタンス作成の要件
予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、次の構成を指定する必要があります。
コンピューティング インスタンスと予約のプロパティが一致していること 。 予約済み容量を使用してインスタンスを作成できるのは、インスタンスと自動作成予約のプロパティが完全に一致する場合のみです。 詳細については、予約を使用するための 要件をご覧ください。
コンピューティング インスタンスが予約を明示的に消費対象とすること 。 コンピューティング インスタンスを作成するときは、消費対象とする自動作成予約の名前を指定し、
reservationAffinityフィールドをSPECIFIC_RESERVATIONに設定する必要があります。詳細については、 「 明示的に対象となる予約を消費する」をご覧ください。コンピューティング インスタンスが予約にバインドされたプロビジョニング モデルを使用すること 。 コンピューティング インスタンスを作成するときは、次のように予約で制限されたプロビジョニング モデルを指定する必要があります。
コンソールを使用する場合は、[**プロビジョニング モデル**] リストで [**予約で制限**]を選択します。 Google Cloud
Google Cloud CLI を使用する場合は、コマンドに
--provisioning-model=RESERVATION_BOUNDフラグを指定します。Compute Engine API を使用する場合は、リクエスト本文に
"provisioningModel": "RESERVATION_BOUND"フィールドを指定します。
コンピューティング インスタンスが予約の終了時刻に停止または削除されること 。 コンピューティング インスタンスを作成するときは、
instanceTerminationActionフィールドを使用して、予約の終了時刻にコンピューティング インスタンスを停止するか削除するかを指定する必要があります。詳細については、コンピューティング インスタンスの実行時間を 制限する方法をご覧ください。
予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成すると、コンピューティング インスタンスの実行が開始され、ユーザーが停止または削除するか、予約の終了時刻に Compute Engine がコンピューティング インスタンスを停止または削除するまで実行が継続されます。
Quota
予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成する場合、コンピューティング インスタンスの作成に使用する予約済みリソースの割り当ては必要ありません。割り当てが必要なのは、ディスクや IP アドレスなど、予約済み容量に含まれていないリソースのみです。さまざまなタイプの割り当ての詳細については、 数量に基づく割り当て をご覧ください。
料金
予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成すると、次のように請求が発生します。
コンピューティング インスタンスを作成すると課金が開始されます 。コンピューティング インスタンスの作成に使用する予約済みリソースに対して追加料金は発生しません。ディスクや IP アドレスなど、予約の一部ではないリソースについてのみ課金されます。詳細については、 予約に対する請求をご覧ください。
予約の終了時刻に課金が停止します。その時点で、Compute Engine は予約を削除し、コンピューティング インスタンスに指定された終了アクションに基づいてコンピューティング インスタンスを停止または削除します。
制限事項
予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、次のいずれかのマシンシリーズまたは TPU バージョンを使用する必要があります。
GPU:
A4X Max
A4X
A4
A3 Ultra
A3 Mega
8 個の GPU を搭載した A3 High
予約で制限された プロビジョニング モデルで他の GPU マシンシリーズを使用する方法については、アカウント チームまたは セールスチームにお問い合わせください。
TPU のバージョン:
TPU7x
v6e
v5p
H4D
次のステップ
使ってみる
Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
Compute Engine の無料トライアル