予約にバインドされたモデルを使用するインスタンスについて

このドキュメントでは、予約で制限されたプロビジョニング モデルを使用する Compute Engine インスタンスの概要と、メリット、作成要件について説明します。

コンピューティング インスタンスを作成するときは、基盤となるプロビジョニング モデルも指定する必要があります。このモデルは、コンピューティング インスタンスが使用するリソースの可用性、料金、ライフサイクルを定義します。予約で制限されたプロビジョニング モデルを使用すると、カレンダー モードの将来の予約または AI Hypercomputer の将来の予約の予約容量を使用して、A4X Max、A4X、A4、A3 Ultra、A3 Mega、8 個の GPU を搭載した A3 High、A3 Edge、H4D インスタンスを作成できます。

予約で制限されたプロビジョニング モデルには、次の利点があります。

  • 費用管理: 予約済み容量を使用してコンピューティング インスタンスを作成する場合、追加料金は発生しません。ディスクや IP アドレスなど、予約の一部ではないリソースについてのみ課金されます。

  • ライフサイクル管理: コンピューティング インスタンスの作成時に指定した終了アクションに基づいて、Compute Engine は予約期間の終了時にコンピューティング インスタンスを停止または削除します。

予約にバインドされたプロビジョニング モデルを使用するインスタンスについて

以降のセクションでは、予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成するときに適用する要件について説明します。

コンピューティング インスタンス作成の前提条件

予約にバインドされたプロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、まずリソースを予約する必要があります。リソースは次のように予約できます。

Google Cloud が将来の予約リクエストを承認すると、Compute Engine は予約期間の開始時に予約を自動的に作成します。この予約を使用して、コンピューティング インスタンスを作成できます。

コンピューティング インスタンスの作成要件

予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、次の構成を指定する必要があります。

  • コンピューティング インスタンスと予約のプロパティが一致していること。予約済み容量を使用してインスタンスを作成できるのは、インスタンスと自動作成予約のプロパティが完全に一致する場合のみです。詳細については、予約を使用するための要件をご覧ください。

  • コンピューティング インスタンスが予約を明示的に消費対象とすること。コンピューティング インスタンスを作成するときに、使用する自動作成予約の名前を指定し、reservationAffinity フィールドを SPECIFIC_RESERVATION に設定する必要があります。詳細については、明示的に対象となる予約を消費するをご覧ください。

  • コンピューティング インスタンスが予約にバインドされたプロビジョニング モデルを使用すること。コンピューティング インスタンスを作成するときは、次のように予約で制限されたプロビジョニング モデルを指定する必要があります。

    • Google Cloud コンソールを使用する場合は、[プロビジョニング モデル] リストで [予約で制限] を選択します。

    • Google Cloud CLI を使用する場合は、コマンドに --provisioning-model=RESERVATION_BOUND フラグを指定します。

    • Compute Engine API を使用する場合は、リクエスト本文に "provisioningModel": "RESERVATION_BOUND" フィールドを指定します。

  • コンピューティング インスタンスが予約の終了日時に停止または削除されること。コンピューティング インスタンスを作成するときに、instanceTerminationAction フィールドを使用して、予約の終了時にコンピューティング インスタンスを停止するか削除するかを指定する必要があります。詳細については、コンピューティング インスタンスの実行時間を制限するをご覧ください。

予約にバインドされたプロビジョニング モデルを使用してコンピューティング インスタンスを作成すると、コンピューティング インスタンスの実行が開始され、ユーザーが停止または削除するか、予約の終了時刻に Compute Engine がコンピューティング インスタンスを停止または削除するまで実行が継続されます。

割り当て

予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成する場合、コンピューティング インスタンスの作成に使用する予約済みリソースの割り当ては必要ありません。割り当てが必要なのは、ディスクや IP アドレスなど、予約済み容量に含まれていないリソースのみです。さまざまなタイプの割り当ての詳細については、数量に基づく割り当てをご覧ください。

料金

予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成すると、次のように請求が発生します。

  • 料金は、コンピューティング インスタンスを作成した時点で発生します。コンピューティング インスタンスの作成に使用する予約済みリソースに対して追加料金は発生しません。ディスクや IP アドレスなど、予約の一部ではないリソースに対してのみ課金されます。詳細については、予約に対する請求をご覧ください。

  • 請求は予約の終了時刻に停止します。その時点で、Compute Engine は予約を削除し、コンピューティング インスタンスに指定された終了アクションに基づいてコンピューティング インスタンスを停止または削除します。

制限事項

予約で制限されたプロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、次のいずれかのマシンシリーズを使用する必要があります。

  • A4X Max

  • A4X

  • A4

  • A3 Ultra

  • A3 Mega

  • 8 個の GPU を搭載した A3 High

  • H4D

予約で制限されたプロビジョニング モデルで他のアクセラレータ最適化マシンシリーズを使用する方法については、アカウント チームまたはセールスチームにお問い合わせください。

次のステップ

使ってみる

Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。

Compute Engine の無料トライアル