Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

予約にバインドされたモデルを使用するインスタンスについて

このドキュメントでは、予約で制限されたプロビジョニングモデルを使用する Compute Engine インスタンスの概要と、メリット、作成要件について説明します。

コンピューティングインスタンスを作成するときは、基盤となるプロビジョニングモデルを指定する必要があります。このモデルは、コンピューティングインスタンスが使用するリソースの可用性、料金、ライフサイクルを定義します。予約で制限されたプロビジョニングモデルを使用すると、カレンダーモードの将来の予約または AI Hypercomputer の将来の予約の予約容量を使用して、コンピューティングインスタンスを作成できます。

予約で制限されたプロビジョニングモデルには、次の利点があります。

費用管理: 予約済み容量を使用してコンピューティングインスタンスを作成する場合、追加料金は発生しません。ディスクや IP アドレスなど、予約の一部ではないリソースについてのみ課金されます。
ライフサイクル管理: コンピューティングインスタンスの作成時に指定した終了アクションに基づいて、Compute Engine は予約期間の終了時にコンピューティングインスタンスを停止または削除します。

予約で制限されたプロビジョニングモデルを使用するインスタンスについて

以降のセクションでは、予約で制限されたプロビジョニングモデルを使用してコンピューティングインスタンスを作成するときに適用する要件について説明します。

コンピューティングインスタンス作成の前提条件

予約で制限されたプロビジョニングモデルを使用してコンピューティングインスタンスを作成するには、まずリソースを予約する必要があります。リソースは次のように予約できます。

最大 80 個の A4、A3 Ultra、A3 Mega、8 個の GPU を搭載した A3 High、または H4D インスタンスを最大 90 日間予約するには、カレンダーモードで将来の予約リクエストを使用します。
81 個以上の A4X Max、A4X、A4、A3 Ultra、A3 Mega、8 個の GPU を搭載した A3 High、または H4D インスタンスを 91 日以上の期間予約するには、AI Hypercomputer の将来の予約リクエストを使用します。

が将来の予約リクエストを承認すると、 Compute Engine は予約期間の開始時に予約を自動的に作成します。 Google Cloud その後、予約を使用してコンピューティングインスタンスを作成できます。

コンピューティングインスタンス作成の要件

予約で制限されたプロビジョニングモデルを使用してコンピューティングインスタンスを作成するには、次の構成を指定する必要があります。

コンピューティングインスタンスと予約のプロパティが一致していること 。予約済み容量を使用してインスタンスを作成できるのは、インスタンスと自動作成予約のプロパティが完全に一致する場合のみです。詳細については、予約を使用するための要件をご覧ください。
コンピューティングインスタンスが予約を明示的に消費対象とすること 。コンピューティングインスタンスを作成するときは、消費対象とする自動作成予約の名前を指定し、reservationAffinity フィールドを SPECIFIC_RESERVATION に設定する必要があります。詳細については、「明示的に対象となる予約を消費する」をご覧ください。
コンピューティングインスタンスが予約にバインドされたプロビジョニングモデルを使用すること 。コンピューティングインスタンスを作成するときは、次のように予約で制限されたプロビジョニングモデルを指定する必要があります。
- コンソールを使用する場合は、[**プロビジョニングモデル**] リストで [**予約で制限**]を選択します。 Google Cloud
- Google Cloud CLI を使用する場合は、コマンドに --provisioning-model=RESERVATION_BOUND フラグを指定します。
- Compute Engine API を使用する場合は、リクエスト本文に "provisioningModel": "RESERVATION_BOUND" フィールドを指定します。
コンピューティングインスタンスが予約の終了時刻に停止または削除されること 。コンピューティングインスタンスを作成するときは、instanceTerminationAction フィールドを使用して、予約の終了時刻にコンピューティングインスタンスを停止するか削除するかを指定する必要があります。詳細については、コンピューティングインスタンスの実行時間を制限する方法をご覧ください。

予約で制限されたプロビジョニングモデルを使用してコンピューティングインスタンスを作成すると、コンピューティングインスタンスの実行が開始され、ユーザーが停止または削除するか、予約の終了時刻に Compute Engine がコンピューティングインスタンスを停止または削除するまで実行が継続されます。

Quota

予約で制限されたプロビジョニングモデルを使用してコンピューティングインスタンスを作成する場合、コンピューティングインスタンスの作成に使用する予約済みリソースの割り当ては必要ありません。割り当てが必要なのは、ディスクや IP アドレスなど、予約済み容量に含まれていないリソースのみです。さまざまなタイプの割り当ての詳細については、数量に基づく割り当てをご覧ください。

料金

予約で制限されたプロビジョニングモデルを使用してコンピューティングインスタンスを作成すると、次のように請求が発生します。

コンピューティングインスタンスを作成すると課金が開始されます 。コンピューティングインスタンスの作成に使用する予約済みリソースに対して追加料金は発生しません。ディスクや IP アドレスなど、予約の一部ではないリソースについてのみ課金されます。詳細については、予約に対する請求をご覧ください。
予約の終了時刻に課金が停止します。その時点で、Compute Engine は予約を削除し、コンピューティングインスタンスに指定された終了アクションに基づいてコンピューティングインスタンスを停止または削除します。

重要: Compute Engine がコンピューティングインスタンスを停止して状態を STOPPING に変更した後も、ディスクなどコンピューティングインスタンスにアタッチされているリソースがあれば引き続き課金されます。不要な費用を回避するため、不要になったリソースをすべて切断して削除するか、コンピューティングインスタンスを完全に削除します。詳細については、コンピューティングインスタンスの稼働時間の料金をご覧ください。

制限事項

予約で制限されたプロビジョニングモデルを使用してコンピューティングインスタンスを作成するには、次のいずれかのマシンシリーズまたは TPU バージョンを使用する必要があります。

GPU:
- A4X Max
- A4X
- A4
- A3 Ultra
- A3 Mega
- 8 個の GPU を搭載した A3 High
予約で制限されたプロビジョニングモデルで他の GPU マシンシリーズを使用する方法については、アカウントチームまたはセールスチームにお問い合わせください。
TPU のバージョン:
- TPU7x
- v6e
- v5p
H4D

次のステップ

予約で制限されたモデルを使用してインスタンスを作成する

使ってみる

Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。

Compute Engine の無料トライアル

予約にバインドされたモデルを使用するインスタンスについて コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

予約で制限されたプロビジョニング モデルを使用するインスタンスについて

コンピューティング インスタンス作成の前提条件

コンピューティング インスタンス作成の要件