Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

使用オプションを選択する

このドキュメントでは、AI Hypercomputer でコンピューティングリソースを取得して使用するさまざまな方法（消費オプション）について説明します。ワークロード、期間、費用のニーズに最適なオプションを選択します。

各消費オプションでは、次の項目を指定します。

VM またはクラスタを作成するための容量へのアクセス方法。
基盤となるプロビジョニングモデル。VM の可用性、ライフサイクル、料金を決定します。

使用オプションの比較

次の表は、使用オプションの主な違いをまとめたものです。

使用オプション	AI Hypercomputer の将来の予約	最大 90 日間の将来の予約（カレンダーモード）	Flex Start	スポット
サポートされているマシン	A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High	GPU が 8 個の A4、A3 Ultra、A3 Mega、A3 High	A4X Max と A4X を除く任意の GPU マシン	A4X Max と A4X を除く任意の GPU マシン
存続期間	無制限	最長 90 日間	最長 7 日	無制限（ただし、プリエンプションの対象）
プリエンプティブル
容量保証	非常に高い。 Google Cloud が予約リクエストを承認すると、Compute Engine がリクエストされた容量をプロビジョニングする可能性が非常に高くなります。	非常に高い。 Google Cloud が予約リクエストを承認すると、Compute Engine がリクエストされた容量をプロビジョニングする可能性が非常に高くなります。	ベストエフォートCompute Engine は、リクエストされた容量のプロビジョニングをスケジュールするためにベストエフォートで試行します。	ベストエフォートCompute Engine は、リクエストされた容量をプロビジョニングするためにベストエフォートで試行します。
割り当て	Google Cloud は、容量が提供される前に割り当てを自動的に増やします。	割り当ては消費されません。	プリエンプティブル割り当てを消費します。	プリエンプティブル割り当てを消費します。
料金	割引（最大 53%）。アクセラレータ最適化 VM の料金をご覧ください。1 年以上リソースを予約する場合は、リソースベースのコミットメントを購入して、予約したリソースに関連付ける必要があります。予約期間に対して料金が発生します。予約の課金をご覧ください。	割引（最大 53%）。Dynamic Workload Scheduler の料金をご覧ください。予約期間に対して料金が発生します。予約の課金をご覧ください。	割引（最大 53%）。Dynamic Workload Scheduler の料金をご覧ください。従量課金制（PAYG）で支払います。	大幅な割引（最大 91%）。Spot VM の料金とアクセラレータ最適化 VM の料金をご覧ください。従量課金制（PAYG）で支払います。
リソースの割り当て	高密度	高密度	ベストエフォートベースの高密度（コンパクトポリシーまたはワークロードポリシーは省略可）	標準（コンパクトポリシーは省略可）
プロビジョニングモデル	予約で制限	予約で制限	Flex Start	Spot
作成方法	VM を作成するには、次の操作を行う必要があります。アカウントチームに連絡して容量を予約します。選択した日時に、予約した容量を使用して、デプロイオプションの概要で説明されているいずれかの方法で VM とクラスタを作成できます。	VM を作成するには、次の操作を行う必要があります。カレンダーモードで将来の予約を作成する。選択した日時に、予約した容量を使用して、デプロイオプションの概要で説明されているいずれかの方法で VM とクラスタを作成できます。	Flex Start VM の作成をリクエストすると、Compute Engine は可用性に基づいて VM の作成をスケジュールします。容量が使用可能になると、Compute Engine は Flex Start VM をプロビジョニングします。Flex Start VM を作成するには、デプロイオプションの概要で説明されているいずれかの方法を使用します。	デプロイオプションの概要で説明されている方法のいずれかを使用して、VM をすぐに作成できます。

使用オプションを選択する

次のフローチャートを使用して、ワークロードに最適な使用オプションを選択します。

AI Hypercomputer の使用オプションを示すフローチャート。

上の図の質問は次のとおりです。

90 日以上容量が必要ですか？
- はい: AI Hypercomputer で将来の予約を使用するをご覧ください。
- いいえ: 質問 2 に進みます。
予約済み容量が必要ですか？
- はい: カレンダーモードで将来の予約を使用するをご覧ください。
- いいえ: 質問 3 に進みます。
ワークロードはフォールトトレラントですか？
- いいえ: Flex Start を使用するをご覧ください。
- はい: スポットを使用するをご覧ください。

AI Hypercomputer で将来の予約を使用する

リソースの密な割り当てを必要とする大規模な長時間実行分散ワークロードを実行するには、将来の特定の時間にコンピューティングリソースをリクエストします。この期間中、予約したリソースに排他的にアクセスできます。また、リソースを使用して VM またはクラスタを作成できます。予約期間の終了時に、Compute Engine は次の処理を行います。

Compute Engine が予約を削除します。
VM に指定した終了アクションに基づいて、Compute Engine は予約を使用している VM を停止または削除します。

AI Hypercomputer の将来の予約に最適なワークロード

将来の予約は、次のようなワークロードに最適です。

基盤モデルの事前トレーニング
マルチホストの基盤モデルの推論

AI Hypercomputer の将来の予約の主な特徴

将来の予約には次の特徴があります。

A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）マシンタイプを予約できます。ネットワークレイテンシを最小限に抑えるために、マシンが高密度で割り振られます。
将来の日付から任意の期間、任意の数の VM を予約できます。予約期間が終了するまで、予約済みリソースを使用して VM を作成して実行します。1 年以上リソースを予約する場合は、リソースベースのコミットメントを購入して関連付ける必要があります。
予約期間が開始された後、自動作成された予約は次のように変更できます。
- ハードウェアの緊急メンテナンス通知を有効または無効にする
- Vertex AI ジョブの使用を有効または無効にする
予約にバインドされたプロビジョニングモデルを使用します。これには次の利点があります。
- GPU を取得できる可能性が高くなります。
- VM に関連付けられたコミットメントに加えて、vCPU と GPU の割引率が最大 53% になります。

AI Hypercomputer で将来の予約を使用する方法

将来の予約を使用して VM またはクラスタを作成するには、次の操作を行う必要があります。

容量の予約をリクエストする。アカウントチームに連絡し、予約するリソースを指定します。空き状況に基づいて、予約リクエストのドラフトが作成されます。正しく入力されていることを確認したら、送信します。 Google Cloud がすぐに予約リクエストを承認します。

手順については、容量を予約するをご覧ください。
予約済みリソースを使用する。選択した予約期間の開始時に、予約を使用して VM またはクラスタを作成できます。

VM またはクラスタを作成するさまざまな方法については、デプロイオプションの概要をご覧ください。

カレンダーモードで将来の予約を使用する

リソースの密な割り当てを必要とする短時間実行の分散ワークロードを実行するには、最大 90 日間のコンピューティングリソースをリクエストできます。この期間中、予約済みリソースに排他的にアクセスし、リソースを使用して VM またはクラスタを作成できます。予約期間の終了時に、Compute Engine は次の処理を行います。

Compute Engine が予約を削除します。
VM に指定した終了アクションに基づいて、Compute Engine は予約を使用している VM を停止または削除します。

カレンダーモードの将来の予約に最適なワークロード

カレンダーモードの将来の予約は、次のワークロードに最適です。

モデルの事前トレーニング
モデルの微調整
シミュレーション
推論

カレンダーモードでの将来の予約の主な特徴

カレンダーモードの将来の予約には次の特徴があります。

A4、A3 Ultra、A3 Mega、A3 High（8 個の GPU）マシンタイプを予約できます。これらのマシンは、ネットワークレイテンシを最小限に抑えるために高密度で割り振られます。
将来の可用性を確認し、最大 80 個の VM を最大 90 日間予約できます。予約期間が終了するまで、予約済みリソースを使用して VM を作成できます。
予約期間が開始された後、自動作成された予約は次のように変更できます。
- ハードウェアの緊急メンテナンス通知を有効または無効にする
- Vertex AI ジョブの使用を有効または無効にする
予約にバインドされたプロビジョニングモデルを使用します。これには次の利点があります。
- GPU を取得できる可能性が高くなります。
- vCPU と GPU の割引率は最大 53% です。

カレンダーモードで将来の予約を使用する方法

カレンダーモードで将来の予約を使用して VM またはクラスタを作成するには、次の操作を行います。

リソースの可用性を確認する。予約するリソースの将来の可用性を確認できます。予約リクエストを作成するときに、使用可能であることを確認したリソースの数、タイプ、予約期間を指定できます。この操作を行うと、 Google Cloud がリクエストを承認する可能性が高くなります。

手順については、リソースの将来の可用性を確認するをご覧ください。
容量を予約する。将来の日時の予約リクエストを作成します。 Google Cloud は 2 分以内に予約リクエストを承認します。承認されると、Compute Engine は容量を予約します。選択したお届け日に、予約済みリソースを使用して VM またはクラスタを作成できます。

手順については、 GPU VM または TPU の予約リクエストを作成するをご覧ください。
予約済みリソースを使用する。選択した予約期間の開始時に、予約を使用して VM またはクラスタを作成できます。

VM またはクラスタを作成するさまざまな方法については、以下をご覧ください。
- A4、A3 Ultra、A3 Mega、A3 High（GPU 数 8）VM を作成するには、デプロイオプションの概要をご覧ください。
- GPUDirect-TCPX を有効にして A3 Mega VM または A3 High VM（8 個の GPU）を作成するには、GPUDirect-TCPX を有効にして A3 VM を作成するをご覧ください。

Flex Start を使用する

リソースの密な割り当てを必要とする短期間のワークロードを実行するには、Flex Start を使用して最大 7 日間のコンピューティングリソースをリクエストできます。リソースが使用可能になると、Compute Engine はリクエストされた数の VM を作成します。スタンドアロンの Flex Start VM は停止できますが、マネージドインスタンスグループ（MIG）がサイズ変更リクエストで作成した Flex Start VM は停止できません。Flex Start VM は、ユーザーが削除するか、Compute Engine が実行期間の終了時に VM を削除するまで存在します。

Flex Start に最適なワークロード

Flex Start は、次のような、いつでも開始できるワークロードに最適です。

小規模モデルの事前トレーニング
モデルの微調整
シミュレーション
バッチ推論

Flex Start の主な特性

Flex Start には次の特性があります。

A4X Max と A4X を除く任意の GPU マシンタイプをリクエストできます。Compute Engine は、マシンを高密度で割り当てるためにベストエフォートで試行します。これにより、同じゾーン内で Flex Start VM が離れて配置されることがあります。VM の配置を制御し、ネットワークレイテンシを最小限に抑えるには、次の操作を行います。
- スタンドアロンの Flex Start VM の場合は、 VM にコンパクトプレースメントポリシーを適用します。
- ターゲットサイズの MIG には、ワークロードポリシーを適用します。
Flex Start プロビジョニングモデルを使用します。このモデルには次の利点があります。
- GPU を取得できる可能性が高くなります。
- vCPU、メモリ、GPU の割引率は最大 53% です。

Flex Start の使用方法

Flex Start を使用して VM またはクラスタを作成するには、次の手順を完了する必要があります。

省略可: コンパクトプレースメントポリシーまたはワークロードポリシーを作成します。コンパクトプレースメントポリシー（スタンドアロン VM または VM の一括作成用）またはワークロードポリシー（MIG 用）を作成して、VM の近接性を指定できます。選択した構成は、ポリシーがサポートするマシンタイプと VM の数に影響します。
Flex Start VM を作成する。VM の作成をリクエストすると、Compute Engine は可用性に基づいて VM の作成をスケジュールします。容量が使用可能になると、Compute Engine は Flex Start VM をプロビジョニングします。VM は、ユーザーが停止または削除するか、実行期間の終了に達するまで実行されます。

手順については、デプロイオプションの概要をご覧ください。

スポットを使用する

フォールトトレラントなワークロードを実行するには、可用性に基づいてコンピューティングリソースをすぐに取得できます。リソースを可能な限り低価格で取得できます。ただし、Compute Engine はいつでも VM をプリエンプトして容量を再利用できます。

Spot に最適なワークロード

Spot は、次のような中断が許容されるワークロードに最適です。

バッチ処理
ハイパフォーマンスコンピューティング（HPC）
継続的インテグレーションと継続的デプロイ（CI / CD）
データ分析
メディアのエンコード
オンライン推論

Spot の主な特徴

スポットには次の特徴があります。

A4X Max と A4X を除く任意の GPU マシンタイプを作成できます。高密度の割り当てはリソースの可用性に依存します。より近い割り当てを確保するには、VM にコンパクトプレースメントポリシーを適用します。
VM をすぐに作成できます。VM は、ユーザーが停止または削除するか、Compute Engine が容量を再利用するために VM をプリエンプトするまで実行されます。
スポットプロビジョニングモデルを使用します。これには次の利点があります。
- GPU を取得できる可能性が高くなります。
- 多くのマシンタイプ、GPU、TPU、ローカル SSD ディスクで最大 91% の割引が適用されます。

Spot の使用方法

Spot を使用して VM またはクラスタを作成するには、次の操作を行う必要があります。

リソースの可用性を確認する。Spot VM を作成するリージョンまたはゾーンのリソースの可用性を確認できます。このアクションは、リソース可用性エラーが発生する可能性を減らすのに役立ちます。

手順については、Spot VM の可用性を確認するをご覧ください。
省略可: プリエンプション率と料金を表示します。さまざまなマシンタイプとゾーンの過去と現在のプリエンプション率と料金を確認できます。この情報は、ワークロードと予算に最適なマシンタイプとロケーションを選択するのに役立ちます。

手順については、Spot VM のプリエンプション率と料金を表示するをご覧ください。
省略可: コンパクトプレースメントポリシーまたはワークロードポリシーを作成します。コンパクトプレースメントポリシー（スタンドアロン VM または VM の一括作成用）またはワークロードポリシー（MIG 用）を作成して、VM の近接性を指定できます。選択した構成は、ポリシーがサポートするマシンタイプと VM の数に影響します。

手順については、コンパクトプレースメントポリシーを使用してレイテンシを短縮するまたは MIG のワークロードポリシーを作成するをご覧ください。
Spot VM を作成する。可用性に基づいて、必要な数の VM を作成できます。VM は、ユーザーが停止または削除するか、Compute Engine が容量を再利用するために VM をプリエンプトするまで実行されます。

手順については、デプロイオプションの概要をご覧ください。

使用オプションを選択する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

使用オプションの比較

使用オプションを選択する

AI Hypercomputer で将来の予約を使用する

AI Hypercomputer の将来の予約に最適なワークロード

AI Hypercomputer の将来の予約の主な特徴

AI Hypercomputer で将来の予約を使用する方法

カレンダー モードで将来の予約を使用する

カレンダー モードの将来の予約に最適なワークロード

カレンダー モードでの将来の予約の主な特徴

カレンダー モードで将来の予約を使用する方法

Flex Start を使用する

Flex Start に最適なワークロード

Flex Start の主な特性

Flex Start の使用方法

スポットを使用する

Spot に最適なワークロード

Spot の主な特徴

Spot の使用方法

使用オプションを選択する

カレンダーモードで将来の予約を使用する

カレンダーモードの将来の予約に最適なワークロード

カレンダーモードでの将来の予約の主な特徴

カレンダーモードで将来の予約を使用する方法