Autopilot でのリソースリクエスト

Autopilot

ワークロードの安定性を向上させるため、Google Kubernetes Engine（GKE）Autopilot モードでは、CPU、メモリ、エフェメラルストレージなどの Pod リソースリクエストの値が管理されます。このページには、効率的で安定した費用対効果の高いワークロードを計画するために使用できる次の情報が記載されています。

値を指定しない Pod に Autopilot が適用するデフォルト値。
Autopilot がリソースリクエストに対して適用する最小値と最大値。
Pod がリクエストするハードウェアに応じてデフォルト値、最小値、最大値がどのように変化するか。

このページは、クラウドリソースのプロビジョニングと構成、ワークロードのデプロイを行うオペレーターとデベロッパーを対象としています。 Google Cloudのコンテンツで参照する一般的なロールとタスク例の詳細については、GKE ユーザーの一般的なロールとタスクをご覧ください。

Kubernetes のリソース管理には、あらかじめ精通している必要があります。

Autopilot リソースリクエストの概要

Autopilot は、ワークロード構成に指定したリソースリクエストを使用して、ワークロードを実行するノードを構成します。Autopilot は、ワークロードが使用するコンピューティングクラスまたはハードウェア構成に基づいて、リソースの最小リクエストと最大リクエストを適用します。一部のコンテナのリクエストを指定していない場合、Autopilot は、コンテナが正常に実行されるようにデフォルト値を割り当てます。

Autopilot クラスタにワークロードをデプロイすると、選択したコンピューティングクラスまたはハードウェア構成（GPU など）で許容される最小値と最大値に対してワークロード構成が GKE により検証されます。リクエストが最小値未満の場合は、Autopilot がワークロード構成を自動的に変更し、リクエストが許容範囲に収まるようにします。リクエストが最大値より大きい場合、Autopilot はワークロードを拒否し、エラーメッセージが表示されます。

次のリストは、リソースリクエストのカテゴリの概要を示します。

デフォルトのリソースリクエスト: ワークロードに独自のリクエストを指定しない場合、Autopilot によって追加されます。
リソースの最小リクエストと最大リクエスト: Autopilot は、リクエストがこの制限内に収まるように、指定されたリクエストを検証します。リクエストが制限を超えると、Autopilot によってワークロードリクエストが変更されます。
ワークロードの分離と期間延長のリクエスト: Autopilot には、互いに分離しているワークロードや GKE が開始した強制排除からの保護を強化した Pod ごとに別々のデフォルト値と最小値があります。
DaemonSet のリソースリクエスト: Autopilot では、DaemonSet のコンテナごとに異なるデフォルト値、最小値、最大値があります。

リソースのリクエスト方法

Autopilot では、リソースを Pod 仕様でリクエストします。リクエストできるサポート対象の最小リソースと最大リソースは、Pod が実行されるノードのハードウェア構成によって変わります。特定のハードウェア構成をリクエストする方法については、次のページをご覧ください。

デフォルトのリソースリクエスト

Pod 内の一部のコンテナにリソースリクエストを指定しない場合、Autopilot はデフォルト値を適用します。これらのデフォルト値は、多くの小規模なワークロードに適しています。

さらに、Autopilot は、選択したコンピューティングクラスやハードウェア構成に関係なく、次のデフォルトリソースリクエストを適用します。

DaemonSet のコンテナ
- CPU: 50 mCPU
- メモリ: 100 MiB
- エフェメラルストレージ: 100 MiB
その他すべてのコンテナ
- エフェメラルストレージ: 1 GiB

Autopilot によるクラスタの制限の詳細については、割り当てと上限をご覧ください。

コンピューティングクラスのデフォルトリクエスト

Autopilot では、コンピューティングクラスで実行される Pod の Pod 仕様で定義されていないリソースには、次のデフォルト値が適用されます。一方のリクエストのみを設定し、もう一方を空白のままにすると、GKE は最小リクエストと最大リクエストのセクションで定義されている CPU とメモリの比率を使用して、欠落しているリクエストを比率に沿う値に設定します。

コンピューティングクラス	リソース	デフォルトリクエスト
汎用（デフォルト）	CPU	0.5 vCPU
汎用（デフォルト）	メモリ	2 GiB
アクセラレータ	デフォルトのリクエストは適用されません。
バランス	CPU	0.5 vCPU
バランス	メモリ	2 GiB
パフォーマンス	デフォルトのリクエストは適用されません。
スケールアウト	CPU	0.5 vCPU
スケールアウト	メモリ	2 GiB

リソースの最小リクエストと最大リクエスト

デプロイ構成でリクエストされるリソースの合計は、Autopilot で許可されるサポート範囲の最小値と最大値の間に入る必要があります。次の条件が適用されます。

エフェメラルストレージリクエスト:
- エフェメラルストレージは、ノードにローカル SSD が接続されていない限り、VM ブートディスクを使用します。
  
  A100（80 GB）GPU、H100（80 GB）GPU、Z3 マシンシリーズなど、ローカル SSD を含むコンピューティングハードウェアは、ローカル SSD のサイズからシステムオーバーヘッドを差し引いた最大リクエストをサポートします。このシステムオーバーヘッドの詳細については、ローカル SSD に基づくエフェメラルストレージをご覧ください。
- GKE バージョン 1.29.3-gke.1038000 以降では、ハードウェアにローカル SSD が含まれていない限り、Performance クラスの Pod とハードウェアアクセラレータ Pod は、最大 56 TiB のエフェメラルストレージリクエストをサポートしています。
  
  GKE バージョンに関係なく、他のすべての Autopilot Pod では、Pod 内のすべてのコンテナのエフェメラルストレージリクエストの合計は、別途指定しない限り 10 MiB～10 GiB の範囲にする必要があります。
- より大きな容量を必要とする場合は、汎用のエフェメラルボリュームを使用します。これは、エフェメラルストレージと同等の機能とパフォーマンスを提供し、どの GKE ストレージオプションでも使用できるため、柔軟性が大幅に向上します。たとえば、pd-balanced を使用する汎用エフェメラルボリュームの最大サイズは 64 TiB です。
DaemonSet Pod の場合、最小リソースリクエストは次のとおりです。
- バーストをサポートするクラスタ: Pod あたり 1 mCPU、Pod あたり 2 MiB のメモリ、Pod 内のコンテナあたり 10 MiB のエフェメラルストレージ。
- バーストをサポートしていないクラスタ: Pod あたり 10 mCPU、Pod あたり 10 MiB のメモリ、Pod 内のコンテナあたり 10 MiB のエフェメラルストレージ。
クラスタがバースト機能をサポートしているかどうかを確認するには、GKE でのバーストの可用性をご覧ください。
クラスタがバースト機能をサポートしている場合、Autopilot は Pod CPU リクエストに 0.25 vCPU の増分は適用しません。クラスタがバースト機能をサポートしていない場合、Autopilot は CPU リクエストを 0.25 vCPU に切り上げます。クラスタがバースト機能をサポートしているかどうかを確認するには、GKE でのバーストの可用性をご覧ください。
CPU とメモリの比率は、選択したコンピューティングクラスまたはハードウェア構成で許容される範囲内になければなりません。CPU とメモリの比率が許容範囲を超えている場合、Autopilot は小さい方のリソースを自動的に増加させます。たとえば、Scale-Out クラスで実行されている Pod に 1 vCPU と 16 GiB のメモリ（比率 1:16）をリクエストすると、Autopilot は、CPU リクエストを 4 vCPU に増加させ、比率は 1:4 になります。

コンピューティングクラスの最小値と最大値

Autopilot がサポートするコンピューティングクラスごとの CPU とメモリの最小値、最大値と許容される比率を次の表に示します。

コンピューティングクラス	CPU とメモリの比率（vCPU:GiB）	リソース	最小	最大
汎用（デフォルト）	1:1～1:6.5	CPU	この値は、クラスタがバーストをサポートしているかどうかによって異なります。バーストをサポートするクラスタ: 50m CPU バーストをサポートしていないクラスタ: 250m CPU クラスタがバーストをサポートしているかどうかを確認するには、GKE でのバーストの可用性をご覧ください。	30 vCPU
汎用（デフォルト）	1:1～1:6.5	メモリ	この値は、クラスタがバーストをサポートしているかどうかによって異なります。バーストをサポートするクラスタ: 52 MiB バーストをサポートしていないクラスタ: 512 MiB クラスタがバーストをサポートしているかどうかを確認するには、GKE でのバーストの可用性をご覧ください。	110 GiB
アクセラレータ	アクセラレータの最小値と最大値をご覧ください。
バランス	1:1～1:8	CPU	0.25 vCPU	222 vCPU 最小 CPU プラットフォームが選択されている場合: Intel プラットフォーム: 126 vCPU AMD プラットフォーム: 222 vCPU
バランス	1:1～1:8	メモリ	0.5 GiB	851 GiB 最小 CPU プラットフォームが選択されている場合: Intel プラットフォーム: 823 GiB AMD プラットフォーム: 851 GiB
パフォーマンス	なし	CPU	最小リクエスト数は適用されません	C2 マシンシリーズ: 58 vCPU C2D マシンシリーズ: 110 vCPU C3 マシンシリーズ: 174 vCPU ローカル SSD を使用した C3 マシンシリーズ: 174 vCPU C3D マシンシリーズ: 358 vCPU ローカル SSD を使用した C3D マシンシリーズ: 358 vCPU C4D マシンシリーズ（1.33.0-gke.1439000 以降）: 382 vCPU ローカル SSD を使用した C4D マシンシリーズ（1.33.1-gke.1171000 以降）: 382 vCPU H3 マシンシリーズ: 86 vCPU H4D マシンシリーズ（1.33.2-gke.4731000 以降）: 192 vCPU T2A マシンシリーズ: 46 vCPU T2D マシンシリーズ: 58 vCPU C4 マシンシリーズ: 286 vCPU M4 マシンシリーズ（1.33.4-gke.1013000 以降）: 224 vCPU N4 マシンシリーズ: 78 vCPU N4D マシンシリーズ: 94 vCPU Z3 マシンシリーズ: 174 vCPU
		メモリ	最小リクエスト数は適用されません	C2 マシンシリーズ: 218 GiB C2D マシンシリーズ: 835 GiB C3 マシンシリーズ: 1,345 GiB ローカル SSD を使用した C3 マシンシリーズ: 670 GiB C3D マシンシリーズ: 2,750 GiB ローカル SSD を使用した C3D マシンシリーズ: 1,375 GiB C4D マシンシリーズ（1.33.0-gke.1439000 以降）: 2,905 GiB ローカル SSD を使用した C4D マシンシリーズ（1.33.1-gke.1171000 以降）: 2,905 GiB H3 マシンシリーズ: 330 GiB H4D マシンシリーズ（1.33.2-gke.4731000 以降）: 1,400 GiB T2A マシンシリーズ: 172 GiB T2D マシンシリーズ: 218 GiB C4 マシンシリーズ: 2,140 GiB M4 マシンシリーズ（1.33.4-gke.1013000 以降）: 5,952 GiB N4 マシンシリーズ: 600 GiB N4D マシンシリーズ: 768 GiB Z3 マシンシリーズ: 34,000 GiB
		一時ストレージ	最小リクエスト数は適用されません	C2 マシンシリーズ: 56 TiB C2D マシンシリーズ: 56 TiB C3 マシンシリーズ: 56 TiB ローカル SSD を使用した C3 マシンシリーズ: 10,000 GiB C3D マシンシリーズ: 56 TiB ローカル SSD を使用した C3D マシンシリーズ: 10,000 GiB C4D マシンシリーズ（1.33.0-gke.1439000 以降）: 56 TiB ローカル SSD を使用した C4D マシンシリーズ（1.33.1-gke.1171000 以降）: 10,000 GiB H3 マシンシリーズ: 56 TiB H4D マシンシリーズ（1.33.2-gke.4731000 以降）: 56 TiB T2A マシンシリーズ: 56 TiB T2D マシンシリーズ: 56 TiB C4 マシンシリーズ: 56 TiB M4 マシンシリーズ（1.33.4-gke.1013000 以降）: 56 TiB N4 マシンシリーズ: 56 TiB N4D マシンシリーズ: 56 TiB Z3 マシンシリーズ: 34,000 GiB
スケールアウト	正確に 1:4	CPU	0.25 vCPU	`arm64` 43 vCPU `amd64` 54 vCPU
スケールアウト	正確に 1:4	メモリ	1 GiB	`arm64`: 172 GiB `amd64`: 216 GiB

Autopilot Pod でコンピューティングクラスをリクエストする方法については、Autopilot Pod のコンピューティングクラスを選択するをご覧ください。

アクセラレータの最小値と最大値

GKE では、アクセラレータを使用する Pod に対して、CPU、メモリ、エフェメラルストレージの最小リクエストは適用されません。次の表に、使用するアクセラレータの数とタイプに基づいて、これらの各リソースの最大リクエスト数を示します。

特に指定されていない限り、サポートされるエフェメラルストレージの最大値は 56 TiB です。

アクセラレータタイプ	リソース	最大
NVIDIA B200 `nvidia-B200`	CPU	8 GPU: 224 vCPU
	メモリ	8 GPU: 3,968 GiB
	一時ストレージ	8 GPU: 10 TiB
NVIDIA H200（141 GB） `nvidia-h200-141gb`	CPU	8 GPU: 224 vCPU
	メモリ	8 GPU: 2,952 GiB
	一時ストレージ	8 GPU: 10 TiB（1.32.2-gke.1182000 以降） 8 GPU: 2,540 GiB（1.32.2-gke.1182000 より前）
NVIDIA H100 Mega（80 GB） `nvidia-h100-mega-80gb`	CPU	8 GPU: 206 vCPU
	メモリ	8 GPU: 1,795 GiB
	一時ストレージ	8 GPU: 5,250 GiB
NVIDIA H100（80 GB） `nvidia-h100-80gb`	CPU	8 GPU: 206 vCPU
	メモリ	8 GPU: 1,795 GiB
	一時ストレージ	8 GPU: 5,250 GiB
NVIDIA A100（40 GB） `nvidia-tesla-a100`	CPU	1 GPU: 11 vCPU 2 GPU: 22 vCPU 4 GPU: 46 vCPU 8 GPU: 94 vCPU 16 GPU: 94 vCPU A100 GPU ノードで実行されるすべての DaemonSet の CPU リクエストの合計は、2 vCPU を超えないようにする必要があります。
NVIDIA A100（40 GB） `nvidia-tesla-a100`	メモリ	1 GPU: 74 GiB 2 GPU: 148 GiB 4 GPU: 310 GiB 8 GPU: 632 GiB 16 GPU: 1,264 GiB A100 GPU ノードで実行されるすべての DaemonSet のメモリリクエストの合計は、14 GiB 超えないようにする必要があります。
NVIDIA A100（80 GB） `nvidia-a100-80gb`	CPU	1 GPU: 11 vCPU 2 GPU: 22 vCPU 4 GPU: 46 vCPU 8 GPU: 94 vCPU A100（80GB）GPU ノードで実行されるすべての DaemonSet の CPU リクエストの合計は、2 vCPU を超えないようにする必要があります。
	メモリ	1 GPU: 148 GiB 2 GPU: 310 GiB 4 GPU: 632 GiB 8 GPU: 1,264 GiB A100（80GB）GPU ノードで実行されるすべての DaemonSet のメモリリクエストの合計は、14 GiB を超えないようにする必要があります。
	一時ストレージ	1 GPU: 280 GiB 2 GPU: 585 GiB 4 GPU: 1,220 GiB 8 GPU: 2,540 GiB
NVIDIA RTX PRO 6000 `nvidia-rtx-pro-6000`	CPU	1 GPU: 48 vCPU 2 GPU: 96 vCPU 4 GPU: 192 vCPU 8 GPU: 384 vCPU
	メモリ	1 GPU: 180 GiB 2 GPU: 360 GiB 4 GPU: 720 GiB 8 GPU: 1,440 GiB
	一時ストレージ	1 GPU: 1,500 GiB 2 GPU: 3 TiB 4 GPU: 6 TiB 8 GPU: 12 TiB
NVIDIA L4 `nvidia-l4`	CPU	1 GPU: 31 vCPU 2 GPU: 23 vCPU 4 GPU: 47 vCPU 8 GPU: 95 vCPU L4 GPU ノードで実行されるすべての DaemonSet の CPU リクエストの合計は、2 vCPU を超えないようにする必要があります。
NVIDIA L4 `nvidia-l4`	メモリ	1 GPU: 115 GiB 2 GPU: 83 GiB 4 GPU: 177 GiB 8 GPU: 363 GiB L4 GPU ノードで実行されるすべての DaemonSet のメモリリクエストの合計は、14 GiB を超えないようにする必要があります。
NVIDIA Tesla T4 `nvidia-tesla-t4`	CPU	1 GPU: 46 vCPU 2 GPUs: 46 vCPU 4 GPUs: 94 vCPU
NVIDIA Tesla T4 `nvidia-tesla-t4`	メモリ	1 GPU: 287.5 GiB 2 GPU: 287.5 GiB 4 GPU: 587.5 GiB
TPU v5e `tpu-v5-lite-podslice`	CPU	1x1 トポロジ: 24 vCPU 2x2 トポロジ: 112 vCPU 2x4 トポロジ（4 チップリクエスト）: 112 vCPU 2x4 トポロジ（8 チップリクエスト）: 224 vCPU 4x4 トポロジ: 112 vCPU 4x8 トポロジ: 112 vCPU 8x8 トポロジ: 112 vCPU 8x16 トポロジ: 112 vCPU 16x16 トポロジ: 112 vCPU
	メモリ	1x1 トポロジ: 48 GiB 2x2 トポロジ: 192 GiB 2x4 トポロジ（4 チップリクエスト）: 192 GiB 2x4 トポロジ（8 チップリクエスト）: 384 GiB 4x4 トポロジ: 192 GiB 4x8 トポロジ: 192 GiB 8x8 トポロジ: 192 GiB 8x16 トポロジ: 192 GiB 16x16 トポロジ: 192 GiB
	一時ストレージ	56 TiB
TPU v5p `tpu-v5p-slice`	CPU	280 vCPU
	メモリ	448 GiB
	一時ストレージ	56 TiB
TPU v4 `tpu-v4-podslice`	CPU	240 vCPU
	メモリ	407 GiB
	一時ストレージ	56 TiB

Autopilot Pod で GPU をリクエストする方法については、Autopilot に GPU ワークロードをデプロイするをご覧ください。

ワークロードの分離と期間延長のリソースリクエスト

Autopilot を使用すると、次のような方法を使用して Kubernetes のスケジュール設定と強制排除の動作を操作できます。

taint と toleration とノードセレクタを使用して、特定の Pod が特定のノードにのみ配置されるようにします。詳細については、GKE でワークロードの分離を構成するをご覧ください。
Pod の反アフィニティを使用して、Pod が同じノード上に配置されないようにします。これらのメソッドを使用してスケジューリング動作を制御するワークロードのデフォルトと最小のリソースリクエストは、使用しないワークロードよりも高くなります。
アノテーションを使用して、ノードの自動アップグレードとスケールダウンイベントによる強制排除から Pod を最大 7 日間保護します。詳細については、Autopilot Pod の実行時間を延長するをご覧ください。

指定したリクエストが最小値未満の場合、Autopilot の動作は、使用したメソッドに従って次のように変化します。

taint、toleration、セレクタ、期間延長の Pod: Autopilot は、Pod のスケジュールを設定するときにリクエストを増やすように Pod を変更します。
Pod の反アフィニティ: Autopilot は Pod を拒否し、エラーメッセージが表示されます。

次の表に、デフォルトのリクエストと、指定できる最小のリソースリクエストを示します。構成またはコンピューティングクラスがこのテーブルにない場合、Autopilot は特別な最小値またはデフォルト値を適用しません。

コンピューティングクラス	リソース	デフォルト	最小
汎用	CPU	0.5 vCPU	0.5 vCPU
汎用	メモリ	2 GiB	0.5 GiB
バランス	CPU	2 vCPU	1 vCPU
バランス	メモリ	8 GiB	4 GiB
スケールアウト	CPU	0.5 vCPU	0.5 vCPU
スケールアウト	メモリ	2 GiB	2 GiB

初期コンテナ

初期コンテナは順次実行され、アプリケーションコンテナを起動する前に、すべての初期コンテナの実行が完了している必要があります。Autopilot クラスタで、初期コンテナの CPU またはメモリリクエストを指定しない場合、またはリクエストを明示的に 0 に設定した場合、Autopilot は作成時に Pod を変更して、各初期コンテナにリソースリクエストを追加します。各初期コンテナに割り当てられるリクエストは、Pod 内のすべてのアプリケーションコンテナのリクエストの合計に等しくなります。これはデフォルトの動作です。

この動作は、Pod がスケジュールされているノードで使用可能な未割り当てリソースを初期コンテナが使用する Standard クラスタとは異なります。

初期コンテナのリソースの自動割り当て

初期コンテナのリソースの自動割り当ては、Pod の作成時に行われます。Autopilot クラスタの初期コンテナにリソースリクエストを手動で指定しないことをおすすめします。これにより、各コンテナはデフォルトで Pod で使用可能なすべてのリソースを取得できます。

作成後に Pod 内の初期コンテナ以外のコンテナのリソースリクエストを変更しても、Autopilot は初期コンテナのリソースリクエストを自動的に調整しません。そのため、料金が Pod の実際のリソース使用量と一致しないことがあります。請求額は、Pod の有効なリソースリクエストに基づいて計算されます。これは、次のいずれか大きい方です。

Pod 内にある単一初期コンテナのリソースリクエストの最大値。
Pod 内にあるアプリケーションコンテナすべてのリクエストの合計。

詳細については、Autopilot での自動リソース管理をご覧ください。

初期コンテナのリソースの手動割り当て

費用とリソースを管理するために、アプリケーションコンテナの既存のリソースリクエストを変更する必要がある場合は、次のいずれかの方法で初期コンテナのリクエストを調整することをおすすめします。

Pod の新しい合計リクエストに合わせて、初期コンテナのリソースリクエストを手動で更新します。リソースリクエストを手動で指定する場合は、次の点を考慮してください。
- リクエストが Pod の合計リソースよりも少ない場合は、初期コンテナを制約する可能性があります。
- リクエストが Pod の合計リソースを超える場合は、コストの増加につながる可能性があります。
リソースリクエストを削除して、Autopilot で再計算できるようにします。Autopilot は、Pod 内のすべてのアプリケーションコンテナによってリクエストされた現在の合計リソースに基づいて、各初期コンテナにリソースを再割り当てします。

Autopilot でリソース制限を設定する

Kubernetes では、Pod 仕様のリソースに requests と limits の両方を設定できます。Pod の動作は、次の表に示すように、limits が requests と異なるかどうかによって異なります。

値の設定	Autopilot の動作
`requests` は `limits` と等しい	Pod は `Guaranteed` QoS クラスを使用します。注: エフェメラルストレージの上限は、常にリクエストと同じ値に明示的に設定する必要があります。GKE は、このルールに合わせて Pod を変更します。
`requests` は設定、`limits` は未設定	動作は、クラスタがバーストをサポートしているかどうかによって異なります。バースト機能をサポートするクラスタ: Pod は、使用可能なバースト可能な容量までバーストできます。バーストをサポートしていないクラスタ: GKE は `limits` を `requests` に設定します。クラスタがバーストをサポートしているかどうかを確認するには、GKE でのバーストの可用性をご覧ください。
`requests` は未設定、`limits` は設定	Autopilot は、`requests` を `limits` の値に設定します。これは Kubernetes のデフォルトの動作です。変更前: resources: limits: cpu: "400m" 変更後: resources: requests: cpu: "400m" limits: cpu: "400m"
`requests` は `limits` より小さい	動作は、クラスタがバーストをサポートしているかどうかによって異なります。バースト機能をサポートするクラスタ: Pod は、`limits` で指定された値までバーストできます。バーストをサポートしていないクラスタ: GKE は `limits` を `requests` に設定します。クラスタがバーストをサポートしているかどうかを確認するには、GKE でのバーストの可用性をご覧ください。
`requests` は `limits` より大きい	Autopilot は、`requests` を `limits` の値に設定します。変更前: resources: requests: cpu: "450m" limits: cpu: "400m" 変更後: resources: requests: cpu: "400m" limits: cpu: "400m"
`requests` は未設定、`limits` は未設定	Autopilot は、`requests` をコンピューティングクラスまたはハードウェア構成のデフォルト値に設定します。 `limits` の動作は、クラスタがバーストをサポートしているかどうかによって異なります。バーストをサポートするクラスタ: Autopilot は `limits` を設定しません。バーストをサポートしていないクラスタ: GKE は `limits` を `requests` に設定します。クラスタがバーストをサポートしているかどうかを確認するには、GKE でのバーストの可用性をご覧ください。

ほとんどの場合、ワークロードに適切なリソースリクエストと同等の上限を設定します。

起動時やトラフィックの増加時など、定常状態よりも一時的に多くのリソースを必要とするワークロードの場合は、リクエストよりも高い上限を設定して Pod をバーストできるようにします。詳細については、GKE で Pod バーストを構成するをご覧ください。

Autopilot での自動リソース管理

ワークロードに指定したリソースリクエストが許可された範囲外の場合、または一部のコンテナ用のリソースをリクエストしない場合、Autopilot は、許可された範囲に適合するようにワークロード構成を変更します。Autopilot は、リクエストが指定されていないコンテナにデフォルト値を適用したうえで、リソース比率とリソースのスケールアップ要件を計算します。

リクエストがない: 一部のコンテナでリソースをリクエストしない場合、Autopilot はコンピューティングクラスまたはハードウェア構成のデフォルトのリクエストを適用します。
CPU とメモリの比率: Autopilot は、小さい方のリソースをスケールアップして、比率が許容範囲内になるようにします。
エフェメラルストレージ: Autopilot は、各コンテナで必要な最小サイズを満たすようにエフェメラルストレージリクエストを変更します。すべてのコンテナにわたるストレージリクエストの累積値は、最大許容値を超えることはできません。1.28.6-gke.1317000 より前では、値が最大値を超えると、Autopilot はリクエストされたエフェメラルストレージをスケールダウンします。バージョン 1.28.6-gke.1317000 以降では、Autopilot はワークロードを拒否します。
最小数を下回るリクエスト: 選択したハードウェア構成で許容される最小リソース数よりも少ないリソースをリクエストすると、Autopilot は、少なくとも最小リソース値をリクエストするように Pod を自動的に変更します。

デフォルトでは、Autopilot が最小またはデフォルトのリソース値を満たすようにリソースを自動的にスケーリングすると、GKE は追加の容量を Pod マニフェストの最初のコンテナに割り当てます。GKE バージョン 1.27.2-gke.2200 以降では、Pod マニフェストの annotations フィールドに次のコードを追加して、追加のリソースを特定のコンテナに割り当てるように GKE に指示できます。

autopilot.gke.io/primary-container: "CONTAINER_NAME"

CONTAINER_NAME は、コンテナの名前に置き換えます。

リソースの変更の例

次のシナリオ例では、実行中の Pod とコンテナの要件を満たすように Autopilot がワークロード構成を変更する方法を示します。

単一コンテナで 0.05 vCPU 未満の場合

コンテナ数	元のリクエスト	変更されたリクエスト
1	CPU: 30 mCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB	CPU: 50 mCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB

複数のコンテナの合計 CPU が 0.05 vCPU 未満の場合

コンテナ数	元のリクエスト	変更されたリクエスト
1	CPU: 10 mCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB	CPU: 30 mCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB
2	CPU: 10 mCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB	CPU: 10 mCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB
3	CPU: 10 mvCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB	CPU: 10 mCPU メモリ: 0.5 GiB エフェメラルストレージ: 10 MiB
Pod リソースの合計		CPU: 50 mCPU メモリ: 1.5 GiB エフェメラルストレージ: 30 MiB

単一コンテナで、リクエストされた CPU に対してメモリが低すぎる場合

この例では、メモリが CPU の量に対して少なすぎます（最小比は 1 vCPU : 1 GiB）。CPU とメモリの許容最小比は 1:1 です。この値より小さい場合は、メモリリクエストが引き上げられます。

コンテナ数	元のリクエスト	変更されたリクエスト
1	CPU: 4 vCPU メモリ: 1 GiB エフェメラルストレージ: 10 MiB	CPU: 4 vCPU メモリ: 4 GiB エフェメラルストレージ: 10 MiB
Pod リソースの合計		CPU: 4 vCPU メモリ: 4 GiB エフェメラルストレージ: 10 MiB