A3 マシンシリーズで NVIDIA H100 GPU を使用して Confidential VM インスタンスを作成すると、GPU 割り当てに関連する次のエラーが発生することがあります。
リージョン割り当てが不足している
このエラーは、リクエストが特定のリージョンで使用可能な GPU 割り当てを超えた場合に発生します。
エラー メッセージの例:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_PER_GPU_FAMILY exceeded. Limit: QUOTA_LIMIT in
region REGION
Google Cloud コンソールでは、GPU 割り当てのエラー メッセージに、増加が必要な特定の割り当てタイプではなく、GPUS_PER_GPU_FAMILY
などの一般的な割り当て名が表示されることがあります。GPU を使用する Confidential VM インスタンスの場合、この割り当て名はプリエンプティブル割り当てを指します。
リージョンのプリエンプティブル NVIDIA H100 GPU 割り当ての増加をリクエストするには、プリエンプティブル割り当てをリクエストするをご覧ください。
グローバル割り当てが不足している
このエラーは、すべてのリージョンでの GPU の合計使用量がグローバル GPU 割り当てを超えた場合に発生します。
エラー メッセージの例:
RESOURCE_NAME Could not fetch resource:
Quota GPUS_ALL_REGIONS exceeded. Limit: QUOTA_LIMIT globally
グローバル割り当ての増加をリクエストするには、グローバル割り当てをリクエストするをご覧ください。