Backup for GKE の復元オペレーションエラーのトラブルシューティング

Autopilot Standard

このドキュメントでは、Backup for GKE を使用して復元オペレーションを実行するときに発生する可能性のあるエラーとその対応するコードについて説明します。各セクションには、復元エラーを解決するためのアクションを実行する際に考慮すべき事項と、復元オペレーションエラーを解決する方法の手順が含まれています。

エラー 200010301: アドミッション Webhook サービスを利用できないため、復元オペレーションを完了できませんでした

エラー 200010301 は、Admission Webhook サービス（HTTP コールバックとも呼ばれます）が使用できないために復元オペレーションの実行が失敗した場合に発生します。この場合、次のエラーメッセージが表示されます。このエラーメッセージは、リソースの復元中に GKE API サーバーが Admission Webhook に接続しようとしたものの、Webhook をサポートするサービスが使用できないか見つからなかったことを示しています。

  resource [/example-group/ClusterSecretStore/example-store] restore failed:

  Internal error occurred: failed calling webhook "example-webhook.io":
  failed to call webhook: Post "https://example-webhook.example-namespace.svc:443/validate-example": service "example-webhook" not found.

このエラーは、ターゲットクラスタで ValidatingAdmissionWebhook または MutatingAdmissionWebhook GKE リソースがアクティブになっているにもかかわらず、GKE API サーバーが Webhook で構成されたエンドポイントに到達できない場合に発生します。Admission Webhook は GKE API サーバーへのリクエストをインターセプトし、その構成で GKE API サーバーがリクエストをクエリする方法を指定します。

Webhook の clientConfig は、アドミッションリクエストを処理するバックエンドを指定します。これは、内部のクラスタサービスまたは外部の URL になります。これらの 2 つのオプションのどちらを選択するかは、Webhook の特定の運用要件とアーキテクチャ要件によって異なります。オプションのタイプによっては、次の理由で復元オペレーションが失敗する可能性があります。

クラスタ内サービス: GKE API サーバーが Webhook の呼び出しを試みたときに、GKE サービスとそのバッキング Pod が復元されていないか、準備されていません。これは、名前空間が指定されたサービスが完全に ready 状態になる前に、クラスタスコープの Webhook 構成が適用される復元オペレーション中に発生します。
外部 URL: GKE クラスタと外部エンドポイントの間のネットワーク接続の問題、DNS 解決の問題、ファイアウォールルールにより、外部エンドポイントが一時的に使用できません。

このエラーを解決するには、次の手順で対応します。

エラーメッセージに記載されている失敗した Webhook を特定します。例: failed calling webhook "..."
kubectl get validatingwebhookconfigurations コマンドを実行して、Webhook を検査します。
```
kubectl get validatingwebhookconfigurations WEBHOOK_NAME -o yaml
```
WEBHOOK_NAME は、エラーメッセージで特定された Webhook の名前に置き換えます。

kubectl get mutatingwebhookconfigurations コマンドを実行して、Webhook を検査することもできます。
```
kubectl get mutatingwebhookconfigurations WEBHOOK_NAME -o yaml
```
WEBHOOK_NAME は、エラーメッセージで特定された Webhook の名前に置き換えます。

注: Webhook は検証または変更のいずれかです。したがって、Webhook のタイプに応じて、これらのコマンドのいずれか 1 つのみが成功します。
構成タイプに応じて、次のトラブルシューティングの手順を行います。
サービスベース clientConfig
RestorePlan リソースを変更して、GroupKindDependency エントリを含む RestoreOrder を含めることで、カスタム復元順序を定義します。これにより、ValidatingWebhookConfiguration または MutatingWebhookConfiguration の前に、Deployment、StatefulSet、Service などの Webhook をサポートするコンポーネントを復元して準備できます。

カスタム復元順序を定義する手順については、復元中にリソースの復元順序を指定するをご覧ください。

このアプローチは、Service オブジェクトが作成された後でも、サービスの Pod が完全に ready 状態にならないため、失敗する可能性があります。失敗のもう 1 つの理由として、別のアプリケーションによって Webhook 構成が予期せず作成された可能性があります。または、次の手順で 2 段階の復元オペレーションを実行することもできます。
1. バックアップを使用して Restore リソースを作成します。これを行うには、Webhook が機能するために必要な特定のリソース（Namespaces、Deployments、StatefulSets、Services など）を含むきめ細かい復元フィルタを使用して、復元オペレーションを構成します。
  
  きめ細かい復元フィルタを使用して復元を構成する方法については、きめ細かい復元を有効にするをご覧ください。
2. バックアップオペレーション用の別の Restore リソースを作成し、選択した残りのリソースを構成します。
URL ベース clientConfig
1. 外部 HTTPS エンドポイントを確認し、アクティブで、到達可能で、正しく機能していることを確認します。
2. GKE クラスタのノードとコントロールプレーンから外部 URL へのネットワーク接続があることを確認します。また、Virtual Private Cloud、オンプレミス、または Webhook、ネットワークポリシー、DNS 解決をホストするクラウドプロバイダを使用している場合は、ファイアウォールルールを確認する必要がある場合があります。
復元オペレーションを再試行します。オペレーションが引き続き失敗する場合は、Cloud カスタマーケアにお問い合わせください。

エラー 200010302: リソース作成リクエストが拒否されたため、復元オペレーションを完了できませんでした

エラー 200010302 は、アドミッション Webhook がリソース作成リクエストを拒否したために復元オペレーションの完了が失敗した場合に発生します。これにより、アクティブなアドミッション Webhook がリクエストをインターセプトし、カスタムポリシーに基づいてリクエストを拒否したため、バックアップのリソースをターゲットクラスタに作成できなかったことを示す次のエラーメッセージが表示されます。

  [KubeError]; e.g. resource

  [/example-namespace/example-api/ExampleResource/example-name]

  restore failed: admission webhook "example-webhook.example.com" denied the request: {reason for denial}

このエラーは、ターゲット GKE クラスタで設定された構成が原因で発生します。この構成には、リソースの作成と変更に特定のルールを適用し、リソース作成リクエストをブロックする ValidatingAdmissionWebhook または MutatingAdmissionWebhook のいずれかが含まれています。たとえば、関連するが競合しているリソースがすでにクラスタに存在するため、Webhook はリソースの作成を阻止します。たとえば、Webhook は、デプロイがすでに HorizontalPodAutoscaler GKE API リソースによって管理されている場合、デプロイの作成を拒否することがあります。

このエラーを解決するには、次の手順で対応します。

復元オペレーションが失敗したときに発生するエラーメッセージを使用して、リクエストを拒否している Webhook を特定します。たとえば、webhook WEBHOOK_NAME denied the request エラーメッセージには次の情報が含まれます。
- Webhook 名: リクエストを拒否した Webhook の名前。
- 拒否の理由: リクエストを拒否した具体的な理由。
kubectl get validatingwebhookconfigurations コマンドを実行して、Webhook を検査します。
```
kubectl get validatingwebhookconfigurations WEBHOOK_NAME -o yaml
```
WEBHOOK_NAME は、エラーメッセージで特定した Webhook の名前に置き換えます。

kubectl get mutatingwebhookconfigurations コマンドを実行して、Webhook を検査することもできます。
```
kubectl get mutatingwebhookconfigurations WEBHOOK_NAME -o yaml
```
WEBHOOK_NAME は、エラーメッセージから特定した Webhook の名前に置き換えます。

注: Webhook は検証または変更のいずれかです。したがって、Webhook のタイプに応じて、これらのコマンドのいずれか 1 つのみが成功します。
ターゲットクラスタの根本的な問題を解決します。是正措置は、特定のエラーによって異なります。たとえば、HorizontalPodAutoscaler の競合がある場合は、バックアップされたワークロードと関連リソースを作成できるように、復元を実行する前にターゲットクラスタ内の既存の HorizontalPodAutoscaler を削除する必要があります。
復元オペレーションを再試行します。復元オペレーションが引き続き失敗する場合は、Cloud カスタマーケアにお問い合わせください。

エラー 200060202: ワークロードの検証中に GKE リソースが見つからなかったため、復元オペレーションを完了できませんでした

エラー 200060202 は、復元オペレーションのワークロード検証フェーズで、Backup for GKE が検証を想定している GKE リソースがターゲットクラスタで見つからない場合に発生します。これにより、次のエラーメッセージが表示されます。

  Workload Validation Error: [KIND] "[NAME]" not found

例: Example: Workload Validation Error: pods "jenkins-0" not found

このエラーは、Backup for GKE が復元オペレーションのプロセスの一環として GKE リソースを正常に作成または更新したものの、検証ステージの開始時に、GKE リソースのワークロード検証が完了する前に、リソースが復元プロセスによって最初に作成または更新された後に削除されたため、1 つ以上の GKE リソースがターゲットクラスタに存在しなくなった場合に発生します。このようなエラーは、次の理由で発生する可能性があります。

手動削除: ユーザーまたは管理者が kubectl またはその他の Google Cloud ツールを使用してリソースを手動で削除しました。
外部自動化: GitOps コントローラ（Config Sync、ArgoCD、Flux、カスタムスクリプト、その他のクラスタ管理ツール）が、リポジトリ内の望ましい状態に合わせてリソースを元に戻すか、削除しました。
GKE コントローラ: リソースが他のリソースやポリシーと競合しているか、OwnerReference チェーンによってガベージコレクションや GKE による自動クリーンアッププロセス（owner リソースが削除されたときに依存リソースを削除する）が開始されるため、そのリソースが GKE コントローラによって削除されました。

このエラーを解決するには、次の手順で対応します。

復元オペレーションが完了しなかったときに表示されるエラーメッセージを使用して、不足しているリソースを特定します。
次のいずれかの方法で、リソースが属している名前空間を特定します。
- GKE 監査ログ: 復元オペレーションを試行したときに生成された GKE 監査ログを確認します。リソース Kind と Name に対する削除オペレーションのログをフィルタできます。監査ログエントリに、元の名前空間が含まれています。
- バックアップの詳細: 復元オペレーションのスコープとバックアップの内容を確認します。バックアップインデックスには、リソースの元の名前空間が表示されます。また、RestorePlan に、選択した名前空間内のリソースを復元するルールを指定する TransformationRule が含まれているかどうかを確認することもできます。
- 名前空間をまたいで検索する: kubectl get コマンドを使用して、すべての名前空間でリソースを検索します。
```
kubectl get KIND --all-namespaces | grep NAME
```
  KIND と NAME は、エラーメッセージの値に置き換えます。リソースがまだ存在する場合は、このコマンドでその名前空間が表示されます。
kubectl get コマンドを実行して、削除を確認します。
```
kubectl get KIND NAME -n [NAMESPACE]
```
KIND と NAME は、エラーメッセージの値に置き換えます。not found エラーメッセージが表示されます。
次のいずれかの方法で、削除の原因を調査します。
- GKE 監査ログ: 削除リクエストを発行したエンティティを特定します。たとえば、ユーザー、サービスアカウント、コントローラなどです。
- 構成された自動化を確認する: GitOps などの自動化ツールを使用している場合は、復元されたリソースに干渉していないかどうかをログとステータスで確認します。
- 関連するイベントを確認する: kubectl get events コマンドを実行して、特定された名前空間の GKE イベントを確認します。
```
kubectl get events -n NAMESPACE_NAME --sort-by='.lastTimestamp'
```
  NAMESPACE_NAME は名前空間の名前に置き換えます。
前の手順の結果に基づいて、リソース削除の原因に対処します。たとえば、競合する自動化の一時停止、誤った構成の修正、ユーザー権限の調整を行います。
次のいずれかの方法で、不足しているリソースを復元します。
- マニフェストファイルを再適用する: 不足しているリソースのマニフェストがある場合は、正しい名前空間に再適用できます。
- きめ細かい復元を実行する: きめ細かい復元オペレーションを実行して、同じバックアップから不足しているリソースのみを選択的に復元します。これにより、正しい名前空間を指定できます。きめ細かい復元オペレーションの実行方法については、きめ細かい復元を有効にするをご覧ください。
  
  注: このエラーは、見つからない単一のリソースのみを指しますが、実際にはターゲットクラスタ内に存在していないリソースが複数ある可能性があります。
復元オペレーションを再試行します。復元オペレーションが引き続き失敗する場合は、Cloud カスタマーケアにお問い合わせください。

エラー 200060201: ワークロードの検証がタイムアウトしたため、復元オペレーションを完了できませんでした

エラー 200060201 は、クラスタにリソースが作成された後、復元オペレーションで 1 つ以上の復元されたワークロードが想定される時間内に完全に ready にならない場合に発生します。これにより、次のエラーメッセージが表示されます。

Workload Validation Error: Timedout waiting for workloads to be ready - [namespace/workload_name, ...]

このエラーは、Backup for GKE が GKE リソース構成の復元後に検証ステップを実行して、重要なワークロードが正しく機能していることを確認するために発生します。Backup for GKE は、特定のワークロードが ready 状態になるのを待機しますが、割り当てられたタイムアウト期間内に次の準備完了条件を満たしていないワークロードが少なくとも 1 つあります。

Pods の場合: status.Phase は Running
Deployments の場合: status.ReadyReplicas は spec.Replicas と等しい
StatefulSets の場合: status.ReadyReplicas は spec.Replicas と等しい
DaemonSets の場合: status.NumberReady は status.DesiredNumberScheduled と等しい

このエラーを解決するには、次の手順で対応します。

ワークロードとその名前空間が ready 状態にならなかったことを示すエラーメッセージで、ready 状態になっていないワークロードを特定します。
kubectl describe コマンドを実行して、ワークロードのステータスを調べ、失敗したワークロードの詳細とイベントを取得します。
```
kubectl describe WORKLOAD_TYPE WORKLOAD_NAME -n NAMESPACE_NAME
kubectl get pods -n NAMESPACE_NAME -l SELECTOR_FOR_WORKLOAD
```
次のように置き換えます。
- WORKLOAD_TYPE: ワークロードのタイプ（Deployment、StatefulSet、DaemonSet など）。
- WORKLOAD_NAME: 特定のワークロードインスタンスの名前。
- NAMESPACE_NAME: ワークロードが配置されている名前空間。
- SELECTOR_FOR_WORKLOAD: ワークロードに関連付けられている Pods を見つけるためのラベルセレクタ。例: app=my-app
Deployments または StatefulSets ワークロードタイプの Pod の場合は、kubectl describe pod コマンドを実行して、個々の Pod のステータスを確認します。
```
kubectl describe pod POD_NAME -n NAMESPACE_NAME
```
次のように置き換えます。
- POD_NAME: 特定の Pod の名前。
- NAMESPACE_NAME: Pod が配置されている名前空間。
Events セクションで、describe 出力のイベントとログを分析し、次の情報を特定します。
- ImagePullBackOff / ErrImagePull: コンテナイメージの取得に問題があることを示します。
- CrashLoopBackOff: コンテナが起動してクラッシュしていることを示します。
Containers セクションで、describe 出力のコンテナログを分析し、kubectl logs コマンドを実行してコンテナ名を見つけます。
```
kubectl logs POD_NAME -n NAMESPACE_NAME -c CONTAINER_NAME
```
次のように置き換えます。
- POD_NAME: 特定の Pod の名前。
- NAMESPACE_NAME: Pod が配置されている名前空間。
- CONTAINER_NAME: Pod 内のコンテナの名前。
describe の出力によると、Pod がリソース出力に表示されない理由として、次のようなものが考えられます。
- readiness プローブの失敗: コンテナの readiness プローブが正常に動作しません。
- リソースの問題: クラスタ内の CPU、メモリ、その他のリソースが不足しているか、割り当て上限に達しています。
- 初期コンテナの問題: 初期コンテナの障害により、メインコンテナの起動がブロックされます。
- 構成エラー: ConfigMaps、Secrets、または環境変数のエラー。
- ネットワークの問題: Pods が必要なサービスと通信できません。
GKE クラスタのリソースを確認して、復元されたワークロードを実行するのに十分なノード容量、CPU、メモリが GKE クラスタにあることを確認します。Autopilot クラスタでは、ノードの自動プロビジョニングに時間がかかることがあります。そのため、ノードのスケーリングの制限やエラーを確認することをおすすめします。調査結果に基づいて根本的な問題に対処し、ワークロードが ready 状態になることを妨げている問題を解決します。このアプローチでは、マニフェストの修正、リソースリクエストまたは上限の調整、ネットワークポリシーの修正、依存関係の確保などを行えます。
根本的な問題が解決したら、ワークロードが ready 状態になるまで待ちます。復元オペレーションを再度実行する必要はありません。

問題が解決しない場合は、Cloud カスタマーケアにお問い合わせください。

エラー 200060102: ボリュームの検証エラーのため、復元オペレーションを完了できませんでした

エラー 200060102 は、VolumeBackup から PersistentVolume へのデータ復元のプロセスを管理する 1 つ以上の VolumeRestore リソースが、復元オペレーションのボリューム検証フェーズで failed 状態または deleting 状態になったために発生します。ボリュームの復元に失敗すると、復元リソースの stateReason フィールドに次のエラーメッセージが表示されます。

Volume Validation Error: Some of the volume restores failed - [projects/PROJECT_ID/locations/LOCATION/restorePlans/RESTORE_PLAN_ID/restores/RESTORE_ID/volumeRestores/VOLUME_RESTORE_ID (PVC: NAMESPACE/PVC_NAME), ...]

エラーメッセージには、ターゲット PersistentVolumeClaim 名と名前空間を含む、失敗した VolumeRestore の完全なリソース名が一覧表示されます。このエラーメッセージは、Backup for GKE が VolumeBackups から PersistentVolumes をプロビジョニングするために VolumeRestore リソースを開始したときに、影響を受ける PersistentVolumeClaim のデータ復元プロセスが正常に完了せず、スナップショットからの基盤となる Persistent Disk の作成が失敗したことを示しています。VolumeRestore の失敗は、以下の理由で発生する可能性があります。

割り当てが不足している: プロジェクトまたはリージョンに割り当てられている Persistent Disk の割り当てが不足しています（例: SSD_TOTAL_GB）。
権限の問題: Backup for GKE で使用されるサービスアカウントに、ディスクの作成やスナップショットへのアクセスに必要な権限がありません。
ネットワークの問題: ディスクの作成プロセスを中断する一時的または永続的なネットワークの問題があります。
無効なスナップショット: ソース VolumeBackup または基盤となる Persistent Disk スナップショットが破損しているか、アクセスできません。
リソースの制約: 他のクラスタリソースの制約により、ボリュームのプロビジョニングが妨げられています。
内部エラー: Persistent Disk サービス内で内部的な問題が発生しています。

このエラーを解決するには、次の手順で対応します。

エラーメッセージに表示されている失敗した PersistentVolumeClaims を特定します。エラーメッセージには、失敗した VolumeRestore オブジェクトの完全なリソース名が一覧表示されます。
gcloud beta container backup-restore volume-restores describe コマンドを実行して、失敗した各 VolumeRestore リソースの詳細を取得します。
```
gcloud beta container backup-restore volume-restores describe VOLUME_RESTORE_ID \
--project=PROJECT_ID \
--location=LOCATION \
--restore-plan=RESTORE_PLAN_ID \
--restore=RESTORE_ID
```
次のように置き換えます。
- VOLUME_RESTORE_ID: 失敗した VolumeRestore リソースの ID。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- LOCATION: 復元の Google Cloud ロケーション。
- RESTORE_PLAN_ID: 復元プランの ID。
- RESTORE_ID: 復元オペレーションの ID。
出力の state フィールドと stateMessage フィールドで、障害の詳細を確認します。

注: 復元オペレーションのエラーメッセージに PersistentVolumeClaim の名前と名前空間が含まれていない場合があります。上記の gcloud describe コマンドの stateMessage フィールドを使用して、ターゲット PersistentVolumeClaim の詳細を確認します。
kubectl get pvc コマンドを実行して、ターゲット PersistentVolumeClaim の状態を確認します。
```
kubectl get pvc PVC_NAME -n NAMESPACE_NAME -o yaml
```
次のように置き換えます。
- PVC_NAME: PersistentVolumeClaim リソースの名前。
- NAMESPACE_NAME: PersistentVolumeClaim が配置されている名前空間。
出力の status.phase セクションに Pending フェーズが示されていることを確認します。このフェーズは、PersistentVolumeClaim がまだ PersistentVolume にバインドされていないことを意味します。これは、VolumeRestore が失敗した場合に想定される状態です。
YAML 出力の Events セクションで、ProvisioningFailed などのプロビジョニングの失敗に関連するメッセージを確認します。
```
Cloud KMS error when using key projects/PROJECT_ID/locations/LOCATION/keyRings/KEY_RING/cryptoKeys/CRYPTO_KEY:  Permission 'cloudkms.cryptoKeyVersions.useToEncrypt' denied  on resource 'projects/PROJECT_ID/locations/LOCATION/keyRings/KEY_RING/cryptoKeys/CRYPTO_KEY' (or it may not exist).
```
出力は、ディスクの作成中に暗号鍵にアクセスする際に権限の問題が発生したことを示しています。鍵にアクセスするための compute service agent 関連の権限を付与するには、Backup for GKE ドキュメントの CMEK 暗号化の有効化に関する説明をご覧ください。
kubectl get events コマンドを実行して、PersistentVolumeClaim 名前空間の GKE イベントを確認します。このイベントには、PersistentVolume コントローラまたは CSI ドライバからの詳細なエラーメッセージが含まれています。
```
kubectl get events -n NAMESPACE_NAME --sort-by='.lastTimestamp'
```
NAMESPACE_NAME は PersistentVolumeClaim の名前空間に置き換えます。
PersistentVolumeClaim 名に関連するイベントを特定します。この名前には、FailedProvisioning や ExternalProvisioning などのキーワードが含まれています。イベントには、pd.csi.storage.gke.io などのストレージプロビジョナーのエラーが含まれることもあります。
Cloud Logging の Cloud Audit Logs と Persistent Disk ログで、障害発生時のディスク作成オペレーションに関連するエラーがないか確認し、Persistent Disk ログを調べます。
生成されたエラーメッセージに基づいて、次の根本的な問題に対処します。
- (QUOTA_EXCEEDED}: Quota SSD_TOTAL_GB exceeded などの指示がある場合は、Persistent Disk の割り当てを増やします。
- IAM 権限を確認して修正します。
- ネットワークの問題を調査して解決する。
- スナップショットまたは Persistent Disk サービスに関する問題を解決するには、Cloud カスタマーケアにお問い合わせください。
- PersistentVolumeClaim は Pending 状態のままです。
- 復元オペレーションプロセスでは、VolumeRestore が自動的に再試行されません。この問題を解決するには、影響を受ける PersistentVolumeClaim を使用する Deployment または StatefulSet ワークロードの復元オペレーションをトリガーする必要があります。
- きめ細かい復元を使用して、失敗した PersistentVolumeClaim に関連付けられている Deployment または StatefulSet ワークロードを選択的に復元します。このアプローチにより、基盤となる問題が解決された場合に、標準の GKE メカニズムで PersistentVolumeClaim の作成とバインディングのプロセスを再度処理できます。きめ細かい復元の詳細については、きめ細かい復元を有効にするをご覧ください。

問題が解決しない場合や、VolumeRestore の失敗の原因が不明な場合は、Cloud カスタマーケアにお問い合わせください。

エラー 200060101: ボリュームの検証がタイムアウトしたため、復元オペレーションを完了できませんでした

エラー 200060101 は、復元オペレーションのボリューム検証フェーズで、VolumeBackup からのデータの復元を管理する 1 つ以上の VolumeRestore リソースが割り当てられたタイムアウト期間内に succeeded 状態に達しなかったため、Backup for GKE が待機を停止した場合に発生します。他の VolumeRestore リソースも不完全である可能性があります。

Restore リソースの stateReason フィールドのエラーメッセージには、タイムアウトがチェックされたときに succeeded 状態になっていなかった最初の VolumeRestore リソースが表示されます。これには、その特定の VolumeRestore のターゲット PersistentVolumeClaim 名と名前空間が含まれます。次に例を示します。

Volume Validation Error: Timed out waiting for volume restore [projects/PROJECT_ID/locations/LOCATION/restorePlans/RESTORE_PLAN_NAME/restores/RESTORE_NAME/volumeRestores/VOLUME_RESTORE_ID (PVC: PVC_NAMESPACE/PVC_NAME)]

Backup for GKE は VolumeRestore リソースを開始して、VolumeBackups から PersistentVolumes をプロビジョニングします。このエラーは、スナップショットからの基盤となる Persistent Disk の作成と、それに続く PersistentVolumeClaim の PersistentVolume へのバインドに、引用された VolumeRestore の計算されたタイムアウトよりも時間がかかったことを示しています。同じ復元オペレーションの他の VolumeRestores も完了していない状態になっている可能性があります。

Backup for GKE の観点からはタイムアウトに達していても、前述の VolumeRestore リソースと、場合によっては VolumeRestore リソースの基盤となるディスク作成プロセスがまだ進行中であるか、失敗している可能性があります。

この問題を解決するには、次の手順で対応します。

エラーメッセージで、タイムアウトした PersistentVolumeClaim の名前と名前空間を特定します（例: (PVC: PVC_NAMESPACE/PVC_NAME)）。
gcloud beta container backup-restore volume-restores list コマンドを実行して、復元オペレーションに関連付けられているすべての VolumeRestores を一覧表示し、現在の状態を確認します。
```
gcloud beta container backup-restore volume-restores list \
--project=PROJECT_ID \
--location=LOCATION \
--restore-plan=RESTORE_PLAN_NAME \
--restore=RESTORE_NAME
```
次のように置き換えます。
- PROJECT_ID: Google Cloud プロジェクトの ID
- LOCATION: 復元の Google Cloud ロケーション。
- RESTORE_PLAN_NAME: 復元プランの名前。
- RESTORE_NAME: 復元オペレーションの名前。
succeeded 状態ではない VolumeRestores を見つけます。
gcloud beta container backup-restore volume-restores describe コマンドを実行して、エラーで言及されている VolumeRestore と、succeeded 状態ではない他の VolumeRestores の詳細を取得します。
```
gcloud beta container backup-restore volume-restores describe VOLUME_RESTORE_ID \
--project=PROJECT_ID \
--location=LOCATION \
--restore-plan=RESTORE_PLAN_NAME \
--restore=RESTORE_NAME
```
次のように置き換えます。
- VOLUME_RESTORE_ID: VolumeRestore リソースの ID。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- LOCATION: 復元の Google Cloud ロケーション。
- RESTORE_PLAN_NAME: 復元プランの名前。
- RESTORE_NAME: 復元オペレーションの名前。
state フィールドと stateMessage フィールドを確認します。state フィールドの値は creating または restoring である可能性があります。stateMessage フィールドには、より多くのコンテキストが提供され、ターゲット PersistentVolumeClaim の詳細が含まれている場合があります。
kubectl get pvc コマンドを実行して、特定されたターゲット PersistentVolumeClaims の状態を調べます。
```
kubectl get pvc PVC_NAME -n PVC_NAMESPACE -o yaml
```
次のように置き換えます。
- PVC_NAME: PersistentVolumeClaim の名前。
- PVC_NAMESPACE: PersistentVolumeClaim の名前空間。
PersistentVolumeClaim's status.phase の値は Pending になる可能性があります。Events セクションで次のエラーを確認します。
- Waiting for first consumer to be created before binding: StorageClass が volumeBindingMode: WaitForFirstConsumer を持っていることを示します。
  
  PersistentVolumeClaim を使用する Pod が作成されてスケジュールされるまで、PersistentVolume のプロビジョニングは遅延されます。この問題は、ボリュームプロビジョニング自体ではなく、Pod スケジューリングに関連している可能性があります。そのため、PersistentVolumeClaim を使用する Pods がスケジュールされていない理由や開始されていない理由を確認することをおすすめします。
- FailedProvisioning またはストレージプロビジョナーからのエラー: たとえば、pd.csi.storage.gke.io。
kubectl get events コマンドを実行して、関連する名前空間の GKE イベントを確認します。
```
kubectl get events -n PVC_NAMESPACE --sort-by='.lastTimestamp'
```
PVC_NAMESPACE は、PersistentVolumeClaim の名前空間に置き換えます。

PersistentVolumeClaim 名に関連するイベント（プロビジョニングメッセージやエラーなど）を探します。
Cloud Logging で Cloud Audit Logs と Persistent Disk のログを確認します。
creating 状態と restoring 状態のすべての VolumeRestores のステータスをモニタリングします。

問題が解決すると、VolumeRestores のステータスは succeeded または failed のいずれかの状態に移行できます。VolumeRestores が succeeded 状態になると、PersistentVolumeClaims は Bound になり、ワークロードは機能します。VolumeRestore が failed 状態になった場合は、トラブルシューティングの手順を実施して、ボリュームの検証エラーを解決する必要があります。詳細については、エラー 200060102: ボリューム検証エラーのため、復元オペレーションを完了できませんでしたをご覧ください。

VolumeRestores が creating 状態または restoring 状態のまま長時間経過している場合は、Cloud カスタマーケアにお問い合わせください。

次のステップ

失敗したバックアップオペレーションの Backup for GKE エラーコードの概要ページを読む。

Backup for GKE の復元オペレーションエラーのトラブルシューティング

エラー 200010301: アドミッション Webhook サービスを利用できないため、復元オペレーションを完了できませんでした

サービスベース `clientConfig`

URL ベース `clientConfig`

エラー 200010302: リソース作成リクエストが拒否されたため、復元オペレーションを完了できませんでした

エラー 200060202: ワークロードの検証中に GKE リソースが見つからなかったため、復元オペレーションを完了できませんでした

エラー 200060201: ワークロードの検証がタイムアウトしたため、復元オペレーションを完了できませんでした

エラー 200060102: ボリュームの検証エラーのため、復元オペレーションを完了できませんでした

エラー 200060101: ボリュームの検証がタイムアウトしたため、復元オペレーションを完了できませんでした

次のステップ

Backup for GKE の復元オペレーション エラーのトラブルシューティング コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

エラー 200010301: アドミッション Webhook サービスを利用できないため、復元オペレーションを完了できませんでした

サービスベース clientConfig

URL ベース clientConfig

エラー 200010302: リソース作成リクエストが拒否されたため、復元オペレーションを完了できませんでした

エラー 200060202: ワークロードの検証中に GKE リソースが見つからなかったため、復元オペレーションを完了できませんでした

エラー 200060201: ワークロードの検証がタイムアウトしたため、復元オペレーションを完了できませんでした

エラー 200060102: ボリュームの検証エラーのため、復元オペレーションを完了できませんでした

エラー 200060101: ボリュームの検証がタイムアウトしたため、復元オペレーションを完了できませんでした

次のステップ

Backup for GKE の復元オペレーションエラーのトラブルシューティング

サービスベース `clientConfig`

URL ベース `clientConfig`