GKE のトラブルシューティング
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
このドキュメントには、Google Kubernetes Engine(GKE)の使用時に発生する可能性のある一般的な問題のトラブルシューティング ドキュメントの一覧を掲載します。ImagePullBackOff や CrashLoopBackOff などのワークロード エラーの診断、クラスタの自動スケーリング動作のデバッグ、PersistentVolume の問題の解決、ノード登録の問題のトラブルシューティングなどを行う際に、ここに記載されているドキュメントが役立ちます。
GKE のトラブルシューティングが初めての場合は、トラブルシューティングの概要から確認してください。
発生した問題を診断して解決するには、次のセクションのドキュメントをご覧ください。
GKE ネットワーキングのトラブルシューティングを行うには、GKE ネットワーキングのドキュメントで GKE ネットワーキングのトラブルシューティングをご覧ください。
このドキュメントは、GKE 構成のトラブルシューティングを行う管理者とアーキテクト、セキュリティ スペシャリスト、ネットワーク スペシャリスト、ストレージ スペシャリストを対象としています。GKE ロールの詳細については、GKE の一般的なユーザーロールとタスクをご確認ください。
トラブルシューティングの概要
クラスタの設定
| トピック |
説明 |
| クラスタの作成 |
クラスタの作成に関する問題を解決します。 |
| Autopilot クラスタ |
クラスタの作成、Namespace の削除、スケーリング、ワークロードの問題など、GKE Autopilot クラスタを診断してトラブルシューティングを行います。 |
| Kubectl コマンドライン ツール |
認証や認可に関する問題など、GKE の kubectl コマンドライン ツールのトラブルシューティングを行います。このページでは、Konnectivity プロキシのトラブルシューティングを行う方法についても説明します。このプロキシが原因で kubectl logs、attach、exec、port-forward コマンドが応答しなくなっているかどうかを確認できます。 |
| Standard ノードプール |
ノードプールの作成、ベスト エフォート型のプロビジョニング、インスタンス メタデータの破損、新しいノードプールへのワークロードの移行に関する問題など、GKE Standard ノードプールのトラブルシューティングを行います。 |
ノード NotReady のステータス |
リソース不足、ネットワークの問題、コンポーネントの障害といった一般的な原因のトラブルシューティングを行い、GKE でノードの NotReady ステータスを診断して解決する方法を確認します。 |
| ノードの登録 |
GKE Standard クラスタにノードを追加する際に発生する問題(ノード登録の失敗、ノード登録に成功するための前提条件を満たしていないなど)のトラブルシューティングを行います。 |
| コンテナ ランタイム |
containerd と dockershim や、限定公開レジストリに関する問題など、GKE のコンテナ ランタイムのトラブルシューティングを行います。 |
自動スケーリング
| トピック |
説明 |
| クラスタ オートスケーラーがスケールダウンしない |
クラスタが使用率の低いノードを削除しない一般的な理由を診断して解決します。制限の厳しい PodDisruptionBudgets、ローカル ストレージを使用する Pod、ノードの削除を妨げる特定のアノテーション("cluster-autoscaler.kubernetes.io/safe-to-evict": "false" など)といった問題を確認する方法について説明します。 |
| クラスタ オートスケーラーがスケールアップしない |
クラスタ オートスケーラーが需要を満たすために新しいノードを追加しない理由を確認します。スケジュール不可能な Pod の有無を確認し、クラスタまたはノードプールのサイズ上限に達していないか確認し、リソース割り当てまたはリージョン VM の可用性に関する潜在的な問題を特定します。 |
| 水平 Pod 自動スケーリング |
HorizontalPodAutoscaler がアプリケーションの Pod レプリカをスケーリングしない問題のトラブルシューティングを行います。HorizontalPodAutoscaler オブジェクトの構成ミスや指標パイプラインの問題など、一般的な問題を解決します。 |
ストレージ
| トピック |
説明 |
| ストレージ |
リージョン永続ディスク、ディスク パフォーマンス、ボリューム拡張に関する問題など、ストレージのトラブルシューティングを行います。 |
クラスタ セキュリティ
クラスタのルート認証局の有効期限が近づいている
ワークロード
クラスタ管理
| トピック |
説明 |
| クラスタのアップグレード |
長時間または完了しないアップグレード、予期しない自動アップグレード、失敗、アップグレード後の問題など、GKE クラスタとノードのアップグレードに関する問題のトラブルシューティングと解決を行います。 |
| Webhook |
アドミッション Webhook を使用する際のトラブルシューティング方法やクラスタ コントロール プレーンの安定性を確保する方法について説明します。 |
Namespace が Terminating 状態のままになる |
削除をブロックしている異常なコンポーネントを特定して削除することで、Namespace が Terminating 状態のままになる問題のトラブルシューティングを行います。 |
| 同時実行オペレーション |
これらのエラーを特定し、オペレーションの完了を待つことで解決する方法を確認して、同時実行オペレーションのトラブルシューティングを行います。 |
モニタリング
| トピック |
説明 |
| システム指標 |
Cloud Monitoring にシステム指標が表示されない問題のトラブルシューティングを行います。 |
| モニタリング ダッシュボード |
モニタリングの有効化、Kubernetes リソースの不足、権限に関する問題など、モニタリング ダッシュボードのトラブルシューティングを行います。 |
| ログが見つからない場合のトラブルシューティング |
GKE ログが見つからない場合のトラブルシューティング方法です。API のステータス、クラスタ設定、権限、割り当て、フィルタ、アプリケーションの動作を確認する方法について説明します。 |
4xx エラー
既知の問題
| トピック |
説明 |
| 既知の問題 |
GKE の使用に影響する可能性がある既知の問題を特定して解決します。 |
次のステップ
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-11-27 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-11-27 UTC。"],[],[]]