Mantén tus servicios en Google Kubernetes Engine (GKE) funcionando sin problemas aprendiendo a solucionar problemas de manera eficaz. Ya sea que seas nuevo en Kubernetes o un usuario experimentado, aprende a diagnosticar y resolver problemas comunes, desde errores de aplicación como CrashLoopBackOff hasta problemas en todo el clúster, como nodos que no se unen o Pods que no se pueden programar. Aprenderás a solucionar estos problemas con herramientas clave como la herramienta de línea de comandos de kubectl, Cloud Logging y Cloud Monitoring.
Desarrolla tus habilidades de solución de problemas de GKE con estas herramientas y técnicas:
Revisa Google Cloud el estado del servicio y los incidentes para ver los incidentes de confiabilidad en curso que podrían afectar tus clústeres.
Identifica rápidamente los posibles problemas evaluando el estado del clúster y la carga de trabajo en la Google Cloud consola.
Visualiza el estado en vivo de recursos como nodos y Pods investigando el estado del clúster con la herramienta de línea de comandos
kubectl.Encuentra la causa raíz de las fallas realizando un análisis histórico con Cloud Logging.
Soluciona los problemas antes de que afecten a los usuarios realizando una supervisión proactiva con Cloud Monitoring.
Acelera el diagnóstico con Gemini Cloud Assist analizando errores, recibiendo orientación paso a paso y realizando investigaciones automáticas de problemas.
Para comprender cómo funcionan estas herramientas en conjunto, sigue un ejemplo de situación de solución de problemas para diagnosticar y resolver una falla de aplicación en el mundo real.
Los registros de backend de ciertos componentes administrados se conservan durante un máximo de 30 días. Si necesitas comunicarte con Atención al cliente de Cloud, abre una solicitud menos de 30 días después de notar un problema.
Comprende los conceptos básicos
Si eres nuevo en Kubernetes y GKE, es fundamental que comprendas los conceptos básicos, como la arquitectura del clúster y la relación entre los Pods y los nodos, antes de comenzar a solucionar problemas. Si quieres obtener más información, consulta Comienza a aprender sobre GKE.
También es útil comprender qué partes de GKE eres responsable de mantener y cuáles son responsabilidad de Google Cloud responsable de mantener. Para obtener más información, consulta Responsabilidad compartida de GKE.
¿Qué sigue?
Lee Revisar Google Cloud el estado del servicio y los incidentes (la siguiente página de esta serie).
Para obtener asesoramiento sobre cómo resolver problemas específicos, consulta las guías de solución de problemas de GKE.
Si no encuentras una solución a tu problema en la documentación, consulta Obtener asistencia para obtener más ayuda, como asesoramiento en los siguientes temas:
- Comunicarse con Atención al cliente de Cloud para abrir un caso de asistencia.
- Hacer preguntas en StackOverflow para obtener asistencia de
la comunidad y usar la etiqueta
google-kubernetes-enginepara buscar problemas similares. También puedes unirte al#kubernetes-enginecanal de Slack para obtener más Asistencia de la comunidad. - Abrir errores o solicitudes de funciones con la herramienta de seguimiento de errores pública.