Diagnostica Dataproc en clústeres de GKE

Dataproc proporciona un comando gcloud CLI dataproc clusters diagnose para ayudarte a solucionar problemas de trabajos y clústeres de Dataproc en GKE. Este comando recopila y archiva archivos de configuración, registros y resultados relacionados con el clúster en un archivo y, luego, sube el archivo al bucket de etapa de Cloud Storage que especificaste cuando creaste tu clúster de Dataproc en GKE.

Diagnostica el archivo

En las siguientes tablas, se enumeran las métricas y otra información incluida en el dataproc clusters diagnose archivo del comando.

Información del sistema

Elemento Ubicación del archivo
Métricas de nodos de GKE en las que se ejecutan pods virtuales de Dataproc en GKE:
  • Uso de CPU
  • Uso de memoria
/system/NODE_NAME.json
Métricas de red y estado del sistema de archivos de los pods en ejecución:
  • Uso de CPU
  • Uso de memoria
  • Estado de la red
  • Estado del sistema de archivos
/system/POD_NAME.json

Información de configuración

Elemento Ubicación del archivo
Configmap del clúster /conf/configmap
Implementación de Kubernetes /conf/deployment
Control de acceso basado en funciones (RBAC)
  • /conf/role
  • /conf/rolebind
  • /conf/serviceaccount

Registros

Elemento Ubicación del archivo
Registro de agente /logs/agent.log
Registro del motor de Spark /logs/sparkengine.log
Registros de trabajos en ejecución y completados del controlador de Spark en las últimas 24 horas /logs/DRIVER_ID

Información del trabajo y del pod

Elemento Ubicación del archivo
Objeto JobAttempt /jobattempts
Objeto Pod de Kubernetes /pods

¿Qué sigue?