Soluciona problemas de rendimiento lento

En este documento, se explica cómo solucionar problemas de rendimiento lento que identificaste en cargas de trabajo que se ejecutan en VMs o clústeres optimizados para IA.

Para aprender a identificar el rendimiento lento, consulta Supervisa instancias de Compute Engine y clústeres de Slurm.

  1. Identifica y aborda cualquier rezagado sospechoso para tu carga de trabajo: Completa los siguientes pasos:

    1. Comprueba si puedes usar la detección de rezagados para tu carga de trabajo. Para revisar las limitaciones y los requisitos para usar la detección de rezagados, consulta Supervisa instancias de Compute Engine y clústeres de Slurm.

      Si no puedes usar la detección de rezagados, usa otras opciones para solucionar problemas de rendimiento lento.

    2. Para verificar si alguna VM de tu carga de trabajo se considera rezagada, consulta las métricas de detección de rezagados.

      Por ejemplo, para visualizar todos los rezagados sospechosos de tu proyecto en Cloud Monitoring, completa los siguientes pasos:

      1. En la consola de Google Cloud , accede a la página Paneles :

        Acceder a Paneles

        Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo es Monitoring.

      2. En la sección Tipo del panel de filtros, haz clic en Servicios de Google.

      3. En la columna Nombre, haz clic en Supervisión del estado de Cluster Director.

        Se abrirá la página de detalles del panel.

      4. Usa el selector de intervalo de tiempo en la barra de herramientas para seleccionar el intervalo de tiempo del rendimiento lento. Por lo general, la detección de rezagados tarda hasta 10 minutos en informar sobre un rezagado.

      5. Para verificar si alguna VM de tu carga de trabajo es sospechosa de ser rezagada, revisa la sección Detección de rezagados. Usa esta consulta para ver si la tabla Instancias rezagadas sospechosas incluye alguna VM para tu carga de trabajo.

    3. Según la cantidad de VMs de tu carga de trabajo que se sospecha que son rezagadas, haz lo siguiente:

  2. Usa otras opciones para solucionar problemas de rendimiento lento: Si la lista informada de VMs rezagadas sospechosas es grande o si quitar las VMs rezagadas informadas no restablece el rendimiento, usa otras opciones para solucionar problemas de rendimiento lento, como las siguientes: