Resolver problemas de lentidão

Este documento explica como resolver problemas de desempenho lento identificados em cargas de trabalho executadas em VMs ou clusters otimizados para IA.

Para saber como identificar o desempenho lento, consulte Monitorar instâncias do Compute Engine e clusters do Slurm.

  1. Identificar e resolver possíveis problemas de desempenho lento na carga de trabalho: siga estas etapas:

    1. Verifique se é possível usar a detecção de desempenho lento na carga de trabalho. Para conferir as limitações e os requisitos para usar a detecção de desempenho lento, consulte Monitorar instâncias do Compute Engine e clusters do Slurm.

      Se não for possível usar a detecção de desempenho lento, então use outras opções para resolver problemas de desempenho lento.

    2. Para verificar se alguma VM da carga de trabalho tem suspeita de desempenho lento, consulte as métricas de detecção de desempenho lento.

      Por exemplo, para visualizar todos os possíveis problemas de desempenho lento do projeto no Cloud Monitoring, siga estas etapas:

      1. No Google Cloud console, acesse a página  Painéis:

        Acesse Painéis

        Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.

      2. Na seção Tipo do painel de filtros, clique em Serviços do Google.

      3. Na coluna Nome, clique em Monitoramento de integridade do Cluster Director.

        A página de detalhes do painel será aberta.

      4. Use o seletor de período na barra de ferramentas para selecionar o período de desempenho lento. A detecção de desempenho lento normalmente leva até 10 minutos para informar um problema.

      5. Para verificar se alguma VM da carga de trabalho tem suspeita de desempenho lento, consulte a seção Detecção de desempenho lento. Use essa consulta para verificar se a tabela Instâncias com suspeita de desempenho lento lista alguma VM da carga de trabalho.

    3. Com base no número de VMs da carga de trabalho que têm suspeita de desempenho lento, siga estas etapas:

  2. Usar outras opções para resolver problemas de desempenho lento: se a lista informada de VMs com suspeita de desempenho lento for grande ou se a remoção das VMs informadas não restaurar a performance, use outras opções para resolver problemas de desempenho lento, como as seguintes: