Résoudre les problèmes de lenteur

Ce document explique comment résoudre les problèmes de lenteur des performances que vous avez identifiés pour les charges de travail exécutées sur des VM ou des clusters optimisés pour l'IA.

Pour savoir comment identifier les performances lentes, consultez Surveiller les instances Compute Engine et les clusters Slurm.

  1. Identifiez et corrigez les éventuels retardataires pour votre charge de travail : Procédez comme suit :

    1. Vérifiez si vous pouvez utiliser la détection des tâches lentes pour votre charge de travail. Pour consulter les limites et les exigences liées à l'utilisation de la détection des retardataires, consultez Surveiller les instances Compute Engine et les clusters Slurm.

      Si vous ne pouvez pas utiliser la détection des retardataires, essayez d'autres options pour résoudre les problèmes de performances lentes.

    2. Pour vérifier si des VM de votre charge de travail sont susceptibles d'être des retardataires, consultez les métriques de détection des retardataires.

      Par exemple, pour visualiser tous les retardataires suspects de votre projet dans Cloud Monitoring, procédez comme suit :

      1. Dans la console Google Cloud , accédez à la page  Tableaux de bord :

        Accéder à la page Tableaux de bord

        Si vous utilisez la barre de recherche pour trouver cette page, sélectionnez le résultat dont le sous-titre est Monitoring.

      2. Dans la section Type  du volet des filtres, cliquez sur Services Google.

      3. Dans la colonne Nom, cliquez sur Surveillance de l'état de Cluster Director.

        La page d'informations du tableau de bord s'ouvre.

      4. Utilisez le sélecteur de période dans la barre d'outils pour sélectionner la période de performances lentes. La détection des retardataires prend généralement jusqu'à 10 minutes.

      5. Pour vérifier si des VM de votre charge de travail sont suspectées d'être des retardataires, consultez la section Détection des retardataires. Utilisez cette requête pour vérifier si le tableau Instances suspectées d'être à la traîne liste des VM pour votre charge de travail.

    3. En fonction du nombre de VM de votre charge de travail qui sont susceptibles d'être des retardataires, procédez comme suit :

  2. Utilisez d'autres options pour résoudre les problèmes de performances lentes : si la liste des VM lentes suspectées est longue ou si la suppression des VM lentes signalées ne rétablit pas les performances, utilisez d'autres options pour résoudre les problèmes de performances lentes, par exemple :