Fehlerbehebung bei unzureichender Leistung

In diesem Dokument wird beschrieben, wie Sie Probleme mit der langsamen Leistung von Arbeitslasten beheben, die auf KI-optimierten VMs oder Clustern ausgeführt werden.

Informationen zum Erkennen von Leistungsproblemen finden Sie unter Compute Engine-Instanzen und Slurm-Cluster überwachen.

  1. Potenzielle Nachzügler für Ihre Arbeitslast identifizieren und beheben: Führen Sie die folgenden Schritte aus:

    1. Prüfen Sie, ob Sie die Nachzüglererkennung für Ihre Arbeitslast verwenden können. Informationen zu den Einschränkungen und Anforderungen für die Verwendung der Nachzüglererkennung finden Sie unter Compute Engine-Instanzen und Slurm-Cluster überwachen.

      Wenn Sie die Nachzüglererkennung nicht verwenden können, dann nutzen Sie andere Optionen zur Fehlerbehebung bei Leistungsproblemen.

    2. Prüfen Sie anhand der Messwerte zur Nachzüglererkennung, ob VMs für Ihre Arbeitslast als potenzielle Nachzügler infrage kommen.

      So visualisieren Sie beispielsweise alle potenziellen Nachzügler für Ihr Projekt in Cloud Monitoring:

      1. Öffnen Sie in der Google Cloud Console die  Dashboards Seite:

        Zu Dashboards

        Wenn Sie diese Seite über die Suchleiste suchen, wählen Sie das Ergebnis aus, dessen Zwischenüberschrift Monitoring ist.

      2. Klicken Sie im Bereich Typ des Filterbereichs auf Google-Dienste.

      3. Klicken Sie in der Spalte Name auf Cluster Director Health Monitoring.

        Die Detailseite für das Dashboard wird geöffnet.

      4. Wählen Sie mit der Zeitraumauswahl in der Symbolleiste den Zeitraum aus, in dem die Leistungsprobleme aufgetreten sind. Die Nachzüglererkennung dauert in der Regel bis zu 10 Minuten, bis ein Nachzügler gemeldet wird.

      5. Prüfen Sie im Bereich Nachzüglererkennung , ob VMs für Ihre Arbeitslast als potenzielle Nachzügler infrage kommen. Mit dieser Abfrage können Sie prüfen, ob in der Tabelle Potenzielle Nachzüglerinstanzen VMs für Ihre Arbeitslast aufgeführt sind.

    3. Gehen Sie je nach Anzahl der VMs für Ihre Arbeitslast, die als potenzielle Nachzügler infrage kommen, so vor:

  2. Andere Optionen zur Fehlerbehebung bei Leistungsproblemen nutzen: Wenn die gemeldete Liste potenzieller Nachzügler-VMs lang ist oder wenn das Entfernen gemeldeter Nachzügler VMs die Leistung nicht wiederherstellt, nutzen Sie andere Optionen zur Fehlerbehebung bei Leistungsproblemen, z. B.: