Processeur insuffisant

Problème constaté

Au démarrage, les pods de télémétrie passent de l'état CrashLoopBackoff à un autre état, puis reviennent à l'état CrashLoopBackoff. Cela peut entraîner des lacunes périodiques dans vos métriques ou graphiques lors du redémarrage des pods. Vous pouvez également constater des écarts avec les données analytiques, car certaines sections de données sont manquantes.

Messages d'erreur

Lorsque vous utilisez kubectl pour afficher les états des pods, vous constatez qu'un ou plusieurs pods de métriques sont à l'état CrashLoopBackoff. Reportez-vous à la commande suivante :

kubectl get pods -n APIGEE_NAMESPACE

APIGEE_NAMESPACE est l'espace de noms Kubernetes pour vos composants Apigee hybrid. Pour en savoir plus, consultez Créer l'espace de noms Apigee.

Exemple de résultat

NAME                                                      READY   STATUS             RESTARTS   AGE
apigee-metrics-default-telemetry-proxy-1104-hvwoo-zlmlw   0/1     CrashLoopBackoff   10         10m
apigee-metrics-adapter-apigee-telemetry-1104-7fyff-tts65  0/1     CrashLoopBackoff   10         10m
apigee-metrics-default-telemetry-proxy-1104-hvwoo-zlmlw   0/1     FailedScheduling   0          12m

Étapes de diagnostic courantes

  1. Vérifiez les événements pour détecter les problèmes liés aux pods de télémétrie à l'aide de la commande suivante :
    kubectl -n apigee get event 

    Exemple de résultat

    LAST SEEN   TYPE      REASON           OBJECT                                                           MESSAGE
    53m         Normal    SuccessfulCreate job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251940 Created pod: apigee-cassandra-schema-val-jghunt-20250709-0820206-292519fkt7j
    53m         Normal    Completed        job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251940 Job completed
    43m         Normal    SuccessfulCreate job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251950 Created pod: apigee-cassandra-schema-val-jghunt-20250709-0820206-292519l87m8
    43m         Normal    Completed        job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251950 Job completed
    33m         Normal    SuccessfulCreate job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251960 Created pod: apigee-cassandra-schema-val-jghunt-20250709-0820206-29251962ncc
        
  2. Vous pouvez également vérifier les événements des pods de télémétrie avec un état CrashLoopBackOff à l'aide de la commande suivante :
    kubectl -n apigee describe POD_NAME

    POD_NAME est le nom du pod à l'état CrashLoopBackOff.

    Exemple de résultat

     apigee-metrics-apigee-telemetry-app-1101-qc36n-dxzrv    
  3. Vous pouvez également vérifier l'état cpu des pods à l'aide de la commande suivante :
    kubectl -n apigee get hpa | grep unknown

    Exemple de résultat

    apigee-metrics-apigee-telemetry-app-1101-qc36n-dxzrv   ReplicaSet/apigee-metrics-apigee-telemetry-app-1101-qc36n-dxzrv   /80%                                2         10        2          8h
     

Causes possibles

Cause Description Instructions de dépannage applicables
metrics.app.resources.requests.cpu et metrics.app.resources.limits.cpu sont manquants Le cpu doit être spécifié dans le fichier overrides.yaml. Apigee hybrid

Cause

cpu n'est pas mentionné dans le fichier overrides.yaml, donc cpu obtient une valeur indéfinie.

Diagnostic

Vérifiez votre fichier overrides.yaml pour voir si les deux valeurs cpu sont définies pour metrics.app.resources.requests.cpu et metrics.app.resources.limits.cpu.

Solution

Si les paramètres cpu sont manquants dans votre fichier overrides.yaml pour les métriques, fournissez les deux valeurs cpu dans le fichier overrides.yaml.

  1. Ajoutez la configuration suivante sous la section metrics de votre fichier overrides.yaml :

    metrics:
      app: # The apigee-prometheus-app container in the "app" pod
        resources:
          requests:
            memory: 512Mi # Default value: 512Mi
            cpu: 500m # Default value: 500m
          limits:
            memory: 2Gi # default: 1Gi
            cpu: 500m # Default value: 500m
      

  2. Appliquez les modifications à l'aide de la commande suivante :
    helm upgrade ENV_RELEASE_NAME apigee-env/ \
    --install \
    --namespace APIGEE_NAMESPACE \
    --set env=ENV_NAME \
    -f OVERRIDES_FILE
    • ENV_RELEASE_NAME est un nom unique utilisé pour suivre l'installation et la mise à niveau du graphique apigee-env. Bien qu'il soit généralement identique à ENV_NAME, il doit être différent si votre environnement porte le même nom que votre groupe d'environnements. Par exemple, si les deux sont nommés dev, vous pouvez utiliser dev-env-release et dev-envgroup-release pour les distinguer.

    • APIGEE_NAMESPACE correspond à l'espace de noms Kubernetes pour vos composants Apigee hybrid. Pour en savoir plus, consultez Créer l'espace de noms Apigee.

    • ENV_NAME est le nom que vous avez utilisé lors de la création de l'environnement dans l'interface utilisateur.

    • OVERRIDES_FILE correspond au fichier overrides.yaml utilisé lors des mises à niveau ou de l'installation.

Pour en savoir plus, consultez la documentation de référence sur les propriétés de configuration.

Vous devez collecter des informations de diagnostic

Si le problème persiste, même après avoir suivi les instructions ci-dessus, rassemblez les informations de diagnostic suivantes, puis contactez le service clientGoogle Cloud  :

  1. Le fichier overrides.yaml.
  2. Résultat du script Must-Gather Apigee Hybrid.