Problème constaté
Au démarrage, les pods de télémétrie passent de l'état CrashLoopBackoff à un autre état, puis reviennent à l'état CrashLoopBackoff. Cela peut entraîner des lacunes périodiques dans vos métriques ou graphiques lors du redémarrage des pods. Vous pouvez également constater des écarts avec les données analytiques, car certaines sections de données sont manquantes.
Messages d'erreur
Lorsque vous utilisez kubectl pour afficher les états des pods, vous constatez qu'un ou plusieurs pods de métriques sont à l'état CrashLoopBackoff. Reportez-vous à la commande suivante :
kubectl get pods -n APIGEE_NAMESPACE
Où APIGEE_NAMESPACE est l'espace de noms Kubernetes pour vos composants Apigee hybrid. Pour en savoir plus, consultez Créer l'espace de noms Apigee.
Exemple de résultat
NAME READY STATUS RESTARTS AGE apigee-metrics-default-telemetry-proxy-1104-hvwoo-zlmlw 0/1 CrashLoopBackoff 10 10m apigee-metrics-adapter-apigee-telemetry-1104-7fyff-tts65 0/1 CrashLoopBackoff 10 10m apigee-metrics-default-telemetry-proxy-1104-hvwoo-zlmlw 0/1 FailedScheduling 0 12m
Étapes de diagnostic courantes
- Vérifiez les événements pour détecter les problèmes liés aux pods de télémétrie à l'aide de la commande suivante :
kubectl -n apigee get event
Exemple de résultat
LAST SEEN TYPE REASON OBJECT MESSAGE 53m Normal SuccessfulCreate job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251940 Created pod: apigee-cassandra-schema-val-jghunt-20250709-0820206-292519fkt7j 53m Normal Completed job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251940 Job completed 43m Normal SuccessfulCreate job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251950 Created pod: apigee-cassandra-schema-val-jghunt-20250709-0820206-292519l87m8 43m Normal Completed job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251950 Job completed 33m Normal SuccessfulCreate job/apigee-cassandra-schema-val-jghunt-20250709-0820206-29251960 Created pod: apigee-cassandra-schema-val-jghunt-20250709-0820206-29251962ncc - Vous pouvez également vérifier les événements des pods de télémétrie avec un état
CrashLoopBackOffà l'aide de la commande suivante :kubectl -n apigee describe POD_NAME
où POD_NAME est le nom du pod à l'état
CrashLoopBackOff.Exemple de résultat
apigee-metrics-apigee-telemetry-app-1101-qc36n-dxzrv
- Vous pouvez également vérifier l'état
cpudes pods à l'aide de la commande suivante :kubectl -n apigee get hpa | grep unknown
Exemple de résultat
apigee-metrics-apigee-telemetry-app-1101-qc36n-dxzrv ReplicaSet/apigee-metrics-apigee-telemetry-app-1101-qc36n-dxzrv
/80% 2 10 2 8h
Causes possibles
| Cause | Description | Instructions de dépannage applicables |
|---|---|---|
metrics.app.resources.requests.cpu et metrics.app.resources.limits.cpu sont manquants |
Le cpu doit être spécifié dans le fichier overrides.yaml. |
Apigee hybrid |
Cause
cpu n'est pas mentionné dans le fichier overrides.yaml, donc cpu obtient une valeur indéfinie.
Diagnostic
Vérifiez votre fichier overrides.yaml pour voir si les deux valeurs cpu sont définies pour metrics.app.resources.requests.cpu et metrics.app.resources.limits.cpu.
Solution
Si les paramètres cpu sont manquants dans votre fichier overrides.yaml pour les métriques, fournissez les deux valeurs cpu dans le fichier overrides.yaml.
Ajoutez la configuration suivante sous la section
metricsde votre fichieroverrides.yaml:metrics: app: # The apigee-prometheus-app container in the "app" pod resources: requests: memory: 512Mi # Default value: 512Mi cpu: 500m # Default value: 500m limits: memory: 2Gi # default: 1Gi cpu: 500m # Default value: 500m
- Appliquez les modifications à l'aide de la commande suivante :
helm upgrade ENV_RELEASE_NAME apigee-env/ \ --install \ --namespace APIGEE_NAMESPACE \ --set env=ENV_NAME \ -f OVERRIDES_FILE
Où ENV_RELEASE_NAME est un nom unique utilisé pour suivre l'installation et la mise à niveau du graphique
apigee-env. Bien qu'il soit généralement identique à ENV_NAME, il doit être différent si votre environnement porte le même nom que votre groupe d'environnements. Par exemple, si les deux sont nommésdev, vous pouvez utiliserdev-env-releaseetdev-envgroup-releasepour les distinguer.Où APIGEE_NAMESPACE correspond à l'espace de noms Kubernetes pour vos composants Apigee hybrid. Pour en savoir plus, consultez Créer l'espace de noms Apigee.
Où ENV_NAME est le nom que vous avez utilisé lors de la création de l'environnement dans l'interface utilisateur.
Où OVERRIDES_FILE correspond au fichier
overrides.yamlutilisé lors des mises à niveau ou de l'installation.
Vous devez collecter des informations de diagnostic
Si le problème persiste, même après avoir suivi les instructions ci-dessus, rassemblez les informations de diagnostic suivantes, puis contactez le service clientGoogle Cloud :
- Le fichier
overrides.yaml. - Résultat du script Must-Gather Apigee Hybrid.