Deployment di proxy API non riusciti con avviso Nessun pod di runtime attivo

Stai visualizzando la documentazione di Apigee e Apigee hybrid.
Visualizza la documentazione di Apigee Edge.

Sintomi

I deployment dei proxy API non riescono con l'avviso Nessun pod di runtime attivo nella UI di Apigee Hybrid.

Messaggi di errore

L'avviso Nessun pod di runtime attivo viene visualizzato nella finestra di dialogo Dettagli accanto al messaggio di errore Problemi di deployment su ENVIRONMENT: REVISION_NUMBER nella pagina del proxy API:

Questo problema può manifestarsi come errori diversi in altre pagine delle risorse dell'interfaccia utente. Ecco alcuni messaggi di errore di esempio:

Messaggio di errore dell'interfaccia utente ibrida n. 1: errore Datastore

Potresti notare l'errore Datastore nelle pagine Prodotti API e App dell'interfaccia utente ibrida, come mostrato di seguito:

Messaggio di errore dell'interfaccia utente ibrida n. 2: Errore interno del server

Potresti notare l'errore interno del server nella pagina Sviluppatori dell'interfaccia utente, come mostrato di seguito:

Output comando kubectl

Potresti notare che gli stati dei pod apiege-mart, apigee-runtime e apigee- synchronizer vengono modificati in CrashLoopBackOff nell'output comando kubectl get pods:

Messaggi di errore dei log dei componenti

Nei log dei pod apigee-runtime nelle release di Apigee Hybrid >= 1.4.0, vedrai i seguenti errori di probe di attività:

{"timestamp":"1621575431454","level":"ERROR","thread":"qtp365724939-205","mdc":{"targetpath":"/v1/pr
obes/live"},"logger":"REST","message":"Error occurred : probe failed Probe cps-datastore-
connectivity-liveliness-probe failed due to com.apigee.probe.model.ProbeFailedException{ code =
cps.common.datastoreConnectionNotHealthy, message = Datastore connection not healthy, associated
contexts =
[]}\n\n\tcom.apigee.probe.ProbeAPI.getResponse(ProbeAPI.java:66)\n\tcom.apigee.probe.ProbeAPI.getLiv
eStatus(ProbeAPI.java:55)\n\tsun.reflect.GeneratedMethodAccessor52.invoke(Unknown
Source)\n\tsun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)\n\t
","context":"apigee-service-
logs","severity":"ERROR","class":"com.apigee.rest.framework.container.ExceptionMapper","method":"toR
esponse"}

{"timestamp":"1621575431454","level":"ERROR","thread":"qtp365724939-205","mdc":{"targetpath":"/v1/pr
obes/live"},"logger":"REST","message":"Returning error response : ErrorResponse{errorCode =
probe.ProbeRunError, errorMessage = probe failed Probe cps-datastore-connectivity-liveliness-probe
failed due to com.apigee.probe.model.ProbeFailedException{ code =
cps.common.datastoreConnectionNotHealthy, message = Datastore connection not healthy, associated
contexts = []}}","context":"apigee-service-
logs","severity":"ERROR","class":"com.apigee.rest.framework.container.ExceptionMapper","method":"toR
esponse"}

Nei log dei pod apigee-synchronizer nelle release di Apigee hybrid >= 1.4.0, vedrai il seguente errore Cannot build a cluster without contact points :

{"timestamp":"1621575636434","level":"ERROR","thread":"main","logger":"KERNEL.DEPLOYMENT","message":
"ServiceDeployer.deploy() : Got a life cycle exception while starting service [SyncService, Cannot
build a cluster without contact points] : {}","context":"apigee-service-
logs","exception":"java.lang.IllegalArgumentException: Cannot build a cluster without contact
points\n\tat com.datastax.driver.core.Cluster.checkNotEmpty(Cluster.java:134)\n\tat
com.datastax.driver.core.Cluster.<init>(Cluster.java:127)\n\tat
com.datastax.driver.core.Cluster.buildFrom(Cluster.java:193)\n\tat
com.datastax.driver.core.Cluster$Builder.build(Cluster.java:1350)\n\tat
io.apigee.persistence.PersistenceContext.newCluster(PersistenceContext.java:214)\n\tat
io.apigee.persistence.PersistenceContext.<init>(PersistenceContext.java:48)\n\tat
io.apigee.persistence.ApplicationContext.<init>(ApplicationContext.java:19)\n\tat
io.apigee.runtimeconfig.service.RuntimeConfigServiceImpl.<init>(RuntimeConfigServiceImpl.java:75)
\n\tat
io.apigee.runtimeconfig.service.RuntimeConfigServiceFactory.newInstance(RuntimeConfigServiceFactory.
java:99)\n\tat
io.apigee.common.service.AbstractServiceFactory.initializeService(AbstractServiceFactory.java:301)\n
\tat
...","severity":"ERROR","class":"com.apigee.kernel.service.deployment.ServiceDeployer","method":"sta
rtService"}

Nei log del pod apigee-mart nelle release di Apigee Hybrid >= 1.4.0, vedrai i seguenti errori di probe di attività:

{"timestamp":"1621576757592","level":"ERROR","thread":"qtp991916558-144","mdc":{"targetpath":"/v1/pr
obes/live"},"logger":"REST","message":"Error occurred : probe failed Probe cps-datastore-
connectivity-liveliness-probe failed due to com.apigee.probe.model.ProbeFailedException{ code =
cps.common.datastoreConnectionNotHealthy, message = Datastore connection not healthy, associated
contexts =
[]}\n\n\tcom.apigee.probe.ProbeAPI.getResponse(ProbeAPI.java:66)\n\tcom.apigee.probe.ProbeAPI.getLiv
eStatus(ProbeAPI.java:55)\n\tsun.reflect.NativeMethodAccessorImpl.invoke0(Native
Method)\n\tsun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)\n\t","conte
xt":"apigee-service-
logs","severity":"ERROR","class":"com.apigee.rest.framework.container.ExceptionMapper","method":"toR
esponse"}

{"timestamp":"1621576757593","level":"ERROR","thread":"qtp991916558-144","mdc":{"targetpath":"/v1/pr
obes/live"},"logger":"REST","message":"Returning error response : ErrorResponse{errorCode =
probe.ProbeRunError, errorMessage = probe failed Probe cps-datastore-connectivity-liveliness-probe
failed due to com.apigee.probe.model.ProbeFailedException{ code =
cps.common.datastoreConnectionNotHealthy, message = Datastore connection not healthy, associated
contexts = []}}","context":"apigee-service-
logs","severity":"ERROR","class":"com.apigee.rest.framework.container.ExceptionMapper","method":"toR
esponse"}

Informazioni sull'errore Nessun pod di runtime attivo

Nella release 1.4.0 di Apigee hybrid, la funzionalità di probe di attività è stata aggiunta ai pod apigee-runtime e apigee-mart per controllare lo stato dei pod Cassandra. Se tutti i pod Cassandra diventano non disponibili, i probe di attività dei pod apigee-runtime e apigee-mart non andranno a buon fine. Di conseguenza, i pod apigee-runtime e apigee-mart passeranno allo stato CrashLoopBackOff , causando il mancato deployment dei proxy API con l'avviso No active runtime pods. Anche il pod apigee-synchronizer passerà allo stato CrashLoopBackOff perché i pod Cassandra non sono disponibili.

Cause possibili

Ecco alcune possibili cause di questo errore:

Causa	Descrizione
I pod Cassandra non sono attivi	I pod Cassandra non sono attivi, pertanto i pod `apigee-runtime` non potranno comunicare con il database Cassandra.
Replica Cassandra configurata con un solo pod	Avere un solo pod Cassandra potrebbe diventare un single point of failure.

Causa: i pod Cassandra non sono attivi

Durante il processo di deployment del proxy API, i pod apigee-runtime si connettono al database Cassandra per recuperare risorse, come mappe chiave-valore (KVM) e cache, definite nel proxy API. Se non sono in esecuzione pod Cassandra, i pod apigee-runtime non potranno connettersi al database Cassandra. Ciò comporta l'errore di deployment del proxy API.

Diagnosi

Elenca i pod Cassandra:

kubectl -n apigee get pods -l app=apigee-cassandra

Esempio di output 1:

NAME                         READY   STATUS    RESTARTS   AGE
apigee-cassandra-default-0   0/1     Pending   0          9m23s

Nota:questo output di esempio mostra che il pod Cassandra è nello stato Pending.

Esempio di output 2:

NAME                 READY   STATUS            RESTARTS   AGE
apigee-cassandra-0   0/1     CrashLoopBackoff  0          10m

Nota:questo output di esempio mostra che il pod Cassandra è nello stato CrashLoopBackoff.

Verifica lo stato di ogni pod Cassandra. Lo stato di tutti i pod Cassandra deve essere Running. Se uno dei pod Cassandra si trova in uno stato diverso, potrebbe essere il motivo di questo problema. Per risolvere il problema, procedi nel seguente modo:

Risoluzione

Se uno dei pod Cassandra si trova nello stato Pending, consulta I pod Cassandra sono bloccati nello stato In attesa per risolvere il problema.

Se uno dei pod Cassandra è nello stato CrashLoopBackoff, consulta I pod Cassandra sono bloccati nello stato CrashLoopBackoff per risolvere il problema.

Nota:una volta che i pod di Cassandra diventano integri, i pod apigee-runtime, apigee-mart e apigee-synchronizer verranno ripristinati e il loro stato cambierà in Running.

Esempio di output:

kubectl -n apigee get pods -l app=apigee-runtime
NAME                                                           READY   STATUS    RESTARTS   AGE
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-2gnch   1/1     Running   13         43m
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-42jdv   1/1     Running   13         45m
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-l7wq7   1/1     Running   13         43m
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-q2thb   1/1     Running   8          38m

kubectl -n apigee get pods -l app=apigee-mart
NAME                                                  READY   STATUS    RESTARTS   AGE
apigee-mart-apigee-hybrid-s-2664b3e-143-u0a5c-rtg69   2/2     Running   8          28m

kubectl -n apigee get pods -l app=apigee-synchronizer
NAME                                                              READY   STATUS    RESTARTS   AGE
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zp269nb   2/2     Running   10         29m
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zp2w2jp   2/2     Running   0          4m40s
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zpkfkvq   2/2     Running   0          4m40s
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zpxmzhn   2/2     Running   0          4m40s

Causa: replica Cassandra configurata con un solo pod

Se il conteggio delle repliche di Cassandra è configurato su 1, nel runtime sarà disponibile un solo pod Cassandra. Di conseguenza, i pod apigee-runtime potrebbero riscontrare problemi di connettività se il pod Cassandra non è disponibile per un determinato periodo di tempo.

Diagnosi

Ottieni il set con stato Cassandra e controlla il numero attuale di repliche:
```
kubectl -n apigee get statefulsets -l app=apigee-cassandra
```
Esempio di output:
```
NAME                               READY           AGE
apigee-cassandra-default           1/1             21m
```
Nota:l'output di esempio riportato sopra mostra che il conteggio delle repliche è configurato con un valore di 1 (fai riferimento al campo READY).
Se il conteggio delle repliche è configurato su 1, segui questi passaggi per aumentarlo a un numero maggiore.

Risoluzione

I deployment non di produzione di Apigee hybrid potrebbero avere il numero di repliche Cassandra impostato su 1. Se l'alta disponibilità di Cassandra è importante nelle implementazioni non di produzione, aumenta il conteggio delle repliche a 3 per risolvere il problema.

Per risolvere il problema, procedi nel seguente modo:

Aggiorna il file overrides.yaml e imposta il conteggio delle repliche di Cassandra su 3:
```
cassandra:
  replicaCount: 3
```
Per informazioni sulla configurazione di Cassandra, consulta Riferimento per le proprietà di configurazione.

Applica la configurazione precedente utilizzando Helm:

Prova:

  helm upgrade datastore apigee-datastore/ \
  --install \
  --namespace APIGEE_NAMESPACE \
  --atomic \
  -f OVERRIDES_FILE \
  --dry-run

Installa il grafico Helm

  helm upgrade datastore apigee-datastore/ \
  --install \
  --namespace APIGEE_NAMESPACE \
  --atomic \
  -f OVERRIDES_FILE

Ottieni il set con stato Cassandra e controlla il numero attuale di repliche:

kubectl -n get statefulsets -l app=apigee-cassandra

Esempio di output:

NAME                              READY         AGE
apigee-cassandra-default          3/3           27m

Ottieni i pod Cassandra e controlla il conteggio attuale delle istanze. Se tutti i pod non sono pronti e si trovano nello stato Running, attendi la creazione e l'attivazione dei nuovi pod Cassandra:

kubectl -n get pods -l app=apigee-cassandra

Esempio di output:

NAME                         READY   STATUS    RESTARTS   AGE
apigee-cassandra-default-0   1/1     Running   0          29m
apigee-cassandra-default-1   1/1     Running   0          21m
apigee-cassandra-default-2   1/1     Running   0          19m

Nota:una volta che i pod di Cassandra diventano integri, i pod apigee-runtime, apigee-mart e apigee-synchronizer verranno ripristinati e il loro stato cambierà in Running.

Esempio di output:

kubectl -n apigee get pods -l app=apigee-runtime
NAME                                                           READY   STATUS    RESTARTS   AGE
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-2gnch   1/1     Running   13         43m
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-42jdv   1/1     Running   13         45m
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-l7wq7   1/1     Running   13         43m
apigee-runtime-apigee-hybrid-s-test1-8b64f12-143-501i7-q2thb   1/1     Running   8          38m

kubectl -n apigee get pods -l app=apigee-mart
NAME                                                  READY   STATUS    RESTARTS   AGE
apigee-mart-apigee-hybrid-s-2664b3e-143-u0a5c-rtg69   2/2     Running   8          28m

kubectl -n apigee get pods -l app=apigee-synchronizer
NAME                                                              READY   STATUS    RESTARTS   AGE
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zp269nb   2/2     Running   10         29m
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zp2w2jp   2/2     Running   0          4m40s
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zpkfkvq   2/2     Running   0          4m40s
apigee-synchronizer-apigee-hybrid-s-test1-8b64f12-143-96zpxmzhn   2/2     Running   0          4m40s

Deve raccogliere informazioni diagnostiche

Se il problema persiste anche dopo aver seguito le istruzioni riportate sopra, raccogli le seguenti informazioni diagnostiche e poi contatta l'assistenza clienti Google Cloud.

ID progetto Google Cloud
Organizzazione Apigee hybrid/Apigee
Per Apigee hybrid: il overrides.yaml, mascherando qualsiasi informazioni sensibili

Stato del pod Kubernetes in tutti gli spazi dei nomi:

kubectl get pods -A > kubectl-pod-status`date +%Y.%m.%d_%H.%M.%S`.txt

Dump di cluster-info di Kubernetes:

# generate kubernetes cluster-info dump
kubectl cluster-info dump -A --output-directory=/tmp/kubectl-cluster-info-dump
# zip kubernetes cluster-info dump
zip -r kubectl-cluster-info-dump`date +%Y.%m.%d_%H.%M.%S`.zip /tmp/kubectl-cluster-info-dump/*

Deployment di proxy API non riusciti con avviso Nessun pod di runtime attivo Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Sintomi

Messaggi di errore

Messaggio di errore dell'interfaccia utente ibrida n. 1: errore Datastore

Messaggio di errore dell'interfaccia utente ibrida n. 2: Errore interno del server

Output comando kubectl

Messaggi di errore dei log dei componenti

Informazioni sull'errore Nessun pod di runtime attivo

Cause possibili

Causa: i pod Cassandra non sono attivi

Diagnosi

Risoluzione

Causa: replica Cassandra configurata con un solo pod

Diagnosi

Risoluzione

Deve raccogliere informazioni diagnostiche

Riferimenti

Deployment di proxy API non riusciti con avviso Nessun pod di runtime attivo