Questo documento descrive come configurare la tua implementazione di Google Kubernetes Engine in modo da poter utilizzare Google Cloud Managed Service per Prometheus per raccogliere metriche da Apache Airflow. Questo documento mostra come eseguire le seguenti operazioni:
- Configurare Airflow per segnalare le metriche.
- Accedere a una dashboard predefinita in Cloud Monitoring per visualizzare le metriche.
- Configurare le regole di avviso per monitorare le metriche.
Queste istruzioni si applicano solo se utilizzi la raccolta gestita con Managed Service per Prometheus. Se utilizzi la raccolta auto-implementata, consulta la documentazione di Airflow per informazioni sull'installazione.
Queste istruzioni sono fornite a titolo di esempio e dovrebbero funzionare nella maggior parte degli ambienti Kubernetes. Se hai difficoltà a installare un'applicazione o un esportatore a causa di politiche di sicurezza o organizzative restrittive, ti consigliamo di consultare la documentazione open source per ricevere assistenza.
Per informazioni su Apache Airflow, consulta Airflow.
Prerequisiti
Per raccogliere le metriche da StatsD utilizzando Managed Service per Prometheus e la raccolta gestita, la tua implementazione deve soddisfare i seguenti requisiti:
- Il cluster deve eseguire Google Kubernetes Engine versione 1.28.15-gke.2475000 o successive.
- Devi eseguire Managed Service per Prometheus con la raccolta gestita abilitata. Per maggiori informazioni, consulta la guida introduttiva alla raccolta gestita.
Per verificare che StatsD stia emettendo metriche sugli endpoint previsti, procedere come segue:
- Configura l'inoltro della porta utilizzando il seguente comando:
kubectl -n NAMESPACE_NAME port-forward deploy/AIRFLOW_RELEASE_NAME-statsd 9102
- Accedi all'endpoint
localhost:9102/metricsutilizzando il browser o l'utilitàcurlin un'altra sessione del terminale.
Definisci una risorsa PodMonitoring
Per l'individuazione dei target, l'operatore Managed Service per Prometheus richiede una risorsa PodMonitoring che corrisponda a StatsD nello stesso spazio dei nomi.
Puoi utilizzare la seguente configurazione PodMonitoring:
Assicurati che i valori dei campiport e matchLabels corrispondano a quelli dei pod StatsD che vuoi monitorare.
Le etichette e i valori mostrati qui sono impostati per impostazione predefinita quando Airflow è
implementato con Helm.
Per applicare le modifiche alla configurazione da un file locale, esegui il seguente comando:
kubectl apply -n NAMESPACE_NAME -f FILE_NAME
Puoi anche utilizzare Terraform per gestire le configurazioni.
Definisci regole e avvisi
Puoi utilizzare la seguente configurazione Rules per definire gli avvisi sulle metriche di Airflow:
Per applicare le modifiche alla configurazione da un file locale, esegui il seguente comando:
kubectl apply -n NAMESPACE_NAME -f FILE_NAME
Puoi anche utilizzare Terraform per gestire le configurazioni.
Per maggiori informazioni sull'applicazione delle regole al cluster, consulta Valutazione e avvisi delle regole gestite.
Puoi modificare le soglie di avviso in base alla tua applicazione.Verificare la configurazione
Puoi utilizzare Metrics Explorer per verificare di aver configurato correttamente StatsD. Cloud Monitoring potrebbe richiedere uno o due minuti per importare le metriche.
Per verificare che le metriche siano state importate:
-
Nella Google Cloud console, vai alla leaderboard Esplora metriche pagina:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
- Nella barra degli strumenti del riquadro del generatore di query, seleziona il pulsante il cui nome è code PromQL.
- Inserisci ed esegui la seguente query:
up{job="airflow", cluster="CLUSTER_NAME", namespace="NAMESPACE_NAME"}
Visualizza dashboard
L'integrazione di Cloud Monitoring include la dashboard Panoramica di Airflow Prometheus. Le dashboard vengono installate automaticamente quando configuri l'integrazione. Puoi anche visualizzare le anteprime statiche delle dashboard senza installare l'integrazione.
Per visualizzare una dashboard installata:
-
Nella Google Cloud console, vai alla pagina Dashboard:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
- Seleziona la scheda Elenco dashboard.
- Scegli la categoria Integrazioni.
- Fai clic sul nome della dashboard, ad esempio Panoramica di Airflow Prometheus.
Per visualizzare un'anteprima statica della dashboard:
-
Nella Google Cloud console, vai alla
pagina Integrazioni:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
- Fai clic sul filtro della piattaforma di deployment Kubernetes Engine.
- Individua l'integrazione di Apache Airflow e fai clic su Visualizza dettagli.
- Seleziona la scheda Dashboard.
Risoluzione dei problemi
Per informazioni sulla risoluzione dei problemi di importazione delle metriche, consulta Problemi con la raccolta dagli esportatori in Risoluzione dei problemi lato importazione.