您可以將 Google Kubernetes Engine (GKE) 上的工作負載設定為將應用程式效能指標傳送至 Cloud Monitoring。然後使用這些指標偵測應用程式的效能回歸。Google Kubernetes Engine 提供下列工作負載效能指標的視覺化資料:
- 要求:顯示每秒要求率,並在適用時依作業分組。
- 錯誤:顯示錯誤率,並依作業和回應代碼分組。
- 延遲時間:顯示各項作業的第 50 和第 95 個百分位數回應延遲時間。
- CPU 和記憶體:顯示 CPU 和記憶體的使用率,以要求量的百分比表示。
這些指標對應於 Google《網站穩定性工程》一書中建議的黃金訊號,用於監控分散式系統。
您也可以查看及探索工作負載的記錄。
如要使用應用程式效能指標,應用程式必須能將指標傳送至 Cloud Monitoring。如要瞭解建議做法,請參閱「收集應用程式效能指標」一文。
收集應用程式效能指標
您可以使用下列支援的整合服務,收集 Google Kubernetes Engine 的應用程式效能指標:
- Cloud Service Mesh:如果您使用 Cloud Service Mesh,系統會自動收集應用程式效能指標。
- Istio:如果您使用開放原始碼 Istio,建議您使用 Google Cloud Managed Service for Prometheus 收集指標。
- GKE Ingress:設定適用於應用程式負載平衡器的 GKE Ingress 時,系統會自動收集 HTTP/S 負載平衡器的效能指標,這些負載平衡器會將流量轉送至 GKE Ingress 後方的 GKE 服務和部署資源。
- NGINX Ingress:如果您使用 NGINX Ingress,建議您使用 Google Cloud Managed Service for Prometheus 收集指標。
- Prometheus HTTP 和 gRPC 指標:如果您的應用程式公開 Prometheus HTTP 或 gRPC 指標,建議您按照 HTTP 伺服器和 gRPC 伺服器文件,使用 Google Cloud Managed Service for Prometheus 收集指標。
查看應用程式效能指標
設定應用程式效能指標的收集作業,並執行會產生流量的工作負載後,即可分析效能資料。然後您可以在應用程式資訊主頁上查看部署作業的指標。
如果資訊主頁未顯示任何可用資料,請確認您已設定收集資料,並執行工作負載來產生流量。如果沒有產生任何指標資料,資訊主頁就不會顯示任何內容。