查看服務健康狀態和事件

如果 Google Kubernetes Engine (GKE) 叢集或應用程式發生問題,請務必快速判斷原因是否為內部問題,或是與更廣泛的Google Cloud 服務中斷有關。如果根本原因是已知的平台事件,花時間在本機偵錯效率不彰。

如果 GKE 叢集發生問題,請參閱本頁內容,判斷是否為 Google Cloud 服務中斷所致。如要瞭解如何從下列來源取得官方狀態更新、個人健康事件和服務事件深入分析資訊,請參閱:

  • Google Cloud 服務健康狀態:依區域顯示 Google Cloud服務的狀態資訊。
  • Personalized Service Health:與專案相關的服務中斷情形。
  • 服務事件深入分析和建議:受進行中服務事件影響的 GKE 叢集。

平台管理員和營運人員,以及負責疑難排解的應用程式開發人員,都需要這項資訊來判斷觀察到的問題是否與更廣泛的 Google Cloud 服務健康狀態事件有關。如要進一步瞭解Google Cloud 內容中提及的常見角色和範例工作,請參閱「常見的 GKE 使用者角色和工作」。

查看 Google Cloud 服務健康狀態

Google Cloud 服務健康狀態」頁面提供「 Google Cloud」服務的狀態資訊。

如要查看與 GKE 相關的事件,請前往「Google Cloud Service Health」(服務健康狀態) 頁面。

查看所有 Google Kubernetes Engine 相關事件

查看 Personalized Service Health

Personalized Service Health 可協助找出與專案相關的Google Cloud 服務中斷情形。這些中斷情形稱為「服務健康狀態事件」,相關資訊會顯示在 Google Cloud 控制台和各個整合點

如要查看與專案相關的 GKE 事件,請在 Google Cloud 控制台的 Personalized Service Health 資訊主頁中,查看服務健康狀態事件。

前往 Personalized Service Health

您可以依服務、地點、關聯性和狀態篩選事件。資訊主頁也會提供事件詳細資料,例如影響範圍、徵狀、解決方法和解決進度更新。如要開始使用,請參閱「快速入門導覽課程:在Google Cloud 控制台中查看服務健康狀態事件」。

查看服務事件深入分析和建議

服務事件洞察和建議可協助您找出受進行中服務事件影響的 GKE 叢集。

如要取得服務事件深入分析資料,請查看 GKE_RELIABILITY_INCIDENT 子類型的深入分析資料和建議。您可以使用 Google Cloud 控制台、Google Cloud CLI 或 Recommender API 取得深入分析結果。詳情請參閱「查看洞察資料和建議」。

深入分析和最佳化建議包含下列資訊:

  • 受影響的叢集:受事件影響的叢集。
  • 事件名稱:與 Cloud 客服團隊聯絡時,可參考的事件 ID。
  • 事件說明:事件應變團隊提供的事件資訊。
  • 上次生效時間:上次更新事件資訊的時間。
  • 緩解措施:事件應變團隊建議的緩解措施 (如有)。

服務事件洞察資訊會持續顯示,直到事件應變團隊減輕事件影響,並判斷洞察資訊不再相關為止。 Google Cloud 事件緩解後,系統不會立即移除洞察資訊,而是會過一段時間才移除,因此您的資源不會再受到影響。如果您已採用解決方法,且不想再看到洞察資訊,可以將其關閉。

後續步驟