透過 Gemini Cloud Assist 加速診斷

即使使用標準工具,解決複雜的 Google Kubernetes Engine (GKE) 問題也可能很耗時。解讀難以理解的錯誤訊息,或找出記錄和指標中的細微模式,通常需要深厚的專業知識。

請參閱本頁內容,瞭解 Gemini Cloud Assist 如何分析錯誤訊息、建議解決方案及執行自動調查,協助您更快找出根本原因,進而加速診斷複雜問題。

這項資訊對平台管理員和營運人員來說非常重要,有助於快速瞭解及解決叢集或節點層級的問題;對應用程式開發人員來說,則有助於偵錯應用程式錯誤及解讀複雜的堆疊追蹤;對安全防護專家來說,則有助於運用 AI 輔助分析,找出潛在的安全相關異常或錯誤設定。如要進一步瞭解我們在 Google Cloud 內容中提及的常見角色和範例工作,請參閱「常見的 GKE 使用者角色和工作」。

存取 Gemini Cloud Assist

如要存取 Gemini Cloud Assist,請完成下列步驟:

  1. 前往 Google Cloud 控制台的任何頁面。
  2. 在 Google Cloud 控制台工具列,點選「spark」「開啟或關閉 Gemini Cloud Assist 對話」

    「Cloud Assist」面板隨即開啟。如果系統顯示範例提示,您可以點選,也可以在「輸入提示」欄位中輸入提示。

探索範例提示

如要瞭解 Gemini Cloud Assist 如何提供協助,請參考下列提示範例:

主題 情境 提示範例 Gemini Cloud Assist 的用途
錯誤訊息令人困惑 Pod 處於 CrashLoopBackoff 狀態,但錯誤訊息難以理解。 這個 GKE Pod 錯誤代表什麼意義?常見原因為何?panic: runtime error: invalid memory address or nil pointer dereference Gemini Cloud Assist 會分析訊息,並以清楚的用語說明。並提供可能的原因和解決方法。
效能問題 您的團隊發現應用程式在 GKE 中執行時延遲時間過長。 我在 prod GKE 叢集中的 api-gateway 服務延遲時間偏長,我應該先檢查哪些指標?您能否提供一些常見的 GKE 相關原因? Gemini Cloud Assist 會建議要檢查的重要指標、探討潛在問題 (例如資源限制或網路壅塞),並推薦可進一步調查的工具和技術。
節點問題 GKE 節點的狀態為 NotReady,且無法變更。 其中一個 GKE 節點 (node-xyz) 顯示 NotReady 狀態。排解這類問題的常見步驟有哪些? Gemini Cloud Assist 會提供逐步調查計畫,說明節點自動修復等概念,並建議相關的 kubectl 指令。
瞭解 GKE 您不確定特定 GKE 功能或最佳做法的實作方式。 如何確保 GKE 叢集安全無虞?如何取得更多相關資訊? Gemini Cloud Assist 會清楚說明 GKE 最佳做法。按一下「顯示相關內容」,即可查看官方說明文件的連結。

詳情請參閱下列資源:

使用 Gemini Cloud Assist 調查

除了互動式對話,Gemini Cloud Assist 還能透過 Gemini Cloud Assist 調查執行更深入的自動分析。這項功能直接整合至 Logs Explorer 等 Workflows,是強大的根本原因分析工具。

從錯誤或特定資源啟動調查時,Gemini Cloud Assist 會分析記錄、設定和指標。並根據這些資料,產生可能根本原因的排序觀察結果和假設,然後提供建議的後續步驟。如果您有支援方案,也可以將調查結果轉移至 Google Cloud 客服案件,提供更多背景資訊,有助於加快案件解決速度。

後續步驟