透過 AI 輔助監控及排解問題

中查看調查結果。

本文說明如何使用 AI 輔助功能,監控及排解 AlloyDB for PostgreSQL 資源的問題。您可以運用 AlloyDB 的 AI 輔助疑難排解工具和 Gemini Cloud Assist排解查詢速度緩慢的問題,以及排解資料庫負載過高的問題

限制

AlloyDB 的 AI 輔助疑難排解功能有以下限制:

  • AI 輔助疑難排解功能會根據標準 PostgreSQL 設定提供實用洞察資訊。AlloyDB 的獨特架構 (包括分離式儲存空間、快取、資料欄引擎和最佳化背景程序),表示特定檢查和建議可能與實際的 AlloyDB 效能指標不同。建議您將 AI 輔助的疑難排解建議做為起點,並參閱 AlloyDB 說明文件,取得明確的指引。
  • 下列 AlloyDB 設定不支援 AI 輔助疑難排解:

事前準備

確認您已為使用者帳戶和專案設定 Gemini Cloud Assist。 Google Cloud

設定 Gemini Cloud Assist 後,您可能需要等待五分鐘,讓服務傳播,才能在 AlloyDB 中啟用 AI 輔助疑難排解功能。

必要角色和權限

如要取得使用 AI 輔助疑難排解功能所需的權限,請要求系統管理員在代管 AlloyDB 執行個體的專案中,授予下列 IAM 角色:

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

這些預先定義的角色具備使用 AI 輔助疑難排解工具所需的權限。如要查看確切的必要權限,請展開「Required permissions」(必要權限) 部分:

所需權限

如要使用 AI 輔助疑難排解功能,必須具備下列權限:

  • databaseinsights.performanceIssues.detect
  • databaseinsights.performanceIssues.investigate

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

如要進一步瞭解使用 Gemini Cloud Assist 調查功能時所需的角色和權限,請參閱「排解 Gemini Cloud Assist 調查功能的問題」。

啟用 AI 輔助疑難排解功能

為 AlloyDB 執行個體啟用 AI 輔助疑難排解功能後,AlloyDB 就能分析資料庫效能,並偵測查詢執行時的異常狀況。AlloyDB 偵測到查詢效能異常或系統負載過高時,AI 輔助疑難排解功能會協助您根據證據分析情況,並提出建議。

如要為 AlloyDB 執行個體啟用 AI 輔助疑難排解功能,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。

    前往「Clusters」(叢集) 頁面

  2. 在叢集和執行個體清單中,按一下執行個體。

  3. 按一下「查詢洞察」

  4. 按一下「啟用」或「編輯設定」

  5. 在「編輯查詢洞察設定」分頁中,選取「啟用 AlloyDB 適用的進階查詢洞察功能」核取方塊。

    根據預設,系統會勾選「AI 輔助的疑難排解機制」核取方塊。

  6. 按一下 [儲存]

  7. 為獲得最佳結果,請在 Google Cloud 控制台中啟用 AI 輔助疑難排解功能,並等待 24 小時,讓 AlloyDB 建立執行個體、資料庫和查詢平均效能的基準。

如要進一步瞭解如何啟用進階查詢洞察功能,請參閱「使用進階查詢洞察功能提高查詢效能」。

開啟 Gemini Cloud Assist

如要搭配使用 Gemini Cloud Assist 與 AlloyDB,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 在叢集和執行個體清單中,按一下執行個體。
  4. 按一下「查詢洞察」
  5. 如要開啟 Cloud Assist 面板,請點選「開啟或關閉 Gemini Cloud Assist 對話」
  6. Cloud Assist 面板中輸入提示,說明您感興趣的資訊。
  7. 輸入提示後,按一下「傳送提示」圖示 。Gemini 會根據過去一小時的資訊,回覆您輸入的提示。

排解查詢速度緩慢的問題

如要使用 AI 輔助功能排解查詢緩慢的問題,請前往 Google Cloud 控制台,在 AlloyDB 執行個體的查詢洞察資訊主頁中操作。

熱門查詢表格

您可以在「查詢洞察」資訊主頁的「熱門查詢資料表」部分,使用 AI 輔助功能開始排解查詢速度緩慢的問題。

AlloyDB 可協助您找出在特定偵測時間範圍內,執行速度低於平均值的查詢。在「查詢洞察」資訊主頁中選取時間範圍後,AlloyDB 會使用所選時間範圍結束前 24 小時的偵測時間週期,檢查是否有任何查詢的執行速度低於平均值。

調整「資料庫負載」圖表的時間範圍篩選器,或任何其他篩選器 (例如資料庫或使用者) 時,AlloyDB 會重新整理「熱門查詢」表格,並根據新的查詢清單和更新的偵測時間範圍,重新執行異常偵測。

AlloyDB 偵測到異常狀況時:

  • AlloyDB 會對查詢執行基準效能分析。

  • 表格中列出的每項查詢,在查詢的「平均執行時間 (毫秒)」值旁,都會顯示「調查」 圖示或「警告」warning_spark 圖示。

如果查詢的執行速度比預期慢,系統會顯示「警告」warning_spark 圖示。點按任一圖示後,系統會使用 Gemini Cloud Assist 協助分析查詢執行作業,並提供可能導致任何問題的觀察結果。根據這些觀察結果,Gemini Cloud Assist 會生成假設,協助您解決問題。

如要排解「查詢洞察」資訊主頁「熱門查詢」表格中的緩慢查詢,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 在叢集和執行個體清單中,按一下執行個體。
  4. 按一下「查詢洞察」
  5. 在「已執行的查詢」圖表中,使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
  6. 在「熱門查詢」表格的「查詢」分頁下方,查看資料庫的查詢清單。
  7. 如果查詢的「平均執行時間 (毫秒)」值旁邊顯示「警告」warning_spark圖示,表示 AlloyDB 偵測到查詢效能異常。AlloyDB 會在所選時間範圍結束前的 24 小時內,檢查是否有異常狀況。
  8. 按一下「警告」warning_spark 圖示。
  9. 在「查詢速度比平常慢」對話方塊中,按一下「New Investigation」,開始使用 Gemini Cloud Assist 的 AI 輔助功能進行疑難排解。 大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:
    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。
  10. 如要查看與查詢相關的所有調查,請在「查詢速度比平常慢」對話方塊中,按一下「查看所有調查」。 系統會開啟「Gemini Cloud Assist」頁面,您可以在這裡查看目前正在進行和先前完成的所有調查。您可以依專案或標籤篩選頁面,例如找出所需的特定調查。

    或者,如要查看所有先前的調查,請按一下「通知」 圖示,然後選取與任何調查相關聯的通知,開啟「Gemini Cloud Assist」頁面。

  11. 或者,如要調查任何查詢的延遲時間,請完成下列步驟:
    1. 找出要調查的特定查詢。
    2. 在「動作」欄中,按一下與該查詢相關聯的「動作」 圖示。
    3. 在選單中選取「Investigate latency」(調查延遲),即可執行 Gemini Cloud Assist 調查。

查詢詳細資料

您也可以在「查詢詳細資料」頁面中,透過 AI 輔助排解查詢速度緩慢的問題。

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 在叢集和執行個體清單中,按一下執行個體。
  4. 按一下「查詢洞察」開啟「查詢洞察」資訊主頁。
  5. 在「查詢洞察」資訊主頁中,按一下「熱門查詢」中要查看的查詢。「查詢詳細資料」頁面隨即顯示。
  6. 選用:使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。調整「查詢詳細資料」頁面的「時間範圍篩選器」後,AlloyDB 會重新執行異常偵測。
  7. 如果 AlloyDB 未偵測到查詢的異常狀況,您仍可點選「查詢延遲」資訊卡中的「調查」按鈕,對查詢執行分析。

分析查詢延遲

您可以透過 AI 輔助功能,分析及排解查詢延遲的詳細資料。

資料分析時間範圍

分析時間範圍為您在「查詢洞察」資訊主頁的「資料庫負載」圖表或「查詢詳細資料」頁面中選取的時間範圍結束前 24 小時。AlloyDB 會使用這段時間,比較基準指標與異常狀況時間範圍內擷取的指標。

在「查詢詳細資料」頁面中,如果 AlloyDB 偵測到查詢異常,當您從「查詢洞察」資訊主頁選取查詢後,AlloyDB 會使用異常結束後的 24 小時,對查詢執行基準效能分析。如果 AlloyDB 尚未偵測到查詢異常狀況,並再次對查詢執行異常偵測,則 AlloyDB 會使用所選日期範圍結束前 48 小時的資料,做為分析時間範圍的效能基準。

偵測到異常狀況的期間

偵測到異常狀況的期間是指 AlloyDB 發現查詢效能出現異常變化的時間範圍。AlloyDB 會使用在分析時間範圍內測得的查詢基準效能。

如果 AlloyDB 在所選時間範圍內偵測到查詢的多個異常狀況,則會使用最後偵測到的異常狀況。

查詢效能提示範例

您也可以使用 Gemini Cloud Assist 輸入提示,協助提升查詢效能。Gemini Cloud Assist 會回答所選 AlloyDB 執行個體和資料庫的問題。

提示詞 回覆類型
資料庫中延遲時間最長的查詢為何?
  • 依延遲時間排序的查詢摘要。 Gemini 會根據您在查詢洞察資料庫負載圖表中選取的時間範圍篩選器,縮小回覆範圍。
  • 如何依延遲時間找出及排序查詢。
這個資料庫執行個體中最慢的查詢是什麼? 瞭解如何依延遲時間找出最慢的查詢。

排解資料庫負載過高的問題

在 Google Cloud 控制台中存取「查詢洞察」資訊主頁,即可分析資料庫,並在系統的資料庫負載高於平均值時排解事件問題。AlloyDB 會使用所選時間範圍前 24 小時的資料,計算資料庫的預期負載。您可以調查載入事件次數增加的原因,並分析成效降低的證據。AlloyDB 也會提供資料庫最佳化建議,協助您提升效能。

如要使用 AI 輔助功能排解資料庫負載過高的問題,請前往 Google Cloud 控制台的「執行個體總覽」頁面或「查詢洞察」資訊主頁。

執行個體總覽頁面

如要運用 AI 輔助功能排解資料庫負載過高的問題,請按照下列步驟前往「執行個體總覽」頁面:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 在叢集和執行個體清單中,按一下執行個體。
  4. 在「總覽」頁面中,從「圖表」選單選取資料庫的指標。您可以選取任何指標,例如「CPU 使用率」
  5. 選用:如要選取特定分析時間範圍,請使用「時間範圍」篩選器,選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。

    您可以放大圖表的特定部分,分析您發現負載較高的區域。舉例來說,高負載區域可能會顯示接近 100% 的 CPU 使用率。如要放大,請點選並選取圖表的一部分。

    按一下「調查效能」按鈕,即可在 Gemini Cloud Assist 的 AI 輔助下,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

查詢洞察資訊主頁

在「查詢洞察」資訊主頁中,按照下列步驟使用 AI 輔助功能,排解資料庫負載過高的問題:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 在叢集和執行個體清單中,按一下執行個體。
  4. 按一下「查詢洞察」開啟「查詢洞察」資訊主頁。
  5. 選用:使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
  6. 您可以放大圖表的特定區段,找出查詢執行時間較長,導致資料庫負載較高的區域。如要放大,請點選並選取圖表的一部分。

    在「資料庫負載圖表」中,按一下「調查效能」按鈕,透過 Gemini Cloud Assist 的 AI 輔助功能,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,並顯示下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

分析資料庫負載過高的情況

您可以運用 AI 輔助功能,分析及排解資料庫負載的詳細資料。

資料分析時間範圍

AlloyDB 會分析您在「查詢洞察」資訊主頁或「執行個體總覽」頁面中,於資料庫負載圖表選取的時間範圍。如果選取的時間範圍少於 24 小時,AlloyDB 會分析整個時間範圍。如果選取的時間範圍超過 24 小時,AlloyDB 只會選取時間範圍的最後 24 小時進行分析。

為計算資料庫的基準效能分析,AlloyDB 會在分析時間範圍內納入 24 小時的基準時間範圍。如果選取的時段不是星期一,AlloyDB 會使用選取時段前 24 小時做為基準時段。如果所選時間範圍是星期一,AlloyDB 會使用前 7 天做為基準時間範圍。

指標分析

AlloyDB 開始分析時,會檢查各種指標的重大變化,包括但不限於下列項目:

  • 每秒查詢次數 (QPS)
  • CPU
  • 記憶體
  • 磁碟 I/O

AlloyDB 會比較分析時間範圍內資料庫的基準匯總資料,以及分析時間範圍內的成效資料。如果 AlloyDB 偵測到重要指標的門檻出現重大變化,就會指出資料庫可能發生問題。所識別的情況可能說明在所選時間範圍內,資料庫負載過高的根本原因。

建議

Gemini Cloud Assist 完成分析後,「調查詳細資料」窗格的「假設」部分會列出可執行的洞察資料,協助修正問題。

在某些情況下,根據分析結果,系統可能不會提供建議。

系統效能提示範例

您也可以使用 Gemini Cloud Assist 輸入提示,收集系統效能相關資訊。Gemini Cloud Assist 會回答所選 AlloyDB 執行個體的問題。

提示詞 回覆類型
過去 7 天內,這個資料庫執行個體有多少錯誤記錄檔項目? 依嚴重性類型分組的記錄項目摘要。 Gemini 會根據執行個體成效圖表中選取的時間範圍篩選條件,縮小回覆範圍。
今天下午 2 點左右,這個資料庫執行個體的 CPU 使用率是多少? 時間間隔內的 CPU 使用率百分比範圍指標結果。

取得索引建議

您可以在查詢洞察中取得 AlloyDB 的索引建議。 詳情請參閱「索引建議工具總覽」。

索引建議提示範例

使用 Gemini Cloud Assist 進一步瞭解如何在資料庫中使用索引。Gemini Cloud Assist 會回答所選 AlloyDB 執行個體的問題。

提示詞 回覆類型
顯示過去 7 天內執行的查詢索引建議。 索引可提升哪些類型的查詢效率。

監控執行中的查詢

使用「查詢洞察」資訊主頁監控執行中的查詢,並視需要終止長時間執行的程序。詳情請參閱「監控進行中的查詢」。

執行中查詢提示範例

使用 Gemini Cloud Assist 進一步瞭解導致延遲或 CPU 負載偏高的查詢。Gemini Cloud Assist 會回答所選 AlloyDB 執行個體的問題。

提示詞 回覆類型
目前資料庫中執行的熱門查詢有哪些? 瞭解如何找出執行時間最長和最耗用資源的查詢。

排解唯讀備用資源延遲問題

您可以使用 Gemini Cloud Assist 或 Google Cloud 控制台的「總覽」資訊主頁,分析複寫延遲。

AI 輔助功能會評估下列因素,判斷讀取副本落後主要執行個體的原因。

  • 主要執行個體寫入量

    如果主要執行個體的資料修改率很高,產生的 WAL 記錄速度可能會比副本重播的速度快。Gemini 會檢查與延遲尖峰相關的「突發」寫入模式。

  • 資源限制 (CPU/記憶體)

    複製重播是耗用大量 CPU 的程序。Gemini 會分析備用資源的機器層級是否不足以處理目前的重播負載,或並行讀取查詢是否會耗盡重播程序資源。

  • 網路和儲存空間效能

    在跨區域部署中,網路輸送量可能會影響記錄傳送至副本的速度。AI 會評估內部作業中繼資料,判斷瓶頸是否在於記錄的傳輸或應用。

調查唯讀副本延遲問題

如要使用 AI 輔助功能排解唯讀副本延遲問題,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 前往「系統深入分析」。在「執行個體」選單中,選取唯讀副本。
  4. 在「Resolve database issues with AI-assisted troubleshooting」(運用 AI 疑難排解功能,解決資料庫問題) 窗格中,按一下「Explore investigations」(探索調查)
  5. 在「調查選項」視窗中,找到「唯讀副本延遲」部分。
  6. 選用:使用「時間範圍」篩選器選取特定分析時間範圍,包括 1 小時、6 小時、1 天、7 天或自訂範圍。
  7. 按一下「調查」

    Gemini 會啟動複寫專屬信號的分析作業,包括 WAL (預先寫入記錄) 生成率和副本重播速度。 分析完成後,「調查詳細資料」窗格會顯示下列部分:

    • 問題:延遲時間摘要,以及主要執行個體與副本之間的目前「位元組延遲」或「轉換時間差」。
    • 觀察結果:特定指標,例如副本上的 CPU 使用率偏高,或 WAL 重播期間發生鎖定爭用。
    • 假設:AI 建議的步驟,例如最佳化主要項目上的大量寫入交易,或升級副本機器層級。

唯讀副本延遲提示範例

您也可以使用 Gemini Cloud Assist 和自然語言查詢,排解唯讀副本與主要執行個體之間的延遲問題。

提示詞 回覆類型
為什麼我的 AlloyDB 唯讀副本延遲時間這麼長? 說明如何調整資料庫或設定叢集,以縮短副本延遲時間。

後續步驟