運用 AI 輔助工具排解資料庫負載過高的疑難問題

本文說明如何在 AlloyDB for PostgreSQL 中使用 AI 輔助功能,排解 AlloyDB 資料庫負載過高的問題。您可以運用 AlloyDB 和 Gemini Cloud Assist 的 AI 輔助功能進行調查、分析、取得建議,並最終實作這些建議,以最佳化 AlloyDB 中的查詢。

透過 Google Cloud 控制台存取「查詢洞察」資訊主頁,即可分析資料庫,並在系統的資料庫負載高於平均值時排解事件問題。AlloyDB 會使用所選時間範圍前 24 小時的資料,計算資料庫的預期負載。您可以調查載入事件增加的原因,並分析成效降低的證據。最後,AlloyDB 會提供資料庫最佳化建議,協助您提升效能。

事前準備

如要透過 AI 輔助排解資料庫負載過高的問題,請按照下列步驟操作:

  1. 透過 AI 輔助的疑難排解機制查看限制
  2. 啟用 AI 輔助的疑難排解機制。 這個步驟包括啟用 Gemini Cloud Assist。

必要角色和權限

如要瞭解使用 AI 輔助功能排解資料庫負載過高問題所需的角色和權限,請參閱「使用 AI 監控及排解問題」。

如要使用 Gemini Cloud Assist,您需要 Gemini Cloud Assist 調查擁有者 (roles/geminicloudassist.investigationOwner) IAM 角色。詳情請參閱「排解 Gemini Cloud Assist 調查功能的問題」。

使用 AI 輔助功能

如要使用 AI 輔助功能排解資料庫負載過高的問題,請前往 Google Cloud 控制台的「執行個體總覽」頁面或「查詢洞察」資訊主頁。

執行個體總覽頁面

在「執行個體總覽」頁面中,按照下列步驟使用 AI 輔助功能,排解資料庫負載過高的問題:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 在叢集和執行個體清單中,按一下執行個體。
  4. 在「總覽」頁面的「圖表」選單中,選取資料庫的指標。您可以選取任何指標,例如「CPU 使用率」
  5. 選用:如要選取特定分析時間範圍,請使用「時間範圍」篩選器,選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。

    您可以放大圖表的特定部分,分析您發現負載較高的區域。舉例來說,高負載區域可能會顯示接近 100% 的 CPU 使用率。如要放大,請點選並選取圖表的一部分。

    按一下「Investigate performance」按鈕,透過 Gemini Cloud Assist 的 AI 輔助功能,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

查詢洞察資訊主頁

在「查詢洞察」資訊主頁中,按照下列步驟使用 AI 輔助功能,排解資料庫負載過高的問題:

  1. 前往 Google Cloud 控制台的「Clusters」(叢集) 頁面。
  2. 前往「Clusters」(叢集)
  3. 在叢集和執行個體清單中,按一下執行個體。
  4. 按一下「查詢洞察」開啟「查詢洞察」資訊主頁。
  5. 選用:使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
  6. 您可以放大圖表的特定部分,找出查詢執行時間較長,導致資料庫負載較高的區域。如要放大,請點選並選取圖表的一部分。

    在「資料庫負載圖表」中,按一下「調查效能」按鈕,透過 Gemini Cloud Assist 的 AI 輔助功能,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

分析資料庫負載偏高的情況

您可以運用 AI 輔助功能,分析及排解資料庫負載的詳細資料。

資料分析時間範圍

AlloyDB 會分析您在「查詢洞察」資訊主頁或「執行個體總覽」頁面中,於資料庫負載圖表選取的時間範圍。如果選取的時間範圍少於 24 小時,AlloyDB 會分析整個時間範圍。如果您選取的時間範圍超過 24 小時,AlloyDB 只會選取時間範圍的最後 24 小時進行分析。

為計算資料庫的基準效能分析,AlloyDB 會在分析時間範圍內納入 24 小時的基準時間範圍。如果選取的時段不是星期一,AlloyDB 會使用前 24 小時做為基準時段。如果所選時間範圍是星期一,AlloyDB 會使用前 7 天做為基準時間範圍。

指標分析

AlloyDB 開始分析時,會檢查各種指標的重大變化,包括但不限於下列項目:

  • 每秒查詢次數 (QPS)
  • CPU
  • 記憶體
  • 磁碟 I/O

AlloyDB 會比較分析時間範圍內的資料庫基準匯總資料和效能資料。如果 AlloyDB 偵測到重要指標的門檻出現重大變化,就會指出資料庫可能發生問題。所識別的情況可能說明在所選時間範圍內,資料庫負載過高的根本原因。

建議

Gemini Cloud Assist 完成分析後,「調查詳細資料」窗格的「假設」部分會列出可執行的洞察資料,協助修正問題。

在某些情況下,根據分析結果,系統可能不會提供建議。

如要繼續排解問題或取得系統效能方面的更多協助,也可以開啟 Gemini Cloud Assist。 詳情請參閱「使用 AI 輔助功能監控及排解問題」。

後續步驟