運用 AI 輔助工具排解資料庫負載過高的疑難問題

本文說明如何使用 Cloud SQL 的 AI 輔助功能,排解 Cloud SQL 資料庫負載過高的問題。您可以使用 Cloud SQL 和 Gemini Cloud Assist 的 AI 輔助功能,調查及分析查詢,取得建議,最後實作這些建議,在 Cloud SQL 中最佳化查詢。

透過 Google Cloud 控制台存取「查詢洞察」資訊主頁,即可分析資料庫,並在系統的資料庫負載高於平均值時排解事件問題。Cloud SQL 會使用所選時間範圍前 24 小時的資料,計算資料庫的預期負載。您可以調查載入事件增加的原因,並分析成效降低的證據。最後,Cloud SQL 會提供資料庫最佳化建議,協助您提升效能。

事前準備

如要透過 AI 輔助排解資料庫負載過高的問題,請按照下列步驟操作:

  1. 透過 AI 輔助的疑難排解機制查看限制
  2. 啟用 AI 輔助的疑難排解機制。 這個步驟包括啟用 Gemini Cloud Assist。

必要角色和權限

如要瞭解使用 AI 輔助功能排解資料庫負載過高問題所需的角色和權限,請參閱「使用 AI 觀察及排解問題」。

如要使用 Gemini Cloud Assist,您需要 Gemini Cloud Assist 調查擁有者 (roles/geminicloudassist.investigationOwner) IAM 角色。詳情請參閱「排解 Gemini Cloud Assist 調查功能的問題」。

使用 AI 輔助功能

如要使用 AI 輔助功能排解資料庫負載過高的問題,請前往 Google Cloud 控制台的「執行個體總覽」頁面或「查詢洞察」資訊主頁。

執行個體總覽頁面

在「執行個體總覽」頁面中,按照下列步驟使用 AI 輔助功能排解資料庫負載過高的問題:

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 在「總覽」頁面的「圖表」選單中,選取資料庫的指標。您可以選取任何指標,例如「CPU 使用率」
  4. 選用:如要選取特定分析時間範圍,請使用「時間範圍」篩選器,選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。

    您可以放大圖表的特定部分,分析您發現負載較高的區域。舉例來說,高負載區域可能會顯示接近 100% 的 CPU 使用率。如要放大,請點選並選取圖表的一部分。

    按一下「Investigate performance」按鈕,透過 Gemini Cloud Assist 的 AI 輔助功能,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

查詢洞察資訊主頁

在「查詢洞察」資訊主頁中,按照下列步驟使用 AI 輔助功能,排解資料庫負載過高的問題:

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 按一下「查詢洞察」開啟「查詢洞察」資訊主頁。
  4. 選用:使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
  5. 您可以放大圖表的特定部分,找出查詢執行時間較長,導致資料庫負載較高的區域。如要放大,請點選並選取圖表的一部分。

    在「資料庫負載圖表」中,按一下「調查效能」按鈕,透過 Gemini Cloud Assist 的 AI 輔助功能,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

分析資料庫負載偏高的情況

您可以運用 AI 輔助功能,分析及排解資料庫負載的詳細資料。

資料分析時間範圍

Cloud SQL 會分析您在「查詢洞察」資訊主頁或「執行個體總覽」頁面中,於資料庫負載圖表選取的時段。如果選取的時間範圍少於 24 小時,Cloud SQL 會分析整個時間範圍。如果您選取的時間範圍超過 24 小時,Cloud SQL 只會選取最後 24 小時的時間範圍進行分析。

為計算資料庫的基準效能分析,Cloud SQL 會在分析時間範圍內納入 24 小時的基準時間範圍。如果所選時間範圍不是星期一,Cloud SQL 會使用所選時間範圍前 24 小時做為基準時間範圍。如果所選時間範圍是星期一,Cloud SQL 會使用所選時間範圍前 7 天做為基準時間範圍。

指標分析

Cloud SQL 開始分析時,會檢查各種指標的重大變化,包括但不限於下列指標:

  • 每秒查詢次數 (QPS)
  • CPU
  • 記憶體
  • 磁碟 I/O

Cloud SQL 會比較分析時間範圍內資料庫的基準匯總資料。如果 Cloud SQL 偵測到重要指標的閾值出現重大變化,Cloud SQL 就會指出資料庫可能發生問題。所識別的情況可能說明在所選時間範圍內,資料庫負載過高的根本原因。

建議

Gemini Cloud Assist 完成分析後,「調查詳細資料」窗格的「假設」部分會列出可執行的洞察資料,協助修正問題。

在某些情況下,根據分析結果,系統可能不會提供建議。

如要繼續排解問題或取得系統效能方面的更多協助,也可以開啟 Gemini Cloud Assist

後續步驟