透過 AI 輔助功能監控及排解 Cloud SQL 問題

中查看調查結果。

本文說明如何使用 AI 輔助功能監控及排解 Cloud SQL 資源問題。您可以運用 Cloud SQL 的 AI 輔助疑難排解工具和 Gemini Cloud Assist排解查詢速度緩慢的問題,以及排解資料庫負載過高的問題

限制

Cloud SQL 的 AI 輔助疑難排解功能有以下限制:

事前準備

  1. 確認您已為使用者帳戶和專案設定 Gemini Cloud Assist。 Google Cloud

    設定 Gemini Cloud Assist 後,您可能需要等待五分鐘,讓服務傳播,才能在 Cloud SQL 中啟用 AI 輔助疑難排解功能。

  2. 確認執行個體是 Cloud SQL Enterprise Plus 版本執行個體。
  3. 確認 Cloud SQL 執行個體使用的是新網路架構
  4. 啟用 Cloud SQL Enterprise Plus 和 Cloud SQL Enterprise 版本的查詢洞察功能

必要角色和權限

如要取得使用 AI 輔助疑難排解所需的權限,請要求管理員在 Cloud SQL 執行個體所在的專案中,授予您下列 IAM 角色:

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

這些預先定義的角色具備使用 AI 輔助疑難排解工具所需的權限。如要查看確切的必要權限,請展開「Required permissions」(必要權限) 部分:

所需權限

如要使用 AI 輔助疑難排解功能,必須具備下列權限:

  • databaseinsights.performanceIssues.detect
  • databaseinsights.performanceIssues.investigate

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

如要進一步瞭解使用 Gemini Cloud Assist 調查功能時所需的角色和權限,請參閱「排解 Gemini Cloud Assist 調查功能的問題」。

啟用 AI 輔助疑難排解功能

為 Cloud SQL 執行個體啟用 AI 輔助疑難排解功能後,Cloud SQL 就能分析資料庫效能,並偵測查詢執行時的異常狀況。Cloud SQL 偵測到查詢效能異常或系統負載過高時,AI 輔助疑難排解功能會協助您透過證據來分析情況,並提出建議。

如要為 Cloud SQL 執行個體啟用 AI 輔助疑難排解功能,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 在「設定」方塊中,按一下「編輯設定」
  4. 在「自訂執行個體」部分,展開「查詢洞察」
    1. 如果尚未選取,請選取「啟用查詢洞察」
    2. 如果尚未選取「啟用 Enterprise Plus 功能」,請選取該選項 (僅適用於 Cloud SQL Enterprise Plus 版本)。
  5. 僅限 Cloud SQL Enterprise Plus 版本,選取「啟用 AI 輔助疑難排解」。如果是 Cloud SQL Enterprise 版執行個體,您必須啟用 Gemini Cloud Assist,才能透過 AI 輔助功能排解問題。
  6. 按一下「Save」(儲存)
  7. 如要獲得最佳結果,請在 Google Cloud 控制台中啟用 AI 輔助疑難排解功能後等待 24 小時,讓 Cloud SQL 建立執行個體、資料庫和查詢平均效能的基準。
  8. 如要進一步瞭解如何為 Cloud SQL Enterprise Plus 版本啟用查詢洞察,請參閱「使用查詢洞察提升查詢效能」。

開啟 Gemini Cloud Assist

如要將 Gemini Cloud Assist 與 Cloud SQL 搭配使用,請按照下列步驟操作:

  1. 如要開啟 Cloud Assist 面板,請點選「開啟或關閉 Gemini Cloud Assist 對話」
  2. Cloud Assist 面板中輸入提示,說明您感興趣的資訊。
  3. 輸入提示後,按一下「傳送提示」圖示 。Gemini 會根據過去一小時的資訊,回覆您輸入的提示。

排解查詢速度緩慢的問題

如要使用 AI 輔助功能排解慢速查詢問題,請前往 Google Cloud console 中 Cloud SQL 執行個體的「查詢洞察」資訊主頁。

熱門查詢表格

您可以在「查詢洞察」資訊主頁的「熱門查詢資料表」部分,使用 AI 輔助功能開始排解查詢速度緩慢的問題。

Cloud SQL 可協助您找出在特定偵測時間範圍內,執行速度低於平均值的查詢。在「查詢洞察」資訊主頁中選取時間範圍後,Cloud SQL 會使用所選時間範圍結束前 24 小時的偵測時間週期,檢查是否有任何查詢的執行速度低於平均值。

調整「資料庫負載」圖表的時間範圍篩選器,或任何其他篩選器 (例如資料庫或使用者) 時,Cloud SQL 會重新整理「熱門查詢」表格,並根據新的查詢清單和更新的偵測時間範圍,重新執行異常偵測。

如果 Cloud SQL Enterprise Plus 版執行個體偵測到異常狀況,會發生下列情況:

如果查詢的執行速度比預期慢,系統會顯示「警告」warning_spark 圖示。點按任一圖示後,系統會使用 Gemini Cloud Assist 協助分析查詢執行作業,並提供可能導致任何問題的觀察結果。根據這些觀察結果,Gemini Cloud Assist 會生成假設,協助您解決問題。

如要排解「查詢洞察」資訊主頁「熱門查詢」表格中的緩慢查詢,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 在 SQL 導覽選單中,按一下「查詢洞察」
  4. 在「已執行的查詢」圖表中,使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
  5. 在「熱門查詢」表格的「查詢」分頁下方,查看資料庫的查詢清單。
  6. 如果查詢的「平均執行時間 (毫秒)」值旁邊顯示「警告」warning_spark圖示,表示 Cloud SQL 偵測到查詢效能異常。Cloud SQL 會在所選時間範圍結束前 24 小時內,檢查是否有異常狀況。
  7. 按一下「警告」warning_spark 圖示。
  8. 在「查詢速度比平常慢」對話方塊中,按一下「New Investigation」,開始使用 Gemini Cloud Assist 的 AI 輔助功能進行疑難排解。 大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:
    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。
  9. 如要查看與查詢相關的所有調查,請在「查詢速度比平常慢」對話方塊中,按一下「查看所有調查」。 系統會開啟「Gemini Cloud Assist」頁面,您可以在這裡查看目前正在進行和先前完成的所有調查。您可以依專案或標籤篩選頁面,例如找出所需的特定調查。

    或者,如要查看所有先前的調查,請按一下「通知」 圖示,然後選取與任何調查相關聯的通知,開啟「Gemini Cloud Assist」頁面。

  10. 或者,如要調查任何查詢的延遲時間,請完成下列步驟:
    1. 找出要調查的特定查詢。
    2. 在「動作」欄中,按一下與該查詢相關聯的「動作」 圖示。
    3. 在選單中選取「Investigate latency」(調查延遲),即可執行 Gemini Cloud Assist 調查。

查詢詳細資料

您也可以在「查詢詳細資料」頁面中,透過 AI 輔助功能排解查詢速度緩慢的問題。

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 按一下「查詢洞察」開啟「查詢洞察」資訊主頁。
  4. 在「查詢洞察」資訊主頁中,按一下「熱門查詢」中要查看的查詢。「查詢詳細資料」頁面隨即顯示。
  5. 如果是 Cloud SQL Enterprise Plus 版,Cloud SQL 偵測到查詢異常狀況時,查詢詳細資料頁面會顯示一或多個下列指標:
    • 詳細資料畫面上的訊息顯示 This query is slower than usual ,以及「調查」選項。
    • 「查詢延遲時間」圖表中的訊息顯示 Query slower than usual。如果看到這則訊息,請點選「調查」按鈕,透過 Gemini Cloud Assist 的 AI 輔助功能開始排解問題。

      大約兩分鐘後,系統會開啟「調查詳細資料」窗格,並顯示下列部分:

      • 問題。調查問題的說明,包括調查的開始和停止時間。
      • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
      • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。
  6. 選用:使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。調整「查詢詳細資料」頁面的「時間範圍篩選條件」時,Cloud SQL 會重新執行異常偵測。
  7. 如果 Cloud SQL 未偵測到查詢的異常狀況,您仍可點選「查詢延遲」資訊卡中的「調查」按鈕,對查詢執行分析。

分析查詢延遲

您可以透過 AI 輔助功能,分析及排解查詢延遲的詳細資料。

資料分析時間範圍

分析時間範圍為您在「查詢洞察」資訊主頁的「資料庫負載」圖表或「查詢詳細資料」頁面中選取的時間範圍結束前 24 小時。Cloud SQL 會使用這段時間範圍,比較基準指標與異常期間擷取的指標。

在「查詢詳細資料」頁面中,如果 Cloud SQL Enterprise Plus 版偵測到查詢異常狀況,選取「查詢洞察」資訊主頁中的查詢後,Cloud SQL 會使用異常狀況結束前 24 小時的資料,對查詢執行基準效能分析。如果 Cloud SQL 未偵測到查詢異常狀況,並再次對查詢執行異常偵測,則 Cloud SQL 會使用所選日期範圍結束前 48 小時做為分析時間範圍的效能基準。

偵測到異常狀況的期間

偵測到的異常狀況期間僅適用於 Cloud SQL Enterprise Plus 版本執行個體。

偵測到異常狀況的期間是指 Cloud SQL 發現查詢效能出現異常變化的時間範圍。Cloud SQL 會使用在分析時間範圍內測得的查詢基準效能。

如果 Cloud SQL 在所選時間範圍內偵測到查詢的多個異常狀況,則會使用最後偵測到的異常狀況。

查詢效能提示範例

您也可以使用 Gemini Cloud Assist 輸入提示,協助提升查詢效能。Gemini Cloud Assist 會回答所選 Cloud SQL 執行個體和資料庫的問題。

提示詞 回覆類型
資料庫中延遲時間最長的查詢為何?
  • 依延遲時間排序的查詢摘要。 Gemini 會根據查詢洞察資料庫載入圖表中選取的時間範圍篩選器,縮小回覆範圍。
  • 如何依延遲時間找出及排序查詢。
這個資料庫執行個體中最慢的查詢是什麼? 瞭解如何依延遲時間找出最慢的查詢。

排解資料庫負載過高的問題

在 Google Cloud 控制台中存取「查詢洞察」資訊主頁,即可分析資料庫,並在系統的資料庫負載高於平均值時排解事件問題。Cloud SQL 會使用所選時間範圍前 24 小時的資料,計算資料庫的預期負載。您可以調查載入事件增加的原因,並分析成效降低的證據。Cloud SQL 也會提供資料庫最佳化建議,協助您提升效能。

如要使用 AI 輔助功能排解資料庫負載過高的問題,請前往 Google Cloud 控制台的「執行個體總覽」頁面或「查詢洞察」資訊主頁。

執行個體總覽頁面

如要運用 AI 輔助功能排解資料庫負載過高的問題,請按照下列步驟前往「執行個體總覽」頁面:

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 在「總覽」頁面中,從「圖表」選單選取資料庫的指標。您可以選取任何指標,例如「CPU 使用率」
  4. 選用:如要選取特定分析時間範圍,請使用「時間範圍」篩選器,選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。

    您可以放大圖表的特定部分,分析您發現負載較高的區域。舉例來說,高負載區域可能會顯示接近 100% 的 CPU 使用率。如要放大,請點選並選取圖表的一部分。

    按一下「調查效能」按鈕,即可在 Gemini Cloud Assist 的 AI 輔助下,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,其中包含下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

查詢洞察資訊主頁

在「查詢洞察」資訊主頁中,按照下列步驟使用 AI 輔助功能,排解資料庫負載過高的問題:

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 按一下「查詢洞察」開啟「查詢洞察」資訊主頁。
  4. 選用:使用「時間範圍」篩選器選取 1 小時、6 小時、1 天、7 天、30 天或自訂範圍。
  5. 您可以放大圖表的特定部分,找出查詢執行時間較長,導致資料庫負載較高的區域。如要放大,請點選並選取圖表的一部分。

    在「資料庫負載圖表」中,按一下「調查效能」按鈕,透過 Gemini Cloud Assist 的 AI 輔助功能,開始排解資料庫負載過高的問題。

    大約兩分鐘後,系統會開啟「調查詳細資料」窗格,並顯示下列部分:

    • 問題。調查問題的說明,包括調查的開始和停止時間。
    • 觀察結果。問題的觀察結果清單。舉例來說,這些詳細資料可能包括鎖定爭用詳細資料,例如查詢的鎖定等待比率高於預期。
    • 假設。AI 建議的行動清單,可協助解決查詢執行緩慢的問題。

分析資料庫負載過高的情況

您可以運用 AI 輔助功能,分析及排解資料庫負載的詳細資料。

資料分析時間範圍

Cloud SQL 會分析您在「查詢洞察」資訊主頁或「執行個體總覽」頁面中,於資料庫負載圖表選取的時間範圍。如果選取的時間範圍少於 24 小時,Cloud SQL 會分析整個時間範圍。如果您選取的時間範圍超過 24 小時,Cloud SQL 只會選取最後 24 小時的時間範圍進行分析。

為計算資料庫的基準效能分析,Cloud SQL 會在分析時間範圍內納入 24 小時的基準時間範圍。如果所選時間範圍不是星期一,Cloud SQL 會使用所選時間範圍前 24 小時做為基準時間範圍。如果所選時間範圍是星期一,Cloud SQL 會使用前 7 天做為基準時間範圍。

指標分析

Cloud SQL 開始分析時,會檢查各種指標的重大變化,包括但不限於下列指標:

  • 每秒查詢次數 (QPS)
  • CPU
  • 記憶體
  • 磁碟 I/O

Cloud SQL 會比較分析時間範圍內資料庫的基準匯總資料與成效資料。如果 Cloud SQL 偵測到重要指標的閾值出現重大變化,Cloud SQL 就會指出資料庫可能發生問題。所識別的情況可能說明在所選時間範圍內,資料庫負載過高的根本原因。

建議

Gemini Cloud Assist 完成分析後,「調查詳細資料」窗格的「假設」部分會列出可執行的洞察資料,協助修正問題。

在某些情況下,根據分析結果,系統可能不會提供建議。

系統效能提示範例

您也可以使用 Gemini Cloud Assist 輸入提示,收集系統效能相關資訊。Gemini Cloud Assist 會回答所選 Cloud SQL 執行個體的問題。

提示詞 回覆類型
過去 7 天內,這個資料庫執行個體有多少錯誤記錄檔項目? 依嚴重性類型分組的記錄項目摘要。 Gemini 會根據執行個體成效圖表中選取的時間範圍篩選條件,縮小回覆範圍。
今天下午 2 點左右,這個資料庫執行個體的 CPU 使用率是多少? 時間間隔內的 CPU 使用率百分比範圍指標結果。

排解連線問題

如要開始排解連線問題,可以使用 Gemini Cloud Assist,或在發生連線錯誤時啟動調查。AI 輔助功能會評估多個來源,找出用戶端嘗試連線至 Cloud SQL 資料庫時可能遇到的問題。

調查連線問題

如要使用 AI 輔助功能排解連線問題,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Cloud SQL Instances」頁面。

    前往 Cloud SQL 執行個體

  2. 如要開啟執行個體的「總覽」頁面,請按一下執行個體名稱。
  3. 在「Resolve database issues with AI-assisted troubleshooting」(運用 AI 疑難排解功能,解決資料庫問題) 窗格中,按一下「Explore investigations」(探索調查)
  4. 在「調查選項」視窗中,尋找「連線用量」部分。
  5. 選用:使用「時間範圍」篩選器選取特定分析時間範圍,包括 1 小時、6 小時、1 天、7 天或自訂範圍。
  6. 按一下「調查」

    Gemini 會自動分析執行個體中繼資料、記錄和網路設定。分析完成後,「調查詳細資料」窗格會顯示下列部分:

    • 問題:連線失敗摘要,包括受影響的資源和時間戳記。
    • 觀察結果:從信號收集到的證據,例如資料庫達到 max_connections 限制,或與執行個體中繼資料交叉參照的並行連線數。證據可用於判斷流量暴增或未關閉的工作階段是否為執行個體停機的原因。
    • 假設:AI 生成的根本原因和補救步驟。

連線問題提示範例

您也可以使用 Gemini Cloud Assist 解決用戶端與 Cloud SQL 執行個體之間的連線問題。

提示詞 回覆類型
為什麼會看到連線錯誤? Gemini 會評估資料庫連線,並建議改善措施,例如啟用受管理連線集區。

取得索引建議

您可以在查詢洞察功能中,從 Cloud SQL 取得索引建議。 如要進一步瞭解如何取得索引建議,請參閱「使用索引建議工具」。

索引建議提示範例

使用 Gemini Cloud Assist 進一步瞭解如何在資料庫中使用索引。Gemini Cloud Assist 會回答所選 Cloud SQL 執行個體的問題。

提示詞 回覆類型
顯示過去 7 天內執行的查詢索引建議。 索引可提升哪些類型的查詢效率。

監控執行中的查詢

使用「查詢洞察」資訊主頁監控執行中的查詢,並視需要終止長時間執行的程序。詳情請參閱「監控進行中的查詢」。

執行中查詢提示範例

使用 Gemini Cloud Assist 進一步瞭解導致延遲或 CPU 負載偏高的查詢。Gemini Cloud Assist 會回答所選 Cloud SQL 執行個體的問題。

提示詞 回覆類型
目前資料庫中執行的熱門查詢有哪些? 瞭解如何找出執行時間最長和最耗用資源的查詢。

後續步驟