監控 VM 擴充功能

監控 VM 擴充功能的健康狀態和效能,有助於管理資源用量,並解決整個 Compute Engine 執行個體機群的問題。您可以透過 Cloud Monitoring 資訊主頁,以視覺化方式呈現 CPU 或記憶體耗用量等資源用量,並設定警告政策,在發生安裝失敗等事件時接收通知。

本文說明如何使用 Cloud Monitoring 監控 Compute Engine 執行個體上由 VM 擴充功能管理工具管理的 VM 擴充功能,並協助您完成下列事項:

事前準備

  • 如果尚未設定驗證,請先完成設定。 驗證可確認您的身分,以便存取 Google Cloud 服務和 API。如要從本機開發環境執行程式碼或範例,請選取下列其中一個選項,向 Compute Engine 進行驗證:

    選取這個頁面上您打算如何使用範例的分頁:

    控制台

    使用 Google Cloud 控制台存取 Google Cloud 服務和 API 時,無須設定驗證。

    gcloud

    1. 安裝 Google Cloud CLI。 完成後,執行下列指令來初始化 Google Cloud CLI:

      gcloud init

      若您採用的是外部識別資訊提供者 (IdP),請先使用聯合身分登入 gcloud CLI

  • 設定預設地區和區域
  • REST

    如要在本機開發環境中使用本頁的 REST API 範例,請使用您提供給 gcloud CLI 的憑證。

      安裝 Google Cloud CLI。

      若您採用的是外部識別資訊提供者 (IdP),請先使用聯合身分登入 gcloud CLI

    詳情請參閱 Google Cloud 驗證說明文件中的「使用 REST 進行驗證」。

事前準備

監控擴充功能前,請務必完成下列事項:

必要的 IAM 角色

如要取得監控指標及建立資訊主頁所需的權限,請要求管理員授予您專案的下列 IAM 角色。

如要取得監控指標及管理資訊主頁所需的權限,請要求管理員授予您下列 IAM 角色:

  • 如要查看指標和資訊主頁: 專案的「Monitoring 檢視者」 (roles/monitoring.viewer)
  • 如要建立及管理資訊主頁和警報政策:專案的「監控編輯者」 (roles/monitoring.editor)

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

這些預先定義的角色具備監控指標和管理資訊主頁所需的權限。如要查看確切的必要權限,請展開「Required permissions」(必要權限) 部分:

所需權限

如要監控指標及管理資訊主頁,必須具備下列權限:

  • 如要查看資訊主頁: monitoring.dashboards.get 專案
  • 建立資訊主頁: monitoring.dashboards.create 在專案中
  • 如要設定快訊: monitoring.alertPolicies.create 在專案上

您或許還可透過自訂角色或其他預先定義的角色取得這些權限。

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。

您或許也能透過自訂角色或其他預先定義的角色,取得必要權限。

VM 擴充功能可用的指標

您可以在 Monitoring 中監控下列 VM 擴充功能指標:

指標名稱 指標類型 說明
VM 擴充功能強制執行狀態 compute.googleapis.com/vm_extensions/extension/enforcement_status Compute Engine VM 擴充功能的強制執行狀態。標籤包括 extension_namestatus

如需擴充功能名稱清單,請參閱「支援的擴充功能」。

status 的可能值如下:

  • ENFORCEMENT_STATE_UNSPECIFIED
  • INSTALLING
  • INSTALL_FAILED
  • INSTALLED
  • ROLLING_BACK
  • ROLLBACK_FAILED
  • ROLLED_BACK
  • INCOMPATIBLE
  • REMOVING
  • SERVICE_DISABLED
  • APPLYING_CONFIG
VM 擴充功能健康狀態 compute.googleapis.com/vm_extensions/extension/health_status VM 擴充功能的健康狀態。標籤包括 extension_namestatus

如需擴充功能名稱清單,請參閱「支援的擴充功能」。

status 可能的值如下:
  • HEALTH_STATUS_UNSPECIFIED
  • STARTING
  • RUNNING
  • STOPPING
  • STOPPED
  • CRASHED
VM 擴充功能 CPU 最高用量 compute.googleapis.com/vm_extensions/extension/cpu/max_usage VM 擴充功能使用的 CPU 時間上限,以百分比表示。
VM 擴充功能記憶體最高用量 (位元組) compute.googleapis.com/vm_extensions/extension/memory/used_bytes VM 擴充功能的記憶體用量上限 (以位元組為單位)。

建構自訂監控資訊主頁

您可以根據自己的用途,使用最相關的 VM 擴充功能圖表建構 Monitoring 資訊主頁。如要將圖表新增至資訊主頁,請按照下列步驟操作:

  1. 在 Google Cloud 控制台中選取「Monitoring」

    前往「Monioring」

  2. 在導覽窗格中,選取「Dashboards」(資訊主頁)
  3. 按一下「Create dashboard」(建立資訊主頁)
  4. 按一下「新增小工具」
  5. 在「新增小工具」視窗中,選取「資料」的「指標」
  6. 如要選取指標,請展開「Select a metric」(選取指標) 選單,然後執行下列步驟:
    1. 在「Active resources」(有效資源) 中,選取「VM Instance」(VM 執行個體)
    2. 在「指標類別」中,選取「Vm_extensions」
    3. 選取「指標」,例如「VM 擴充功能健康狀態」。如需可用指標清單,請參閱可用於監控 VM 擴充功能的指標
    4. 按一下「套用」

您可以視情況新增任意數量的圖表到資訊主頁。詳情請參閱「建立及管理自訂資訊主頁」一文。

設定警告政策

您可以透過 Monitoring 建立快訊,並在指標超過指定門檻時收到通知。舉例來說,當擴充功能的健康狀態變更為 CRASHED 時,您會收到通知。

  1. 在 Google Cloud 控制台中選取「Monitoring」

    前往「Monioring」

  2. 在導覽窗格中,選取「快訊」
  3. 點選「建立政策」
  4. 在「建立警告政策」頁面中,定義警告觸發條件和通知管道。
    1. 如要選取指標,請展開「Select a metric」(選取指標) 選單,然後執行下列步驟:
      1. 在「Active resources」(有效資源) 中,選取「VM Instance」(VM 執行個體)
      2. 在「指標類別」中,選取「Vm_extensions」
      3. 在「指標」中,選取指標,例如「VM 擴充功能強制執行狀態」。如需可用指標清單,請參閱「可用於監控 VM 擴充功能的指標」。
      4. 按一下「套用」
    2. 設定觸發條件,例如檢查 status 標籤是否為 INSTALL_FAILED
  5. 按照提示新增通知管道,並為政策命名。
  6. 點選「建立政策」

詳情請參閱「建立快訊政策」。

後續步驟