本文說明如何建立及執行批次工作,自動安裝 Ops Agent。安裝 Ops Agent,在 Cloud Monitoring 中提供作業資源效能的額外指標。如要進一步瞭解如何使用作業的資源效能指標,請參閱「查看指標,監控及最佳化作業資源」。
事前準備
- 如果您從未使用過 Batch,請參閱「開始使用 Batch」,並完成專案和使用者的必要條件,啟用 Batch。
- 如果專案尚未啟用 Cloud Monitoring 和 Cloud Logging API,請啟用這些 API:
啟用 API 時所需的角色
如要啟用 API,您需要服務使用情形管理員 IAM 角色 (
roles/serviceusage.serviceUsageAdmin),其中包含serviceusage.services.enable權限。瞭解如何授予角色。 -
如要取得建立作業所需的權限,請要求系統管理員授予您下列 IAM 角色:
-
如何建立工作:
- 專案的批次工作編輯者 (
roles/batch.jobsEditor) - 服務帳戶使用者 (
roles/iam.serviceAccountUser) 在作業的服務帳戶上,預設為預設 Compute Engine 服務帳戶
- 專案的批次工作編輯者 (
-
如要查看記錄:
專案中的「記錄檢視器」 (
roles/logging.viewer)
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。
-
如何建立工作:
除非您使用作業服務帳戶的預設設定,否則請確保該帳戶具備必要權限。
為確保作業的服務帳戶具備必要權限,能將 Ops Agent 指標寫入 Monitoring,請要求管理員將下列 IAM 角色授予作業的服務帳戶:
- 專案的 Monitoring 指標寫入者 (
roles/monitoring.metricWriter) - 專案的記錄寫入者 (
roles/logging.logWriter)
- 專案的 Monitoring 指標寫入者 (
- 請確認您規劃的工作設定符合Ops Agent 需求。
Ops Agent 需求
如要建立及執行使用 Ops Agent 的工作,工作必須符合下列所有規定:
確認作業的 VM 使用Ops Agent 支援的作業系統 (OS)。如要進一步瞭解作業的 VM OS 映像檔,請參閱「作業 VM 的 OS 環境總覽」。
如果您的工作使用非預設的網路設定或 VPC Service Controls,請確認工作符合 Ops Agent 的存取權需求。詳情請參閱 Google Cloud Observability 說明文件中的「沒有遠端套件存取權的 VM」。
請確認工作不會安裝舊版 Cloud Logging 代理程式或 Cloud Monitoring 代理程式,例如透過自訂映像檔或執行個體範本。
如要進一步瞭解 Ops Agent 的功能和需求,請參閱 Google Cloud Observability 說明文件中的「Ops Agent 總覽」。
建立自動安裝 Ops Agent 的工作
使用 Google Cloud CLI 或 REST API 建立工作,其中包含設為 true 的 installOpsAgent 欄位,位於 JSON 檔案主要主體的 allocationPolicy.instances 欄位中:
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
}
舉例來說,自動安裝 Ops Agent 的工作可以有類似下列內容的 JSON 設定檔:
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello World! This is task $BATCH_TASK_INDEX."
}
}
]
},
"taskCount": 3,
}
],
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
作業的 VM 開始執行後,您就能查看 Ops Agent 指標,與任何其他資源指標相同。詳情請參閱「查看指標,監控及最佳化工作資源」。