本文說明如何建立及執行 Batch 工作,自動安裝 Ops Agent。安裝作業套件代理程式,在 Cloud Monitoring 中提供作業資源效能的額外指標。如要進一步瞭解如何使用作業的資源效能指標,請參閱「查看指標,監控及最佳化作業資源」。
事前準備
- 如果您從未使用過 Batch,請參閱「開始使用 Batch」,並完成專案和使用者的必要條件,啟用 Batch。
- 如果專案尚未啟用 Cloud Monitoring 和 Cloud Logging API,請按照下列步驟啟用:
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
如要取得建立作業所需的權限,請要求管理員授予您下列 IAM 角色:
-
如何建立工作:
-
批次工作編輯者 (
roles/batch.jobsEditor) 專案 -
服務帳戶使用者 (
roles/iam.serviceAccountUser) 在作業的服務帳戶上,預設為預設 Compute Engine 服務帳戶
-
批次工作編輯者 (
-
如要查看記錄,請在專案中按一下「記錄檢視器」圖示
roles/logging.viewer。
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。
-
如何建立工作:
除非您使用作業服務帳戶的預設設定,否則請確保該帳戶具備必要權限。
為確保作業的服務帳戶具備必要權限,可將 Ops Agent 指標寫入 Monitoring,請要求管理員將下列 IAM 角色授予作業的服務帳戶:
- 請確認您規劃的工作設定符合作業套件代理程式需求。
作業套件代理程式需求
如要建立及執行使用 Ops Agent 的工作,工作必須符合下列所有規定:
確認作業的 VM 使用Ops Agent 支援的作業系統 (OS)。如要進一步瞭解作業的 VM OS 映像檔,請參閱「作業 VM 的 OS 環境總覽」。
如果您的工作使用非預設的網路設定或 VPC Service Controls,請確認工作符合 Ops Agent 的存取權需求。詳情請參閱 Google Cloud Observability 說明文件中的「沒有遠端套件存取權的 VM」。
請確認工作不會安裝舊版 Cloud Logging 代理程式或 Cloud Monitoring 代理程式,例如透過自訂映像檔或執行個體範本。
如要進一步瞭解 Ops Agent 的功能和需求,請參閱 Google Cloud Observability 說明文件中的「Ops Agent 總覽」。
建立自動安裝作業套件代理程式的工作
使用 Google Cloud CLI 或 REST API 建立工作,其中包含設為 true 的 installOpsAgent 欄位,位於 JSON 檔案主要主體的 allocationPolicy.instances 欄位中:
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
}
舉例來說,自動安裝 Ops Agent 的工作可以有類似下列內容的 JSON 設定檔:
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello World! This is task $BATCH_TASK_INDEX."
}
}
]
},
"taskCount": 3,
}
],
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
作業的 VM 開始執行後,您就能查看 Ops Agent 指標,與任何其他資源指標相同。詳情請參閱「查看指標,監控及最佳化工作資源」。