Mengelola peristiwa host di seluruh reservasi

Dokumen ini menjelaskan cara menggunakan fitur pemeliharaan host yang tersedia di AI Hypercomputer. Dokumen ini menjelaskan cara memantau, merencanakan, dan melakukan pemeliharaan terjadwal pada blok kapasitas yang dipesan. Untuk mengelola pemeliharaan pada instance Compute Engine, lihat Mengelola peristiwa host di seluruh instance komputasi.

Anda dapat mengelola peristiwa host pemeliharaan mendatang secara proaktif di blok kapasitas yang dipesan, baik instance berjalan di blok tersebut atau tidak. Pendekatan ini membantu Anda meminimalkan gangguan dan mempertahankan performa yang optimal.

Sebelum memulai

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

In the Google Cloud console, activate Cloud Shell.

Activate Cloud Shell

At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

REST

Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

    Instal Google Cloud CLI. Setelah penginstalan, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:

    gcloud init

    Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.

Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk mengelola peristiwa pemeliharaan host di seluruh reservasi, minta administrator Anda untuk memberi Anda peran IAM berikut :

  • Compute Admin (roles/compute.admin) di project
  • Untuk akses hanya baca ke log audit Peristiwa Sistem: Logs Viewer (roles/logging.viewer) pada project

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk mengelola peristiwa pemeliharaan host di seluruh reservasi. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk mengelola peristiwa pemeliharaan host di seluruh pemesanan:

  • Untuk memulai pemeliharaan host untuk pemesanan: compute.reservations.performMaintenance pada project
  • Untuk memulai pemeliharaan host untuk blok pemesanan: compute.reservationBlocks.performMaintenance pada project
  • Untuk memulai pemeliharaan host untuk sub-blok reservasi: compute.reservationSubBlocks.performMaintenance pada project
  • Untuk melihat daftar pemesanan: compute.reservations.list pada project
  • Untuk melihat detail pemesanan: compute.reservations.get pada project
  • Untuk melihat daftar blok dalam pemesanan: compute.reservationBlocks.list pada project
  • Untuk melihat daftar sub-blok dalam blok pemesanan: compute.reservationSubBlocks.list pada project

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Ringkasan

Jika belum, tinjau Memahami dan menangani pemeliharaan host.

Untuk mengoptimalkan pemeliharaan blok kapasitas yang dipesan, selesaikan langkah-langkah berikut:

  1. Siapkan pemberitahuan notifikasi. Buat pemberitahuan berbasis log untuk mendapatkan notifikasi tentang peristiwa pemeliharaan yang dijadwalkan, dimulai, atau selesai untuk reservasi, blok reservasi, atau sub-blok reservasi. Pendekatan ini membantu Anda merencanakan aktivitas secara proaktif dan menghindari periode nonaktif yang tidak terduga.

  2. Mengelola pemeliharaan di seluruh blok kapasitas. Lihat dan, jika perlu, mulai pemeliharaan secara manual di seluruh reservasi, blok reservasi, atau sub-blok reservasi Anda. Proses ini membantu Anda meningkatkan ketahanan workload terhadap error host, mencegah periode nonaktif, dan memastikan aplikasi Anda tetap tersedia.

Menyiapkan pemberitahuan notifikasi untuk reservasi

Anda dapat menerima notifikasi tentang peristiwa pemeliharaan terjadwal, dimulai, atau selesai untuk pemesanan, blok pemesanan, atau sub-blok pemesanan dengan membuat kebijakan pemberitahuan berbasis log.

Untuk membuat pemberitahuan untuk peristiwa pemeliharaan reservasi, blok reservasi, atau sub-blok reservasi, selesaikan prosedur berikut. Ulangi prosedur ini untuk setiap pemberitahuan yang ingin Anda buat.

  1. Di konsol Google Cloud , buka Logs Explorer:

    Buka Logs Explorer

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Logging.

  2. Klik tombol Show query ke posisi aktif.

  3. Di panel Query, buat salah satu kueri berikut. Kueri ini memfilter entri log untuk mengidentifikasi peristiwa pemeliharaan tertentu. Ulangi prosedur ini untuk setiap kueri yang ingin Anda buat.

    • Menerima pemberitahuan pemeliharaan untuk reservasi:

      • Untuk menerima notifikasi saat pemeliharaan dijadwalkan:

        protoPayload.methodName="compute.reservations.upcomingGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "scheduled"
        
      • Untuk menerima pemberitahuan saat pemeliharaan telah selesai:

        protoPayload.methodName="compute.reservations.completedGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "completed"
        
    • Menerima notifikasi pemeliharaan untuk blok reservasi:

      • Untuk menerima notifikasi saat pemeliharaan dijadwalkan:

        protoPayload.methodName="compute.reservations.block.upcomingGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "scheduled"
        
      • Untuk menerima notifikasi saat pemeliharaan telah dimulai:

        protoPayload.methodName="compute.reservations.block.startGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "started"
        
      • Untuk menerima pemberitahuan saat pemeliharaan telah selesai:

        protoPayload.methodName="compute.reservations.block.completedGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "completed"
        
    • Menerima pemberitahuan pemeliharaan untuk sub-blok reservasi instance A4X Max atau A4X:

      • Untuk menerima notifikasi saat pemeliharaan dijadwalkan:

        protoPayload.methodName="compute.reservations.subBlock.upcomingGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "scheduled"
        
      • Untuk menerima notifikasi saat pemeliharaan telah dimulai:

        protoPayload.methodName="compute.reservations.subBlock.startGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "started"
        
      • Untuk menerima pemberitahuan saat pemeliharaan telah selesai:

        protoPayload.methodName="compute.reservations.subBlock.completedGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "completed"
        
      • Untuk menerima pemberitahuan saat mesin A4X Max atau A4X mengalami error dan Compute Engine memulai pemeliharaan:

        protoPayload.methodName="compute.reservations.subblock.unusedmachinerepair" severity>=DEFAULT
        protoPayload.status.message =~ "maintenance"
        
      • Untuk menerima pemberitahuan saat pemeliharaan untuk mesin A4X Max atau A4X yang mengalami error telah selesai:

        protoPayload.methodName="compute.reservations.subblock.unusedmachinerepaircomplete" severity>=DEFAULT
        protoPayload.status.message =~ "repaired"
        
  4. Untuk memvalidasi kueri, klik Jalankan kueri. Jika kueri valid, panel Query results akan menampilkan entri log yang cocok dengan kueri.

  5. Di toolbar hasil Kueri, klik daftar Tindakan, lalu pilih Buat pemberitahuan log. Panel Buat kebijakan pemberitahuan berbasis log akan muncul.

  6. Di bagian Detail pemberitahuan, lakukan tindakan berikut:

    1. Di kolom Alert Policy Name, masukkan nama untuk kebijakan.

    2. Dalam daftar Tingkat keparahan kebijakan, pilih Peringatan (atau tingkat keparahan yang lebih tinggi).

    3. Klik Berikutnya.

  7. Di bagian Choose logs to include in the alert, klik Next.

  8. Di bagian Setel frekuensi notifikasi dan durasi penutupan otomatis, tentukan hal berikut:

    1. Di daftar Waktu antar-notifikasi, pilih seberapa sering Anda ingin mendapatkan notifikasi.

    2. Dalam daftar Durasi penutupan insiden otomatis, pilih durasi setelah Cloud Logging berhenti mengirimkan notifikasi dan menutup insiden secara otomatis.

    3. Klik Berikutnya.

  9. Di bagian Who should be notified?, tentukan saluran notifikasi untuk Logging guna mengirim notifikasi.

  10. Klik Simpan.

Mengelola pemeliharaan di seluruh reservasi

Anda dapat melihat dan mengontrol pemeliharaan untuk reservasi, blok reservasi, dan sub-blok reservasi sebagai berikut:

  • Untuk memeriksa status dan waktu yang dijadwalkan untuk pemeliharaan mendatang pada pemesanan, blok pemesanan, atau sub-blok pemesanan Anda, lihat status pemeliharaan.

  • Untuk memulai pemeliharaan secara manual pada pemesanan, blok pemesanan, atau sub-blok pemesanan, daripada menunggu tanggal dan waktu pemeliharaan terjadwal, mulai pemeliharaan secara manual.

  • Untuk mengelola seberapa awal Anda ingin menerima notifikasi saat host instance komputasi memerlukan pemeliharaan darurat yang tidak direncanakan setelah terjadi error host atau laporan host yang rusak, kelola notifikasi pemeliharaan darurat hardware.

Melihat status pemeliharaan

Anda dapat melihat status pemeliharaan mendatang untuk reservasi, blok reservasi, atau sub-blok reservasi dengan memeriksa nilai kolom upcomingGroupMaintenance dalam metadatanya. Jika reservasi tidak memiliki kolom upcomingGroupMaintenance, maka tidak ada pemeliharaan yang dijadwalkan untuk reservasi, blok reservasi, atau sub-blok reservasi. Untuk mengetahui informasi selengkapnya tentang kolom di upcomingGroupMaintenance, lihat Definisi status pemeliharaan dalam dokumentasi Compute Engine.

Selain itu, jika pemeliharaan dijadwalkan untuk blok atau sub-blok reservasi, kolom upcomingGroupMaintenance berisi kolom maintenanceReasons. Kolom ini menjelaskan alasan pemeliharaan dijadwalkan untuk blok atau sub-blok reservasi Anda, seperti yang dijelaskan dalam tabel berikut:

Jenis pemeliharaan Alasan pemeliharaan Status instance komputasi
Pemeliharaan terencana setelah laporan host yang rusak FAILURE_GPU_CUSTOMER_REPORTED Hanya berlaku untuk instance yang berjalan di host yang Anda laporkan sebagai rusak.
Pemeliharaan terencana untuk pemeliharaan rutin
  • PLANNED_UPDATE: pemeliharaan infrastruktur terencana
  • PLANNED_NETWORK_UPDATE: pemeliharaan jaringan terencana
Berlaku untuk instance yang sedang berjalan, dihentikan, atau ditangguhkan.
Pemeliharaan darurat yang tidak terencana
  • FAILURE_DISK: pemeliharaan tidak terencana yang dijadwalkan karena error pada disk yang terpasang ke instance.
  • FAILURE_GPU: pemeliharaan tidak terencana dijadwalkan karena error terkait GPU.
  • FAILURE_GPU_TEMPERATURE: pemeliharaan tidak terencana yang dijadwalkan karena error terkait GPU setelah GPU mencapai suhu tinggi.
  • FAILURE_GPU_XID: pemeliharaan yang tidak direncanakan setelah Anda menerima pesan Xid karena error terkait GPU.
  • FAILURE_INFRA: pemeliharaan tidak terencana dijadwalkan karena terjadi error pada infrastruktur.
  • FAILURE_INTERFACE: pemeliharaan tidak terencana yang dijadwalkan karena error pada NIC.
  • FAILURE_MEMORY: pemeliharaan tidak terencana yang dijadwalkan karena error pada memori instance.
  • FAILURE_NETWORK: pemeliharaan tidak terencana yang dijadwalkan karena error pada jaringan.
  • FAILURE_NVLINK: pemeliharaan tidak terencana yang dijadwalkan karena error pada NVLink.
Hanya berlaku untuk instance yang sedang berjalan.

Untuk melihat kolom maintenanceReasons dalam blok atau sub-blok reservasi, atau melihat status pemeliharaan sub-blok, Anda harus menggunakan gcloud CLI atau REST API. Jika tidak, pilih salah satu opsi berikut:

Konsol

  1. Di konsol Google Cloud , buka halaman Reservations.

    Buka Reservations

  2. Di kolom Status pemeliharaan, Compute Engine menampilkan status pemeliharaan reservasi Anda. Jika Anda tidak melihat kolom ini di tabel Reservasi sesuai permintaan, klik Opsi tampilan kolom, pilih kotak centang Status pemeliharaan, lalu klik Oke.

  3. Untuk melihat status pemeliharaan blok reservasi, selesaikan langkah-langkah berikut:

    1. Di kolom Nama, klik nama reservasi. Halaman yang memberikan detail pemesanan akan muncul.

    2. Di tabel Blok, di kolom Pemeliharaan, Compute Engine menampilkan status pemeliharaan blok dalam reservasi.

gcloud

  1. Untuk melihat status pemeliharaan pemesanan, gunakan perintah gcloud compute reservations describe dengan flag --flatten yang ditetapkan ke resourceStatus.reservationMaintenance:

    gcloud compute reservations describe RESERVATION_NAME \
        --flatten=resourceStatus.reservationMaintenance \
        --zone=ZONE
    

    Ganti kode berikut:

    • RESERVATION_NAME: nama pemesanan.

    • ZONE: zona tempat pemesanan berada.

    Outputnya mirip dengan salah satu dari berikut ini:

    • Jika pemeliharaan dijadwalkan untuk reservasi Anda, output-nya akan mirip dengan berikut ini:

      ---
      maintenanceOngoingCount: 0
      maintenancePendingCount: 6
      schedulingType: GROUPED
      upcomingGroupMaintenance:
        canReschedule: true
        maintenanceStatus: PENDING
        type: UNSCHEDULED
        windowEndTime: '2025-11-13T14:00:00.000-08:00'
        windowStartTime: '2025-11-13T12:00:00.000-08:00'
      

      Jika kolom schedulingType ditetapkan ke INDEPENDENT, maka kolom upcomingGroupMaintenance tidak berisi kolom windowStartTime dan windowEndTime. Untuk melihat kapan pemeliharaan dijadwalkan untuk instance yang berjalan di host yang dipesan, lihat status pemeliharaan untuk instance tersebut.

    • Jika pemeliharaan tidak dijadwalkan untuk reservasi Anda, outputnya akan mirip dengan berikut ini:

      ---
      schedulingType: GROUPED
      
  2. Jika pemeliharaan dijadwalkan untuk reservasi Anda, untuk melihat status pemeliharaan blok dalam reservasi, gunakan perintah gcloud compute reservations blocks list:

    gcloud compute reservations blocks list RESERVATION_NAME \
        --zone=ZONE
    

    Jika pemeliharaan dijadwalkan atau sedang berlangsung untuk blok pemesanan, maka outputnya akan mirip dengan berikut ini:

    ---
    ...
    name: example-fr-a3u-dense-1-block-0001
    ...
    reservationBlockMaintenance:
      maintenanceOngoingCount: 0
      maintenancePendingCount: 6
      schedulingType: GROUPED
      upcomingGroupMaintenance:
        canReschedule: true
        maintenanceReasons:
        - PLANNED_UPDATE
        - PLANNED_NETWORK_UPDATE
        maintenanceStatus: PENDING
        type: UNSCHEDULED
        windowEndTime: '2025-11-13T14:00:00.000-08:00'
        windowStartTime: '2025-11-13T12:00:00.000-08:00'
    ...
    ---
    ...
    name: example-fr-a3u-dense-1-block-0002
    ...
    schedulingType: GROUPED
    ...
    
  3. Jika pemeliharaan dijadwalkan untuk blok reservasi, untuk melihat status pemeliharaan sub-blok dalam blok reservasi, gunakan perintah gcloud compute reservations sub-blocks list:

    gcloud compute reservations sub-blocks list RESERVATION_NAME \
        --block-name=BLOCK_NAME \
        --zone=ZONE
    

    Ganti BLOCK_NAME dengan nama blok yang ada dalam reservasi.

    Jika pemeliharaan dijadwalkan atau sedang berlangsung untuk sub-blok reservasi, output-nya akan mirip dengan berikut ini:

    ...
    reservationSubBlockMaintenance:
      instanceMaintenanceOngoingCount: 0
      instanceMaintenancePendingCount: 3
      maintenanceOngoingCount: 0
      maintenancePendingCount: 32
      schedulingType: GROUPED
      subblockInfraMaintenanceOngoingCount: 0
      subblockInfraMaintenancePendingCount: 0
      upcomingGroupMaintenance:
        canReschedule: true
        maintenanceReasons:
        - PLANNED_UPDATE
        - PLANNED_NETWORK_UPDATE
        maintenanceStatus: PENDING
        type: SCHEDULED
        windowEndTime: '2025-11-13T14:00:00.000-08:00'
        windowStartTime: '2025-11-13T12:00:00.000-08:00'
    ...
    

REST

  1. Untuk melihat status pemeliharaan pemesanan Anda, buat permintaan GET ke salah satu metode berikut:

    Di URL permintaan, sertakan parameter kueri berikut:

    • Untuk hanya menampilkan nama, jenis mesin yang dicadangkan, dan status pemeliharaan pemesanan, sertakan parameter kueri fields yang disetel ke items.name,items.specificReservation.instanceProperties.machineType,items.resourceStatus.reservationMaintenance.

    • Untuk memfilter hanya menurut reservasi yang menentukan jenis mesin tertentu, sertakan parameter kueri filter yang ditetapkan ke specificReservation.instanceProperties.machineType:MACHINE_TYPE dengan menggunakan nilai yang dienkode URL.

    Misalnya, untuk melihat pemesanan di semua zona, buat permintaan GET sebagai berikut:

    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/aggregated/reservations?fields=items.name,items.specificReservation.instanceProperties.machineType,items.resourceStatus.reservationMaintenance&filter=specificReservation.instanceProperties.machineType%3AMACHINE_TYPE
    

    Ganti kode berikut:

    • PROJECT_ID: ID project tempat pemesanan berada.

    • MACHINE_TYPE: jenis mesin yang dipesan yang ingin Anda gunakan untuk memfilter pemesanan.

    Jika pemeliharaan dijadwalkan atau sedang berlangsung untuk reservasi, outputnya akan mirip dengan berikut ini:

    {
      "items": [
        {
          "specificReservation": {
            "instanceProperties": {
              "machineType": "MACHINE_TYPE"
            }
          },
          "name": "example-reservation",
          "resourceStatus": {
            "reservationMaintenance": {
              maintenanceOngoingCount: 0,
              maintenancePendingCount: 6,
              "schedulingType": "GROUPED",
              "upcomingGroupMaintenance": {
                "type": "SCHEDULED",
                "canReschedule": true,
                "windowStartTime": "2025-11-13T12:00:00.000-08:00",
                "windowEndTime": "2025-11-13T14:00:00.000-08:00",
                "maintenanceStatus": "PENDING"
              }
            }
          }
        },
        ...
      ]
    }
    

    Atau, untuk mempersempit daftar instance komputasi lebih lanjut, tetapkan parameter kueri filter ke ekspresi filter yang berbeda.

  2. Jika pemeliharaan dijadwalkan untuk pemesanan Anda, untuk melihat status pemeliharaan blok dalam pemesanan, buat permintaan GET ke metode reservationBlocks.list. Di URL permintaan, sertakan parameter kueri fields yang ditetapkan ke items.name,items.reservationMaintenance:

    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks?fields=items.name,items.reservationMaintenance
    

    Ganti RESERVATION_NAME dengan nama reservasi.

    Jika pemeliharaan dijadwalkan atau sedang berlangsung untuk blok pemesanan, maka outputnya akan mirip dengan berikut ini:

    {
      "items": [
        {
          "name": "example-fr-a3u-dense-1-block-0001",
          "reservationBlockMaintenance": {
            "maintenanceOngoingCount": 0,
            "maintenancePendingCount": 6,
            "schedulingType": "GROUPED",
            "upcomingGroupMaintenance": {
              "type": "SCHEDULED",
              "canReschedule": true,
              "windowStartTime": "2025-11-13T12:00:00.000-08:00",
              "windowEndTime": "2025-11-13T14:00:00.000-08:00",
              "maintenanceStatus": "PENDING",
              "maintenanceReasons": [
                "PLANNED_UPDATE",
                "PLANNED_NETWORK_UPDATE"
              ]
            }
          }
        },
        ...
      ]
    }
    

    Jika kolom schedulingType disetel ke INDEPENDENT untuk blok, maka kolom upcomingGroupMaintenance tidak berisi kolom windowStartTime dan windowEndTime. Untuk melihat kapan pemeliharaan dijadwalkan untuk instance yang berjalan di blok yang dicadangkan, lihat status pemeliharaan untuk instance tersebut.

  3. Jika pemeliharaan dijadwalkan untuk blok pemesanan, untuk melihat status pemeliharaan sub-blok dalam blok pemesanan, buat permintaan GET ke metode reservationSubBlocks.list:

    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks/BLOCK_NAME/reservationSubBlocks
    

    Ganti BLOCK_NAME dengan nama blok yang ada dalam reservasi.

    Jika pemeliharaan dijadwalkan atau sedang berlangsung untuk sub-blok reservasi, output-nya akan mirip dengan berikut ini:

    {
      "items": [
        {
          "name": "example-fr-a3u-dense-1-block-0001",
          "reservationSubBlockMaintenance": {
            "instanceMaintenanceOngoingCount": 0,
            "instanceMaintenancePendingCount": 3,
            "maintenanceOngoingCount": 0,
            "maintenancePendingCount": 6,
            "schedulingType": "GROUPED",
            "subblockInfraMaintenanceOngoingCount": 0,
            "subblockInfraMaintenancePendingCount": 0,
            "upcomingGroupMaintenance": {
              "type": "SCHEDULED",
              "canReschedule": true,
              "windowStartTime": "2025-11-13T12:00:00.000-08:00",
              "windowEndTime": "2025-11-13T14:00:00.000-08:00",
              "maintenanceStatus": "PENDING",
              "maintenanceReasons": [
                "PLANNED_UPDATE",
                "PLANNED_NETWORK_UPDATE"
              ]
            }
          }
        },
        ...
      ]
    }
    

Memulai pemeliharaan secara manual

Anda dapat memulai pemeliharaan secara manual untuk pemesanan, blok pemesanan, atau sub-blok pemesanan, bukan menunggu waktu yang dijadwalkan. Tindakan ini membantu Anda mengontrol gangguan pada workload secara lebih proaktif.

Bergantung pada status pemeliharaan pemesanan, blok pemesanan, atau sub-blok pemesanan, hal berikut akan terjadi:

Status pemeliharaan Deskripsi Yang Anda lihat
Dijadwalkan Compute Engine memiliki pemeliharaan terjadwal untuk reservasi. Anda dapat memulai pemeliharaan secara manual sebelum waktu yang dijadwalkan.
  • Di konsol Google Cloud , status pemeliharaan ditampilkan sebagai Siap dijalankan - akan dijalankan pada DATE.
  • Di gcloud CLI atau REST API, Compute Engine menyetel kolom maintenanceStatus ke PENDING.
Dalam proses Pemeliharaan sedang berlangsung. Anda tidak dapat menjadwalkannya ulang.
  • Di konsol Google Cloud , status pemeliharaan ditampilkan sebagai Running.
  • Di gcloud CLI atau REST API, Compute Engine menyetel kolom maintenanceStatus ke ONGOING.
Selesai Pemeliharaan selesai. Compute Engine telah menghapus semua notifikasi pemeliharaan dari instance.
  • Di konsol Google Cloud , status pemeliharaan ditampilkan sebagai .
  • Di gcloud CLI atau REST API, kolom maintenanceStatus tidak ada.

Untuk memulai pemeliharaan secara manual pada host tertentu dalam blok reservasi, atau memulai pemeliharaan secara manual pada sub-blok reservasi, gunakan gcloud CLI atau REST API. Jika tidak, pilih salah satu opsi berikut:

Konsol

  1. Di konsol Google Cloud , buka halaman Reservations.

    Buka Reservations

  2. Di kolom Nama, klik nama reservasi. Halaman yang memberikan detail pemesanan akan muncul.

  3. Klik Jalankan pemeliharaan, lalu pilih salah satu opsi berikut:

    • Untuk memulai pemeliharaan di semua blok, pilih Semua kapasitas.

    • Untuk memulai pemeliharaan hanya pada blok dengan instance yang berjalan, pilih Kapasitas yang digunakan.

    • Untuk memulai pemeliharaan hanya pada blok yang tidak digunakan dan blok dengan instance yang dihentikan atau ditangguhkan, pilih Kapasitas yang tidak digunakan.

  4. Untuk mengonfirmasi, klik Oke.

gcloud

Ganti kode berikut:

  • RESERVATION_NAME: nama pemesanan.

  • RESERVATION_MAINTENANCE_SCOPE: cakupan pemeliharaan untuk pemesanan. Tentukan salah satu nilai berikut:

    • Untuk memulai pemeliharaan di semua blok: all

    • Untuk memulai pemeliharaan hanya pada blok dengan instance yang sedang berjalan: running

    • Untuk memulai pemeliharaan hanya pada blok yang tidak digunakan dan blok dengan instance yang dihentikan atau ditangguhkan: unused

  • BLOCK_NAME: nama blok yang ada dalam pemesanan.

  • SUB_BLOCK_NAME: nama sub-blok yang ada dalam blok reservasi.

  • BLOCK_MAINTENANCE_SCOPE: cakupan pemeliharaan untuk blok pemesanan. Tentukan salah satu nilai berikut:

    • Untuk memulai pemeliharaan di semua host: all

    • Untuk memulai pemeliharaan hanya pada host dengan instance yang berjalan: running

    • Untuk memulai pemeliharaan hanya pada host yang tidak digunakan dan host dengan instance yang dihentikan atau ditangguhkan: unused

  • ZONE: zona tempat pemesanan berada.

REST

  • Untuk memulai pemeliharaan pada pemesanan, buat permintaan POST ke metode reservations.performMaintenance:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/performMaintenance
    
    {
      "maintenanceScope": "RESERVATION_MAINTENANCE_SCOPE"
    }
    
  • Untuk memulai pemeliharaan pada blok pemesanan, buat permintaan POST ke metode reservationBlocks.performMaintenance:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks/BLOCK_NAME/performMaintenance
    
    {
      "maintenanceScope": "BLOCK_MAINTENANCE_SCOPE"
    }
    
  • Untuk memulai pemeliharaan pada sub-blok reservasi, buat permintaan POST ke metode reservationSubBlocks.performMaintenance:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks/BLOCK_NAME/reservationSubBlocks/SUB_BLOCK_NAME/performMaintenance
    
    {
      "maintenanceScope": "BLOCK_MAINTENANCE_SCOPE"
    }
    

Ganti kode berikut:

  • PROJECT_ID: ID project tempat Compute Engine membuat pemesanan secara otomatis.

  • ZONE: zona tempat pemesanan berada.

  • RESERVATION_NAME: nama pemesanan.

  • RESERVATION_MAINTENANCE_SCOPE: cakupan pemeliharaan untuk pemesanan. Tentukan salah satu nilai berikut:

    • Untuk memulai pemeliharaan di semua blok: ALL

    • Untuk memulai pemeliharaan hanya pada blok dengan instance yang sedang berjalan: RUNNING

    • Untuk memulai pemeliharaan hanya pada blok yang tidak digunakan dan blok dengan instance yang dihentikan atau ditangguhkan: UNUSED

  • BLOCK_NAME: nama blok yang ada dalam pemesanan.

  • SUB_BLOCK_NAME: nama sub-blok yang ada dalam blok reservasi.

  • BLOCK_MAINTENANCE_SCOPE: cakupan pemeliharaan untuk blok pemesanan. Tentukan salah satu nilai berikut:

    • Untuk memulai pemeliharaan di semua host: ALL

    • Untuk memulai pemeliharaan hanya pada host dengan instance yang berjalan: RUNNING

    • Untuk memulai pemeliharaan hanya pada host yang tidak digunakan dan host dengan instance yang dihentikan atau ditangguhkan: UNUSED

Mengelola notifikasi pemeliharaan darurat hardware

Setelah instance mengalami error host, atau Anda melaporkan hostnya sebagai rusak, host instance memerlukan pemeliharaan darurat yang tidak direncanakan. Secara default, Compute Engine memberikan pemberitahuan beberapa jam sebelumnya saat menjadwalkan jenis pemeliharaan ini. Untuk host yang dicadangkan, Anda dapat mengaktifkan notifikasi pemeliharaan darurat untuk memperpanjang periode pemberitahuan ini menjadi minimal tujuh hari. Pendekatan ini membantu Anda mengontrol gangguan pada workload secara lebih proaktif.

Untuk mengaktifkan atau menonaktifkan notifikasi pemeliharaan darurat hardware untuk pemesanan, pilih salah satu opsi berikut:

gcloud

  • Untuk mengaktifkan notifikasi pemeliharaan darurat hardware untuk pemesanan, gunakan perintah gcloud compute reservations update dengan flag --enable-emergent-maintenance:

    gcloud compute reservations update RESERVATION_NAME \
        --enable-emergent-maintenance \
        --zone=ZONE
    
  • Untuk menonaktifkan notifikasi pemeliharaan darurat hardware untuk reservasi, gunakan perintah gcloud compute reservations update dengan flag --no-enable-emergent-maintenance:

    gcloud compute reservations update RESERVATION_NAME \
        --no-enable-emergent-maintenance \
        --zone=ZONE
    

Ganti kode berikut:

  • RESERVATION_NAME: nama pemesanan.

  • ZONE: zona tempat pemesanan berada.

REST

Untuk mengaktifkan atau menonaktifkan notifikasi pemeliharaan darurat hardware untuk pemesanan, buat permintaan PATCH ke metode reservations.update. Di URL permintaan, sertakan parameter kueri paths yang ditetapkan ke enableEmergentMaintenance.

PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME?paths=enableEmergentMaintenance

{
  "name": "RESERVATION_NAME",
  "enableEmergentMaintenance": EMERGENCY_MAINTENANCE_NOTIFICATIONS
}

Ganti kode berikut:

  • PROJECT_ID: ID project tempat pemesanan berada.

  • ZONE: zona tempat pemesanan berada.

  • RESERVATION_NAME: nama pemesanan.

  • EMERGENCY_MAINTENANCE_NOTIFICATIONS: tentukan salah satu nilai berikut:

    • Untuk mengaktifkan notifikasi: true

    • Untuk menonaktifkan notifikasi: false

Langkah berikutnya