Mulai ulang resource persisten

Anda dapat melakukan booting ulang pada resource persisten yang berada dalam status RUNNING atau ERROR. Dengan melakukan booting ulang pada resource persisten, Anda dapat memulihkan diri dari error yang tidak dapat dipulihkan oleh resource persisten itu sendiri. Anda juga dapat melakukan booting ulang pada resource persisten untuk mendapatkan cluster yang lebih baru secara manual. Halaman ini menunjukkan cara melakukan booting ulang pada resource persisten menggunakan Google Cloud konsol dan REST API.

Peran yang diperlukan

Guna mendapatkan izin yang Anda perlukan untuk melakukan booting ulang pada resource persisten, minta administrator Anda untuk memberi Anda peran IAM Vertex AI Administrator (roles/aiplatform.admin) pada project Anda. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin aiplatform.persistentResources.update , yang diperlukan untuk melakukan booting ulang pada resource persisten.

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Melakukan booting ulang pada resource persisten

Pilih salah satu tab berikut ini untuk mengetahui petunjuk cara melakukan booting ulang pada resource persisten. Pastikan tidak ada tugas pelatihan yang berjalan di resource persisten.

Konsol

Untuk melakukan booting ulang pada resource persisten di Google Cloud konsol, lakukan hal berikut:

  1. Di Google Cloud konsol, buka halaman Persistent resources.

    Buka Persistent resources

  2. Di samping nama resource persisten yang ingin Anda lakukan booting ulang, klik elipsis vertikal ().

  3. Klik Reboot.

  4. Klik Confirm.

gcloud

Sebelum menggunakan salah satu data perintah di bawah, lakukan penggantian berikut:

  • PROJECT_ID: Project ID resource persisten yang ingin Anda lakukan booting ulang.
  • LOCATION: Region resource persisten yang ingin Anda lakukan booting ulang.
  • PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda lakukan booting ulang.

Jalankan perintah berikut:

Linux, macOS, atau Cloud Shell

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \
    --project=PROJECT_ID \
    --region=LOCATION

Windows (PowerShell)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID `
    --project=PROJECT_ID `
    --region=LOCATION

Windows (cmd.exe)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^
    --project=PROJECT_ID ^
    --region=LOCATION

Anda akan melihat respons seperti berikut:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent.

You may view the status of your persistent resource with the command

  $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • PROJECT_ID: Project ID resource persisten yang ingin Anda lakukan booting ulang.
  • LOCATION: Region resource persisten yang ingin Anda lakukan booting ulang.
  • PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda lakukan booting ulang.

Metode HTTP dan URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot

Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:

Anda akan melihat respons JSON seperti berikut:

response: 
  {
    "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata",
      "genericMetadata": {
        "createTime": "2024-03-18T17:31:54.955004Z",
        "updateTime": "2024-03-18T17:31:55.204817Z",
        "state": "RUNNING",
        "worksOn": [
          "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource"
        ]
      },
      "progressMessage": "Waiting for persistent resource shut down."
    }
  }

Melakukan booting ulang pada resource persisten adalah a operasi yang berjalan lama, dan selama operasi ini, resource persisten tidak dapat dihapus. Operasi ini berisi kolom progressMessage yang diisi dengan status error jika terjadi error. Setelah operasi menunjukkan "done: true", periksa status resource persisten. Jika resource persisten berada dalam status RUNNING, booting ulang berhasil dan siap untuk menjalankan tugas pelatihan.

Batasan

Berikut adalah batasan untuk melakukan booting ulang pada resource persisten:

  • Dalam beberapa kasus, Anda dapat kehilangan kapasitas resource langka saat melakukan booting ulang pada resource persisten. Retensi resource penuh tidak dijamin.
  • Booting ulang tidak tersedia di Ray di Vertex AI.
  • Resource persisten yang berisi worker pool yang diskalakan otomatis akan melakukan booting ulang dengan jumlah replika minimum.

Langkah berikutnya