RUNNING atau ERROR.
Dengan melakukan booting ulang pada resource persisten, Anda dapat memulihkan diri dari error yang tidak dapat dipulihkan oleh resource persisten itu sendiri. Anda juga dapat melakukan booting ulang pada resource persisten untuk mendapatkan cluster yang lebih baru secara manual. Halaman ini menunjukkan cara melakukan
booting ulang pada resource persisten menggunakan Google Cloud konsol dan REST API.
Peran yang diperlukan
Guna mendapatkan izin yang
Anda perlukan untuk melakukan booting ulang pada resource persisten,
minta administrator Anda untuk memberi Anda peran IAM Vertex AI Administrator (roles/aiplatform.admin) pada project Anda.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin
aiplatform.persistentResources.update
,
yang diperlukan untuk
melakukan booting ulang pada resource persisten.
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Melakukan booting ulang pada resource persisten
Pilih salah satu tab berikut ini untuk mengetahui petunjuk cara melakukan booting ulang pada resource persisten. Pastikan tidak ada tugas pelatihan yang berjalan di resource persisten.
Konsol
Untuk melakukan booting ulang pada resource persisten di Google Cloud konsol, lakukan hal berikut:
Di Google Cloud konsol, buka halaman Persistent resources.
Di samping nama resource persisten yang ingin Anda lakukan booting ulang, klik elipsis vertikal ().
Klik Reboot.
Klik Confirm.
gcloud
Sebelum menggunakan salah satu data perintah di bawah, lakukan penggantian berikut:
- PROJECT_ID: Project ID resource persisten yang ingin Anda lakukan booting ulang.
- LOCATION: Region resource persisten yang ingin Anda lakukan booting ulang.
- PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda lakukan booting ulang.
Jalankan perintah berikut:
Linux, macOS, atau Cloud Shell
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \ --project=PROJECT_ID \ --region=LOCATION
Windows (PowerShell)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ` --project=PROJECT_ID ` --region=LOCATION
Windows (cmd.exe)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^ --project=PROJECT_ID ^ --region=LOCATION
Anda akan melihat respons seperti berikut:
Using endpoint [https://us-central1-aiplatform.googleapis.com/] Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent. You may view the status of your persistent resource with the command $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Project ID resource persisten yang ingin Anda lakukan booting ulang.
- LOCATION: Region resource persisten yang ingin Anda lakukan booting ulang.
- PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda lakukan booting ulang.
Metode HTTP dan URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan melihat respons JSON seperti berikut:
response:{ "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata", "genericMetadata": { "createTime": "2024-03-18T17:31:54.955004Z", "updateTime": "2024-03-18T17:31:55.204817Z", "state": "RUNNING", "worksOn": [ "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource" ] }, "progressMessage": "Waiting for persistent resource shut down." } }
Melakukan booting ulang pada resource persisten adalah a
operasi yang berjalan lama,
dan selama operasi ini, resource persisten tidak dapat dihapus. Operasi ini berisi kolom progressMessage yang diisi dengan status error jika terjadi error. Setelah
operasi menunjukkan "done: true",
periksa status
resource persisten. Jika resource persisten berada dalam status RUNNING, booting ulang berhasil dan siap untuk menjalankan tugas pelatihan.
Batasan
Berikut adalah batasan untuk melakukan booting ulang pada resource persisten:
- Dalam beberapa kasus, Anda dapat kehilangan kapasitas resource langka saat melakukan booting ulang pada resource persisten. Retensi resource penuh tidak dijamin.
- Booting ulang tidak tersedia di Ray di Vertex AI.
- Resource persisten yang berisi worker pool yang diskalakan otomatis akan melakukan booting ulang dengan jumlah replika minimum.
Langkah berikutnya
- Mempelajari resource persisten.
- Membuat dan menggunakan resource persisten.
- Menjalankan tugas pelatihan pada resource persisten.
- Mendapatkan informasi tentang resource persisten.
- Menghapus resource persisten.