Dokumen ini menjelaskan cara membuat instance Compute Engine mandiri menggunakan model penyediaan terikat reservasi. Model penyediaan ini memungkinkan Anda membuat instance A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High dengan 8 GPU, A3 Edge, atau H4D dengan menggunakan kapasitas yang telah dipesan.
Untuk metode lain dalam membuat instance komputasi menggunakan model penyediaan terikat reservasi, lihat Ringkasan opsi deployment dalam dokumentasi AI Hypercomputer.
Sebelum memulai
-
Siapkan autentikasi jika Anda belum melakukannya.
Autentikasi memverifikasi identitas Anda untuk mengakses Google Cloud layanan dan API. Untuk menjalankan
kode atau contoh dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke
Compute Engine dengan memilih salah satu opsi berikut:
Pilih tab untuk melihat bagaimana Anda berencana menggunakan contoh di halaman ini:
Konsol
Saat menggunakan Google Cloud konsol untuk mengakses Google Cloud layanan dan API, Anda tidak perlu menyiapkan autentikasi.
gcloud
-
Instal Google Cloud CLI. Setelah penginstalan, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud initJika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu .
-
- Tetapkan region dan zona default.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.
Instal Google Cloud CLI.
Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu .
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi. Google Cloud
Peran yang diperlukan
Untuk mendapatkan izin yang
Anda perlukan untuk membuat instance komputasi menggunakan model penyediaan terikat reservasi,
minta administrator untuk memberi Anda peran IAM
Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) pada project.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran yang telah ditentukan ini berisi izin yang diperlukan untuk membuat instance komputasi menggunakan model penyediaan terikat reservasi. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk membuat instance komputasi menggunakan model penyediaan terikat reservasi:
-
compute.instances.createdi project -
Untuk menggunakan image kustom guna membuat VM:
compute.images.useReadOnlydi image -
Untuk menggunakan snapshot guna membuat VM:
compute.snapshots.useReadOnlydi snapshot -
Untuk menggunakan template instance guna membuat VM:
compute.instanceTemplates.useReadOnlydi template instance -
Untuk menentukan subnet bagi VM Anda:
compute.subnetworks.usedi project atau di subnet yang dipilih -
Untuk menentukan alamat IP statis bagi VM:
compute.addresses.usedi project -
Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan VPC:
compute.subnetworks.useExternalIpdi project atau di subnet yang dipilih -
Untuk menetapkan jaringan lama ke VM:
compute.networks.usedi project -
Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan lama:
compute.networks.useExternalIpdi project -
Untuk menetapkan metadata instance VM bagi VM:
compute.instances.setMetadatadi project -
Untuk menetapkan tag bagi VM:
compute.instances.setTagsdi VM -
Untuk menetapkan label bagi VM:
compute.instances.setLabelsdi VM -
Untuk menetapkan akun layanan bagi VM yang akan digunakan:
compute.instances.setServiceAccountdi VM -
Untuk membuat disk baru bagi VM:
compute.disks.createdi project -
Untuk melampirkan disk yang sudah ada dalam mode baca-saja atau baca-tulis:
compute.disks.usedi disk -
Untuk melampirkan disk yang sudah ada dalam mode baca-saja:
compute.disks.useReadOnlydi disk
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Membuat instance yang menggunakan model penyediaan terikat reservasi
Untuk membuat instance A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High dengan 8 GPU, atau H4D menggunakan model penyediaan terikat reservasi, Anda harus menunggu hingga reservasi yang dibuat otomatis dan ingin Anda gunakan mencapai waktu mulainya. Selain itu, instance komputasi yang ingin Anda buat harus memenuhi semua persyaratan berikut:
Instance komputasi dan reservasi harus memiliki properti yang cocok.
Instance komputasi harus secara khusus menargetkan reservasi untuk penggunaan.
Instance komputasi harus dihentikan atau dihapus pada waktu berakhirnya reservasi.
Contoh berikut membuat permintaan reservasi untuk masa mendatang dalam mode kalender untuk lima instance A3 Ultra, lalu membuat instance A3 Ultra dengan menggunakan reservasi yang dibuat otomatis untuk permintaan tersebut.
Untuk membuat contoh instance komputasi menggunakan model penyediaan terikat reservasi, pilih salah satu opsi berikut:
Konsol
Buat contoh permintaan untuk lima instance A3 Ultra dan kirimkan untuk ditinjau:
Di Google Cloud konsol, buka halaman Reservations.
Klik tab Future reservations.
Klik Create future reservation. Halaman Create a future reservation akan muncul.
Klik tab GPUs, lalu, dalam daftar GPU type, pilih NVIDIA H200 141GB. Tindakan ini menentukan instance A3 Ultra.
Di kolom Total capacity needed, masukkan
5.Di bagian Reservation period, tentukan waktu mulai dan durasi untuk periode reservasi Anda.
Klik Search for capacity, lalu, di bagian Available capacity, pilih salah satu mesin yang tersedia.
Klik Create.
Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh reservasi yang dibuat otomatis, lakukan hal berikut:
Di Google Cloud konsol, buka halaman Create an instance.
Di kolom Name, masukkan nama untuk instance komputasi. Untuk contoh ini, masukkan
example-instance.Tentukan Region dan Zone tempat reservasi yang dibuat otomatis berada. Untuk contoh ini, pilih us-central1 dan us-central1-b.
Klik tab GPUs, lalu, dalam daftar GPU type, pilih NVIDIA H200 141GB. Tindakan ini menentukan instance A3 Ultra dan menetapkan model penyediaan ke Reservation-bound.
Di menu navigasi, klik Advanced.
Di bagian Reservations, pilih Choose a reservation, lalu klik Choose a reservation.
Di panel Choose a reservation, lakukan hal berikut:
Pilih contoh reservasi yang dibuat otomatis.
Klik Choose.
Di bagian Provisioning model, luaskan bagian VM provisioning model advanced settings.
Dalam daftar On VM termination, pilih Stop (default) atau Delete.
Klik Create.
gcloud
Untuk membuat contoh permintaan untuk lima instance A3 Ultra dan mengirimkannya untuk ditinjau, gunakan
gcloud beta compute future-reservations createperintah:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bAsumsikan bahwa Google Cloud menyetujui permintaan dan Compute Engine otomatis membuat reservasi kosong. Pada waktu mulai permintaan, 5 Maret 2026, Compute Engine akan meningkatkan jumlah instance GPU yang dipesan dalam reservasi. Kemudian, Anda dapat menggunakan reservasi tersebut.
Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh reservasi yang dibuat otomatis, gunakan perintah
gcloud compute instances createcommand dengan flag berikut:Flag
--instance-termination-action.Flag
--provisioning-modelyang ditetapkan keRESERVATION_BOUND.Flag
--reservation.Flag
--reservation-affinityyang ditetapkan kespecific.
Perintah ini mirip dengan perintah berikut. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...Perintah ini mencakup nilai berikut:
TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance komputasi pada akhir periode reservasi.RESERVATION_URL: URL reservasi, yang diformat sebagai berikut:Jika reservasi yang dibuat otomatis ada di project Anda:
example-reservation.Jika reservasi yang dibuat otomatis ada di project lain:
projects/PROJECT_ID/reservations/example-reservation.
REST
Untuk membuat contoh permintaan untuk lima instance A3 Ultra dan mengirimkannya untuk ditinjau, buat permintaan
POSTke metodefutureReservations.insertbeta:POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }Asumsikan bahwa Google Cloud menyetujui permintaan dan Compute Engine otomatis membuat reservasi kosong. Pada waktu mulai permintaan, 5 Maret 2026, Compute Engine akan meningkatkan jumlah instance GPU yang dipesan dalam reservasi. Kemudian, Anda dapat menggunakan reservasi tersebut.
Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh reservasi yang dibuat otomatis, buat permintaan
POSTkeinstances.insertmetode. Di isi permintaan, sertakan kolom berikut:Kolom
reservationAffinity.consumeReservationTypeyang ditetapkan keSPECIFIC_RESERVATION.Kolom
reservationAffinity.keyyang ditetapkan kecompute.googleapis.com/reservation-name.Kolom
reservationAffinity.valuesyang ditetapkan ke URL reservasi.Kolom
scheduling.instanceTerminationAction.Kolom
scheduling.provisioningModelyang ditetapkan keRESERVATION_BOUND.
Permintaan ini mirip dengan permintaan berikut. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }Isi permintaan mencakup nilai berikut:
RESERVATION_URL: URL reservasi, yang diformat sebagai berikut:Jika reservasi yang dibuat otomatis ada di project Anda:
example-reservation.Jika reservasi yang dibuat otomatis ada di project lain:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance komputasi pada akhir periode reservasi.
Langkah berikutnya
Coba sendiri
Jika Anda baru pertama kali menggunakan Google Cloud, buat akun untuk mengevaluasi performa Compute Engine dalam skenario dunia nyata. Pelanggan baru juga akan mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
Coba Compute Engine gratis