Dokumen ini menjelaskan cara mendapatkan kapasitas saat Anda ingin menggunakan pemesanan mendatang dalam opsi penggunaan AI Hypercomputer. Untuk mempelajari semua opsi kapasitas di AI Hypercomputer, lihat Ringkasan kapasitas.
Untuk mendapatkan jaminan yang sangat tinggi bahwa workload Anda memiliki resource yang dibutuhkan, minta pemesanan untuk masa mendatang dari Google. Tindakan ini memungkinkan Anda memesan blok kapasitas untuk durasi yang ditentukan, mulai pada tanggal dan waktu tertentu yang Anda pilih. Berdasarkan permintaan Anda, Google akan membuat draf permintaan pemesanan untuk masa mendatang. Setelah Anda meninjau dan mengirimkan permintaan draf ini, dan Google Cloud menyetujuinya, Compute Engine akan otomatis membuat (membuat secara otomatis) pemesanan kosong. Kemudian, pada waktu mulai yang Anda pilih, Compute Engine akan menyediakan kapasitas yang Anda minta ke dalam pemesanan yang dibuat otomatis. Kemudian, Anda dapat menggunakan reservasi untuk membuat instance Compute Engine hingga periode reservasi berakhir.
Batasan
Bagian ini menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang, dan untuk pemesanan yang dibuat otomatis untuk permintaan.
Batasan untuk permintaan pemesanan untuk masa mendatang
Setelah Google membuat draf permintaan pemesanan untuk masa mendatang bagi Anda, batasan berikut berlaku:
- Anda tidak dapat mengubah detail permintaan, termasuk jenis berbagi.
- Setelah permintaan dikirim, disetujui, dan statusnya berubah menjadi
PROVISIONING, Anda tidak dapat membatalkan atau menghapusnya. Anda berkomitmen untuk membayar kapasitas yang diminta sejak waktu mulai permintaan, terlepas dari penggunaan.
Batasan untuk pemesanan yang dibuat otomatis
Setelah Compute Engine membuat pemesanan on-demand untuk memenuhi kapasitas yang Anda minta, batasan berikut berlaku:
- Anda hanya dapat menggunakan atau mengubah pemesanan setelah waktu mulai permintaan.
-
Anda hanya dapat mengubah pemesanan sebagai berikut:
- Mengaktifkan atau menonaktifkan penggunaan reservasi di Vertex AI
- Aktifkan notifikasi pemeliharaan darurat hardware
Untuk mengubah properti lain dalam pemesanan, Anda harus menghubungi tim akun Anda.
- Anda tidak dapat menghapus reservasi secara manual. Jika, saat memesan kapasitas, Anda menentukan bahwa Anda tidak ingin menghapus pemesanan secara otomatis di akhir periode pemesanannya, maka Anda harus menghubungi tim akun Anda untuk menghapus pemesanan tersebut.
Sebelum memulai
Jika belum, tinjau konfigurasi VM dan cluster yang tersedia.
-
Pilih tab untuk melihat bagaimana Anda berencana menggunakan contoh di halaman ini:
Konsol
Saat menggunakan konsol Google Cloud untuk mengakses layanan Google Cloud dan API, Anda tidak perlu menyiapkan autentikasi.
gcloud
Di konsol Google Cloud , aktifkan Cloud Shell.
Di bagian bawah konsol Google Cloud , sesi Cloud Shell akan dimulai dan menampilkan perintah command line. Cloud Shell adalah lingkungan shell dengan Google Cloud CLI yang sudah terinstal, dan dengan nilai yang sudah ditetapkan untuk project Anda saat ini. Diperlukan waktu beberapa detik untuk melakukan inisialisasi pada sesi.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.
Instal Google Cloud CLI.
Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .
Peran yang diperlukan
Untuk mendapatkan izin yang
diperlukan guna membuat permintaan pemesanan untuk masa mendatang,
minta administrator untuk memberi Anda peran IAM
Compute Future Reservation User (roles/compute.futureReservationUser)
di project.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk membuat permintaan pemesanan untuk masa mendatang:
-
Agar Compute Engine dapat membuat pemesanan secara otomatis:
compute.reservations.createpada project -
Untuk membuat permintaan pemesanan untuk masa mendatang:
compute.futureReservations.createpada project -
Untuk menentukan template instance:
compute.instanceTemplates.useReadOnlypada template instance
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Kuota
Sebagai bagian dari proses permintaan pemesanan untuk masa mendatang, Google mengelola kuota untuk resource yang Anda pesan. Anda tidak perlu meminta kuota. Pada waktu mulai pemesanan untuk masa mendatang yang disetujui, Google akan otomatis menambah kuota Anda jika project Anda tidak memiliki kuota yang cukup untuk resource yang dipesan.
Ringkasan
Untuk memesan blok kapasitas, selesaikan langkah-langkah berikut:
- Minta kapasitas melalui tim akun Anda. Hubungi tim akun Anda untuk menentukan jenis dan jumlah resource yang ingin Anda pesan.
- Tinjau dan kirimkan draf permintaan pemesanan. Setelah Google membuat draf permintaan pemesanan untuk masa mendatang, tinjau draf tersebut. Jika sudah benar, kirim permintaan peninjauan. Google Cloud langsung menyetujuinya.
Meminta kapasitas melalui tim akun Anda
Hubungi tim akun Anda dan berikan informasi berikut agar Google dapat membuat draf permintaan pemesanan untuk masa mendatang:
- Nomor project: nomor project tempat tim akun Anda membuat permintaan dan Compute Engine menyediakan kapasitas.
- Jenis mesin: jenis mesin yang akan dicadangkan. Anda dapat menentukan salah satu opsi berikut:
- A4X Max (
a4x-maxgpu-4g-metal) - A4X (
a4x-highgpu-4g) - A4 (
a4-highgpu-8g) - A3 Ultra (
a3-ultragpu-8g) - A3 Mega (
a3-megagpu-8g) - A3 Tinggi (
a3-highgpu-8g)
- A4X Max (
- Zone: zona tempat Anda ingin memesan kapasitas. Untuk meninjau region dan zona yang tersedia untuk jenis mesin GPU, lihat Ketersediaan akselerator.
- Total jumlah: total jumlah instance komputasi yang akan dicadangkan. Anda hanya dapat memesan beberapa instance komputasi kelipatan dua. Ukuran blok dan jumlah instance komputasi per blok bervariasi berdasarkan jenis mesin dan ketersediaan. Tim akun Anda dapat memberikan detail selengkapnya untuk permintaan Anda.
- Waktu mulai: waktu mulai periode pemesanan. Anda dapat mulai menggunakan kapasitas yang dicadangkan pada saat itu. Format waktu mulai sebagai stempel waktu RFC 3339 sebagai berikut:
YYYY-MM-DDTHH:MM:SSOFFSET
Ganti kode berikut:
YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit dalam sebulan, yang dipisahkan oleh tanda hubung (-).HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan-08:00. Untuk tidak menggunakan offset, tentukanZ.
- Waktu berakhir: waktu berakhir periode pemesanan. Format sebagai stempel waktu RFC 3339. Pada
saat itu, Compute Engine melakukan hal berikut:
- Compute Engine menghapus pemesanan yang dibuat otomatis.
- Berdasarkan tindakan penghentian yang Anda tentukan untuk instance komputasi, Compute Engine akan menghentikan atau menghapus instance komputasi yang Anda buat menggunakan pemesanan yang dibuat otomatis.
- Nama pemesanan: nama pemesanan yang dibuat Compute Engine untuk memberikan kapasitas yang dipesan. Compute Engine hanya dapat membuat reservasi yang ditargetkan secara khusus.
- Penghapusan otomatis pemesanan: apakah Anda ingin Compute Engine menghapus pemesanan yang dibuat otomatis secara otomatis di akhir periode pemesanan. Jika Anda ingin menghapus pemesanan secara manual, Anda harus menghubungi tim akun untuk menghapus pemesanan.
- Jenis penjadwalan pemeliharaan: cara Compute Engine menjadwalkan pemeliharaan host untuk
instance komputasi di cluster Anda. Tentukan
salah satu opsi berikut:
- Untuk menyinkronkan pemeliharaan di semua instance A4X Max, A4X, A4, atau A3 Ultra dalam blok yang dicadangkan, gunakan
GROUPED. - Untuk menggunakan jadwal pemeliharaan yang berbeda untuk instance A4 atau A3 Ultra, gunakan
INDEPENDENT.
- Untuk menyinkronkan pemeliharaan di semua instance A4X Max, A4X, A4, atau A3 Ultra dalam blok yang dicadangkan, gunakan
- Mode operasional reservasi: apakah Anda atau Google Cloud mengelola proses pemulihan instance komputasi setelah terjadi error host atau laporan host yang rusak. Mode yang Anda gunakan bergantung
pada jenis mesin yang Anda pesan:
- Semua mode kapasitas (
ALL_CAPACITY). Mode ini hanya untuk jenis mesin A4X Max dan A4X. Anda harus mengelola proses pemeliharaan dan pemulihan instance komputasi secara manual. Namun, Anda memiliki akses penuh ke semua mesin dalam reservasi, serta kontrol yang lebih terperinci atas topologi dan pemeliharaan instance komputasi. - Mode terkelola (
HIGHLY_AVAILABLE_CAPACITY). Mode ini hanya untuk jenis mesin A4, A3 Ultra, A3 Mega, dan A3 High. Anda mengizinkan Google Cloud mengelola proses pemeliharaan dan pemulihan untuk instance komputasi dengan mengganti mesin yang rusak secara otomatis. Pendekatan ini meningkatkan ketersediaan instance komputasi Anda dan membantu Anda memulainya kembali dengan cepat di host baru. Namun, topologi instance komputasi Anda mungkin berubah setelah Compute Engine mengganti mesin.
- Semua mode kapasitas (
- Jenis berbagi: apakah hanya project Anda yang dapat menggunakan pemesanan yang dibuat otomatis (
LOCAL), atau project lain dapat menggunakan pemesanan tersebut (SPECIFIC_PROJECTS). Properti ini tidak dapat diubah setelah Anda mengirimkan permintaan. Untuk membagikan kapasitas yang dipesan ke project lain di organisasi Anda, lakukan langkah-langkah berikut:- Jika belum, pastikan project tempat Google membuat permintaan diizinkan untuk membuat pemesanan bersama.
- Berikan nomor project yang akan menggunakan kapasitas yang dicadangkan. Anda dapat menentukan hingga 100 project di organisasi Anda.
Nama komitmen: jika periode reservasi Anda adalah satu tahun atau lebih, Anda harus membeli dan melampirkan komitmen berbasis resource ke resource yang Anda pesan. Untuk periode reservasi dari 1 tahun hingga kurang dari 3 tahun, komitmen memberi Anda tarif diskon abonemen (CUD) 1 tahun. Untuk periode reservasi dari 3 tahun hingga di bawah 6 tahun, komitmen ini memberikan tarif CUD 3 tahun.
Jika Anda membagikan kapasitas yang dicadangkan dengan project lain, project tersebut hanya akan mendapatkan diskon jika menggunakan akun Penagihan Cloud yang sama dengan project tempat Anda mencadangkan kapasitas. Untuk detailnya, lihat Mengaktifkan berbagi DA untuk komitmen berbasis resource.
Komitmen memiliki tanggal mulai dan akhir yang sama dengan reservasi Anda, tetapi waktu aktivasi mungkin berbeda. Jika Anda menentukan waktu mulai reservasi sebagai pukul 00.00 Waktu Pasifik AS dan Kanada, maka komitmen akan aktif pada pukul 00.00 pada tanggal mulai yang Anda pilih. Jika Anda menentukan waktu mulai yang berbeda, maka komitmen akan aktif pada pukul 00.00 pada hari berikutnya dari tanggal mulai yang Anda pilih.
Setelah Google membuat draf permintaan pemesanan untuk masa mendatang, tim akun Anda akan menghubungi Anda.
Meninjau dan mengirimkan draf permintaan pemesanan
Setelah Anda memberikan jenis dan jumlah resource yang akan dipesan kepada tim akun Anda, Google akan membuat draf permintaan pemesanan untuk masa mendatang. Anda dapat meninjau permintaan draf dan, jika sudah benar, mengirimkannya untuk ditinjau. Anda harus mengirimkan permintaan sebelum waktu mulai permintaan.
Untuk meninjau dan mengirimkan draf permintaan pemesanan untuk masa mendatang, pilih salah satu opsi berikut:
Konsol
Di konsol Google Cloud , buka halaman Reservations.
- Klik tab Future reservations. Tabel Future Reservations mencantumkan setiap permintaan pemesanan untuk masa mendatang di project Anda, dan setiap kolom tabel menjelaskan properti.
- Di kolom Name, klik nama draf permintaan yang dibuat Google untuk Anda. Halaman yang memberikan detail permintaan pemesanan untuk masa mendatang akan terbuka.
- Di bagian Informasi dasar, pastikan detail permintaan, seperti Tanggal dan Jenis berbagi, sudah benar. Selain itu, jika Anda meminta komitmen, pastikan komitmen tersebut ditentukan. Jika ada detail yang salah, hubungi tim akun Anda.
Jika semuanya sudah akurat, kirim permintaan Anda:
- Klik Edit draft. Halaman untuk mengubah permintaan draf akan muncul.
- Klik Create. Halaman Reservation akan muncul. Google Cloud menyetujui permintaan Anda dalam beberapa menit, lalu Compute Engine akan membuat pemesanan kosong dengan resource yang Anda minta.
gcloud
- Untuk melihat daftar permintaan pemesanan untuk masa mendatang di project Anda, gunakan
perintah
gcloud compute future-reservations listdengan flag--filteryang ditetapkan kePROCUREMENT_STATUS=DRAFTING:gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- Di output perintah, cari permintaan reservasi yang memiliki nama yang Anda berikan kepada tim akun Anda.
- Untuk melihat detail permintaan draf, gunakan
perintah
gcloud compute future-reservations describe:gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONEGanti kode berikut:
FUTURE_RESERVATION_NAME: nama draf permintaan pemesanan untuk masa mendatang.ZONE: zona tempat Google membuat permintaan.
Outputnya mirip dengan hal berikut ini:
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b - Di output perintah, verifikasi bahwa detail permintaan, seperti periode reservasi dan jenis berbagi, sudah benar. Selain itu, jika Anda membeli komitmen, pastikan komitmen tersebut ditentukan. Jika detailnya salah, hubungi tim akun Anda.
- Untuk mengirimkan draf permintaan untuk ditinjau, gunakan
perintah
gcloud compute future-reservations updatedengan flag--planning-statusyang ditetapkan keSUBMITTED:gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONEDalam beberapa menit, Google Cloud akan menyetujui permintaan Anda, lalu Compute Engine akan membuat pemesanan kosong dengan resource yang Anda minta.
REST
- Untuk melihat daftar permintaan pemesanan untuk masa mendatang dalam project Anda, buat permintaan
GETke metodefutureReservations.list. Di URL permintaan, sertakan parameter kuerifilterdan tetapkan kestatus.procurementStatus=DRAFTING:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
Ganti kode berikut:
PROJECT_ID: ID project tempat Google membuat draf permintaan pemesanan untuk masa mendatang.ZONE: zona tempat permintaan berada.
- Dalam output permintaan, cari permintaan reservasi yang memiliki nama yang Anda berikan kepada tim akun Anda.
- Untuk melihat detail permintaan draf, buat permintaan
GETke metode betafutureReservations.get:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
Ganti
FUTURE_RESERVATION_NAMEdengan nama permintaan pemesanan untuk masa mendatang versi draf.Outputnya mirip dengan hal berikut ini:
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - Dalam output, pastikan detail permintaan, seperti periode pemesanan dan jenis berbagi, sudah benar. Selain itu, jika Anda meminta komitmen, pastikan komitmen tersebut ditentukan. Jika detailnya salah, hubungi tim akun Anda.
- Untuk mengirimkan draf permintaan untuk ditinjau, buat permintaan
PATCHke metode betafutureReservations.update. Di URL permintaan, sertakan parameter kueriupdateMaskdan tetapkan keplanningStatus:PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }Dalam beberapa menit, Google Cloud akan menyetujui permintaan Anda, lalu Compute Engine membuat pemesanan kosong dengan resource yang Anda minta.