Dokumen ini menjelaskan cara membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Gunakan permintaan ini untuk mencadangkan resource yang sangat diminati untuk membuat instance mesin virtual (VM) dengan GPU atau TPU yang terpasang yang berjalan hingga 90 hari.
Anda dapat menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender untuk memesan resource dengan permintaan tinggi guna menjalankan beban kerja berikut:
Tugas pra-pelatihan model
Tugas penyesuaian model
Workload simulasi komputasi berperforma tinggi (HPC)
Peningkatan beban kerja inferensi jangka pendek
Setelah Google Cloud menyetujui permintaan dalam mode kalender, resource yang dicadangkan akan tersedia bagi Anda untuk membuat VM GPU atau TPU pada tanggal dan waktu pengiriman yang Anda tentukan. Untuk mempelajari lebih lanjut persyaratan dan batasan yang Anda terapkan saat membuat permintaan dalam mode kalender, lihat Ringkasan permintaan pemesanan untuk masa mendatang dalam mode kalender.
Sebelum memulai
- Jika Anda tidak dapat menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda mungkin tidak memenuhi syarat untuk mengakses dan menggunakan fitur ini. Dalam hal ini, hubungi tim akun atau tim penjualan Anda.
- Untuk membagikan kapasitas yang dipesan ke project lain dalam organisasi Anda, pastikan project tempat Anda ingin membuat permintaan pemesanan untuk masa mendatang dalam mode kalender diizinkan untuk membuat pemesanan bersama. Jika tidak, Anda akan mengalami error.
-
Siapkan autentikasi, jika Anda belum melakukannya.
Autentikasi memverifikasi identitas Anda untuk mengakses layanan dan API Google Cloud . Untuk menjalankan
kode atau contoh dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke
Compute Engine dengan memilih salah satu opsi berikut:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instal Google Cloud CLI. Setelah penginstalan, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud initJika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
- Set a default region and zone.
REST
Untuk memakai contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.
Instal Google Cloud CLI. Setelah penginstalan, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud initJika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .
Peran yang diperlukan
Untuk mendapatkan izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, minta administrator untuk memberi Anda peran IAM Compute Future Reservation User (
roles/compute.futureReservationUser) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.Peran bawaan ini berisi izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender:
-
Untuk membuat permintaan pemesanan untuk masa mendatang:
compute.futureReservations.createpada project -
Agar Compute Engine dapat membuat pemesanan secara otomatis:
compute.reservations.createpada project -
Untuk menentukan template instance:
compute.instanceTemplates.useReadOnlypada template instance -
Untuk melihat ketersediaan resource pada masa mendatang:
compute.advice.calendarModepada project
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Ringkasan
Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, selesaikan langkah-langkah berikut:
Lihat ketersediaan mendatang resource. Lihat ketersediaan mendatang untuk VM GPU atau TPU yang ingin Anda pesan. Kemudian, saat membuat permintaan, tentukan jumlah, jenis, dan durasi reservasi resource yang telah Anda konfirmasi ketersediaannya. Google Cloud lebih cenderung menyetujui permintaan Anda jika Anda memberikan informasi ini.
Buat permintaan reservasi untuk VM GPU atau TPU. Buat dan kirim permintaan pemesanan di masa mendatang dalam mode kalender untuk VM GPU atau TPU. Jika Anda dapat berhasil membuat permintaan, maka Google Cloud menyetujuinya dalam satu menit.
Melihat ketersediaan resource pada masa mendatang
Anda dapat melihat ketersediaan mendatang untuk VM GPU atau TPU di suatu region sebagai berikut:
Untuk VM GPU, hingga 60 hari sebelumnya
Untuk TPU, hingga 120 hari sebelumnya
Untuk melihat ketersediaan VM GPU atau TPU pada masa mendatang di suatu region, pilih salah satu opsi berikut:
Konsol
Anda dapat melihat ketersediaan GPU VM atau TPU pada masa mendatang di suatu region saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk mengetahui informasi selengkapnya, lihat Membuat permintaan reservasi untuk VM GPU atau TPU dalam dokumen ini.
gcloud
Untuk melihat ketersediaan mendatang VM GPU atau TPU di suatu region, gunakan salah satu perintah
gcloud beta compute advice calendar-modeberikut. Berdasarkan resource yang ingin Anda lihat, sertakan tanda berikut:Untuk melihat ketersediaan VM GPU, sertakan tanda
--vm-countdan--machine-type:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIMEUntuk melihat ketersediaan TPU, sertakan flag
--chip-countdan--tpu-version:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Ganti kode berikut:
NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan. Nilai harus antara1dan80.MACHINE_TYPE: jenis mesin GPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk jenis mesin A4:
a4-highgpu-8gUntuk jenis mesin A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan. Nilainya harus1,4,8,16,32,64,128,256,512, atau1024.TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk TPU v6e:
V6EUntuk TPU v5p:
V5PUntuk TPU v5e:
V5E
Jika Anda menentukan TPU v5e, Anda harus menyertakan flag
--workload-type. Tetapkan flag ini ke jenis beban kerja yang ingin Anda jalankan di TPU:Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan
BATCH.Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan
SERVING.
REGION: region tempat VM GPU atau TPU akan dipesan. Untuk memeriksa region dan zona yang didukung, lihat Batasan.FROM_START_TIMEdanTO_START_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mencadangkan kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETGanti kode berikut:
YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit, yang dipisahkan oleh tanda hubung (-).HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan-08:00. Jika tidak ingin menggunakan offset, tentukanZ.
FROM_END_TIMEdanTO_END_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mengakhiri reservasi kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan rentang durasi untuk periode pemesanan, bukan waktu berakhir, ganti flag--end-time-rangedengan flag--duration-range.
Outputnya mirip dengan hal berikut ini:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'Jika resource yang Anda minta tersedia, output akan berisi kolom
startTime,endTime, danlocation. Kolom ini menentukan waktu mulai paling awal, waktu berakhir paling akhir, dan zona saat resource tersedia.REST
Untuk melihat ketersediaan GPU VM atau TPU pada masa mendatang di suatu region, buat permintaan
GETke metodeadvice.calendarModebeta. Berdasarkan resource yang ingin Anda lihat, sertakan kolom berikut dalam isi permintaan:Untuk melihat ketersediaan VM GPU, sertakan kolom
instanceCountdanmachineType:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }Untuk melihat ketersediaan TPU, sertakan kolom
acceleratorCountdanvmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Ganti kode berikut:
PROJECT_ID: ID project tempat Anda ingin memesan resource.REGION: region tempat Anda ingin memesan VM GPU atau TPU. Untuk memeriksa region dan zona yang didukung, lihat Batasan.NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan. Nilai harus antara1dan80.MACHINE_TYPE: jenis mesin GPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk jenis mesin A4:
a4-highgpu-8gUntuk jenis mesin A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan. Nilainya harus1,4,8,16,32,64,128,256,512, atau1024.TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EUntuk TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PUntuk TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Jika Anda menentukan TPU v5e, maka di kolom
aggregateResources, Anda harus menyertakan kolomworkloadType. Tetapkan kolom ini ke jenis beban kerja yang ingin Anda jalankan di TPU:Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan
BATCH.Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan
SERVING.
FROM_START_TIMEdanTO_START_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mencadangkan kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETGanti kode berikut:
YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit, yang dipisahkan oleh tanda hubung (-).HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan-08:00. Jika tidak ingin menggunakan offset, tentukanZ.
FROM_END_TIMEdanTO_END_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mengakhiri reservasi kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan rentang durasi untuk periode pemesanan, bukan waktu berakhir, ganti kolomendTimeNotEarlierThandanendTimeNotLaterThandengan kolomminDurationdanmaxDuration.
Outputnya mirip dengan hal berikut ini:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }Jika resource yang Anda minta tersedia, output akan berisi kolom
startTime,endTime, danlocation. Kolom ini menentukan waktu mulai paling awal, waktu berakhir paling akhir, dan zona saat resource tersedia.Membuat permintaan reservasi untuk VM GPU atau TPU
Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda hanya dapat menentukan periode pemesanan sebagai berikut:
Waktu mulai: berdasarkan resource yang ingin Anda pesan, Anda harus menentukan waktu mulai yang setidaknya salah satu nilai berikut dari saat Anda membuat dan mengirimkan permintaan:
Untuk VM GPU, 87 jam (tiga hari dan 15 jam)
Untuk TPU, enam jam
Waktu berakhir: Anda dapat memesan resource selama maksimum 90 hari.
Untuk membuat permintaan menggunakan VM GPU yang ada sebagai referensi, gunakan konsolGoogle Cloud . Jika tidak, pilih salah satu opsi berikut:
Konsol
Di konsol Google Cloud , buka halaman Reservations.
Klik tab Future reservations.
Klik Create future reservation. Halaman Create a future reservation akan muncul dan panel Hardware configuration akan dipilih.
Di bagian Configuration, tentukan properti VM GPU atau TPU yang ingin Anda pesan dengan melakukan salah satu hal berikut:
Untuk menentukan properti VM GPU atau TPU secara langsung, selesaikan langkah-langkah berikut:
Pilih Specify machine type.
Klik tab GPU atau TPU, lalu pilih jenis mesin GPU atau versi TPU yang akan dicadangkan.
Untuk menentukan properti VM GPU menggunakan template instance yang ada, pilih Template instance, lalu pilih template.
Untuk menentukan properti VM GPU dengan menggunakan VM yang ada sebagai referensi, pilih Gunakan VM yang ada, lalu pilih VM.
Jika Anda menentukan TPU v5e (CT5LP) pada langkah sebelumnya, pilih salah satu opsi berikut di daftar TPU v5 workload type:
Untuk menjalankan workload di TPU yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan ML, pilih Batch.
Untuk menjalankan beban kerja di TPU yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti beban kerja inferensi ML, pilih Penayangan.
Di bagian Search for capacity, selesaikan langkah-langkah berikut:
Dalam daftar Region dan Zone, tentukan region dan zona tempat Anda ingin memesan resource. Untuk meninjau region dan zona yang didukung, lihat Batasan.
Di kolom Total capacity needed (saat memesan VM GPU) atau daftar Number of chips (saat memesan TPU), tentukan jumlah VM GPU atau chip TPU yang akan dipesan. Anda dapat menentukan nilai berikut:
Untuk VM GPU, nilai antara
1dan80Untuk chip TPU, nilai
1,4,8,16,32,64,128,256,512, atau1024
Dalam daftar Waktu mulai, pilih waktu mulai untuk permintaan Anda.
Opsional: Di daftar Pilih fleksibilitas tanggal mulai Anda, pilih seberapa tepat tanggal mulai Anda.
Di kolom Reservation duration, tentukan berapa lama Anda ingin memesan resource.
Klik Telusuri kapasitas. Kemudian, di tabel Kapasitas yang tersedia, pilih salah satu opsi yang tersedia yang berisi jenis, jumlah, dan periode reservasi VM GPU atau TPU yang akan dipesan.
Klik Berikutnya.
Di bagian Jenis berbagi, pilih project untuk membagikan kapasitas yang diminta:
Untuk menggunakan kapasitas yang dicadangkan hanya dalam project Anda, pilih Lokal.
Untuk membagikan kapasitas yang dicadangkan dengan project lain, pilih Dibagikan, klik Tambahkan project, lalu ikuti perintah untuk memilih project.
Klik Berikutnya.
Di kolom Nama pemesanan untuk masa mendatang, masukkan nama untuk permintaan.
Di kolom Reservation name, masukkan nama pemesanan yang dibuat Compute Engine secara otomatis untuk menyediakan kapasitas yang Anda minta.
Klik Buat.
gcloud
Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender dan mengirimkannya untuk ditinjau, gunakan salah satu perintah
gcloud beta compute future-reservations createberikut. Berdasarkan resource yang ingin Anda cadangkan, sertakan tanda berikut:Untuk memesan VM GPU, sertakan tanda
--total-count,--machine-type, dan--deployment-type=DENSE:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONEUntuk memesan TPU, sertakan flag
--chip-countdan--tpu-version:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Ganti kode berikut:
FUTURE_RESERVATION_NAME: nama permintaan.NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan. Nilai harus antara1dan80.MACHINE_TYPE: jenis mesin GPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk jenis mesin A4:
a4-highgpu-8gUntuk jenis mesin A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan. Nilainya harus1,4,8,16,32,64,128,256,512, atau1024.TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk TPU v6e:
V6EUntuk TPU v5p:
V5PUntuk TPU v5e:
V5E
Jika Anda menentukan TPU v5e, Anda harus menyertakan flag
--workload-type. Tetapkan tanda ke jenis beban kerja yang ingin Anda jalankan di TPU:Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan
BATCH.Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan
SERVING.
RESERVATION_NAME: nama reservasi yang dibuat secara otomatis oleh Compute Engine untuk menyediakan kapasitas yang Anda minta.SHARE_TYPE: apakah project lain dalam organisasi Anda dapat menggunakan kapasitas yang dipesan. Tentukan salah satu nilai berikut:Untuk menggunakan kapasitas hanya dalam project Anda:
localUntuk membagikan kapasitas dengan project lain:
projects
Jika Anda menentukan
projects, Anda harus menyertakan flag--share-withyang ditetapkan ke daftar project ID yang dipisahkan koma—misalnya,project-1,project-2. Anda dapat menentukan hingga 100 project dalam organisasi Anda. Jangan sertakan project ID Anda dalam daftar ini. Anda dapat menggunakan kapasitas yang dicadangkan secara default.START_TIME: waktu mulai permintaan, diformat sebagai stempel waktu RFC 3339.END_TIME: waktu berakhir periode pemesanan Anda, yang diformat sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan durasi, dalam detik, untuk periode pemesanan, bukan waktu berakhir, maka ganti flag--end-timedengan flag--duration.ZONE: zona tempat Anda ingin memesan resource.
REST
Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender dan mengirimkannya untuk ditinjau, kirim permintaan
POSTberikut ke metode betafutureReservations.insert. Berdasarkan resource yang ingin Anda pesan, sertakan kolom berikut dalam isi permintaan:Untuk memesan VM GPU, sertakan kolom
totalCountdanmachineType, serta kolomdeploymentTypeyang ditetapkan keDENSE:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }Untuk memesan TPU, sertakan kolom
acceleratorCountdanvmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Ganti kode berikut:
PROJECT_ID: ID project tempat Anda ingin membuat permintaan.ZONE: zona tempat Anda ingin memesan resource.FUTURE_RESERVATION_NAME: nama permintaan.RESERVATION_NAME: nama reservasi yang dibuat secara otomatis oleh Compute Engine untuk menyediakan kapasitas yang Anda minta.SHARE_TYPE: apakah project lain dalam organisasi Anda dapat menggunakan kapasitas yang dipesan. Tentukan salah satu nilai berikut:Untuk menggunakan kapasitas hanya dalam project Anda:
LOCALUntuk membagikan kapasitas dengan project lain:
SPECIFIC_PROJECTS
Jika Anda menentukan
SPECIFIC_PROJECTS, maka di kolomshareSettings, Anda harus menyertakan kolomprojectMapuntuk menentukan project yang akan berbagi kapasitas. Anda dapat menentukan hingga 100 project dalam organisasi Anda. Jangan tentukan project ID Anda. Anda dapat menggunakan kapasitas yang dicadangkan secara default.Misalnya, untuk membagikan kapasitas yang diminta ke dua project lain, sertakan yang berikut:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }Ganti
CONSUMER_PROJECT_ID_1danCONSUMER_PROJECT_ID_2dengan ID dua project yang ingin Anda izinkan untuk menggunakan kapasitas yang diminta.NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan. Nilai harus antara1dan80.MACHINE_TYPE: jenis mesin GPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk jenis mesin A4:
a4-highgpu-8gUntuk jenis mesin A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan. Nilainya harus1,4,8,16,32,64,128,256,512, atau1024.TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:Untuk TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EUntuk TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PUntuk TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Jika Anda menentukan TPU v5e, maka di kolom
aggregateResources, Anda harus menyertakan kolomworkloadType. Tetapkan kolom ke jenis beban kerja yang ingin Anda jalankan di TPU:Untuk beban kerja yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti beban kerja pelatihan ML, tentukan
BATCH.Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan
SERVING.
START_TIME: waktu mulai permintaan, diformat sebagai stempel waktu RFC 3339.END_TIME: waktu berakhir periode pemesanan Anda, yang diformat sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan durasi, dalam detik, untuk periode pemesanan, bukan waktu berakhir, maka ganti kolomendTimedengan kolomduration.
Langkah berikutnya
Menggunakan reservasi yang dibuat otomatis untuk VM GPU di Compute Engine
Menggunakan pemesanan yang dibuat otomatis untuk TPU di Cloud TPU
Menggunakan reservasi yang dibuat otomatis dengan menggunakan tugas prediksi Vertex AI
Menggunakan reservasi yang dibuat otomatis dengan menggunakan tugas pelatihan Vertex AI
Melihat pemesanan atau permintaan pemesanan untuk masa mendatang
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-10-19 UTC.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-10-19 UTC."],[],[]] -