Mencadangkan kapasitas melalui tim akun Anda

Dokumen ini menjelaskan cara mendapatkan kapasitas saat Anda ingin menggunakan pemesanan mendatang dalam opsi penggunaan AI Hypercomputer. Untuk mempelajari semua opsi kapasitas di AI Hypercomputer, lihat Ringkasan kapasitas.

Untuk mendapatkan jaminan yang sangat tinggi bahwa workload Anda memiliki resource yang dibutuhkan, minta pemesanan untuk masa mendatang dari Google. Tindakan ini memungkinkan Anda memesan blok kapasitas untuk durasi yang ditentukan, mulai pada tanggal dan waktu tertentu yang Anda pilih. Berdasarkan permintaan Anda, Google akan membuat draf permintaan pemesanan untuk masa mendatang. Setelah Anda meninjau dan mengirimkan permintaan draf ini, dan Google Cloud menyetujuinya, Compute Engine akan otomatis membuat (membuat secara otomatis) pemesanan kosong. Kemudian, pada waktu mulai yang Anda pilih, Compute Engine akan menyediakan kapasitas yang Anda minta ke dalam pemesanan yang dibuat otomatis. Kemudian, Anda dapat menggunakan reservasi untuk membuat instance Compute Engine hingga periode reservasi berakhir.

Batasan

Bagian ini menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang, dan untuk pemesanan yang dibuat otomatis untuk permintaan.

Batasan untuk permintaan pemesanan untuk masa mendatang

Setelah Google membuat draf permintaan pemesanan untuk masa mendatang bagi Anda, batasan berikut berlaku:

  • Anda tidak dapat mengubah detail permintaan, termasuk jenis berbagi.
  • Setelah permintaan dikirim, disetujui, dan statusnya berubah menjadi PROVISIONING, Anda tidak dapat membatalkan atau menghapusnya. Anda berkomitmen untuk membayar kapasitas yang diminta sejak waktu mulai permintaan, terlepas dari penggunaan.

Batasan untuk pemesanan yang dibuat otomatis

Setelah Compute Engine membuat pemesanan on-demand untuk memenuhi kapasitas yang Anda minta, batasan berikut berlaku:

  • Anda hanya dapat menggunakan atau mengubah pemesanan setelah waktu mulai permintaan.
  • Anda hanya dapat mengubah pemesanan sebagai berikut:

    Untuk mengubah properti lain dalam pemesanan, Anda harus menghubungi tim akun Anda.

  • Anda tidak dapat menghapus reservasi secara manual. Jika, saat memesan kapasitas, Anda menentukan bahwa Anda tidak ingin menghapus pemesanan secara otomatis di akhir periode pemesanannya, maka Anda harus menghubungi tim akun Anda untuk menghapus pemesanan tersebut.

Sebelum memulai

  • Jika belum, tinjau konfigurasi VM dan cluster yang tersedia.

  • Pilih tab untuk melihat bagaimana Anda berencana menggunakan contoh di halaman ini:

    Konsol

    Saat menggunakan konsol Google Cloud untuk mengakses layanan Google Cloud dan API, Anda tidak perlu menyiapkan autentikasi.

    gcloud

    Di konsol Google Cloud , aktifkan Cloud Shell.

    Aktifkan Cloud Shell

    Di bagian bawah konsol Google Cloud , sesi Cloud Shell akan dimulai dan menampilkan perintah command line. Cloud Shell adalah lingkungan shell dengan Google Cloud CLI yang sudah terinstal, dan dengan nilai yang sudah ditetapkan untuk project Anda saat ini. Diperlukan waktu beberapa detik untuk melakukan inisialisasi pada sesi.

    REST

    Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

      Instal Google Cloud CLI.

      Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.

    Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna membuat permintaan pemesanan untuk masa mendatang, minta administrator untuk memberi Anda peran IAM Compute Future Reservation User (roles/compute.futureReservationUser) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat permintaan pemesanan untuk masa mendatang:

  • Agar Compute Engine dapat membuat pemesanan secara otomatis: compute.reservations.create pada project
  • Untuk membuat permintaan pemesanan untuk masa mendatang: compute.futureReservations.create pada project
  • Untuk menentukan template instance: compute.instanceTemplates.useReadOnly pada template instance

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Kuota

Sebagai bagian dari proses permintaan pemesanan untuk masa mendatang, Google mengelola kuota untuk resource yang Anda pesan. Anda tidak perlu meminta kuota. Pada waktu mulai pemesanan untuk masa mendatang yang disetujui, Google akan otomatis menambah kuota Anda jika project Anda tidak memiliki kuota yang cukup untuk resource yang dipesan.

Ringkasan

Untuk memesan blok kapasitas, selesaikan langkah-langkah berikut:

  1. Minta kapasitas melalui tim akun Anda. Hubungi tim akun Anda untuk menentukan jenis dan jumlah resource yang ingin Anda pesan.
  2. Tinjau dan kirimkan draf permintaan pemesanan. Setelah Google membuat draf permintaan pemesanan untuk masa mendatang, tinjau draf tersebut. Jika sudah benar, kirim permintaan peninjauan. Google Cloud langsung menyetujuinya.

Meminta kapasitas melalui tim akun Anda

Hubungi tim akun Anda dan berikan informasi berikut agar Google dapat membuat draf permintaan pemesanan untuk masa mendatang:

  • Nomor project: nomor project tempat tim akun Anda membuat permintaan dan Compute Engine menyediakan kapasitas.
  • Jenis mesin: jenis mesin yang akan dicadangkan. Anda dapat menentukan salah satu opsi berikut:
    • A4X Max (a4x-maxgpu-4g-metal)
    • A4X (a4x-highgpu-4g)
    • A4 (a4-highgpu-8g)
    • A3 Ultra (a3-ultragpu-8g)
    • A3 Mega (a3-megagpu-8g)
    • A3 Tinggi (a3-highgpu-8g)
  • Zone: zona tempat Anda ingin memesan kapasitas. Untuk meninjau region dan zona yang tersedia untuk jenis mesin GPU, lihat Ketersediaan akselerator.
  • Total jumlah: total jumlah instance komputasi yang akan dicadangkan. Anda hanya dapat memesan beberapa instance komputasi kelipatan dua. Ukuran blok dan jumlah instance komputasi per blok bervariasi berdasarkan jenis mesin dan ketersediaan. Tim akun Anda dapat memberikan detail selengkapnya untuk permintaan Anda.
  • Waktu mulai: waktu mulai periode pemesanan. Anda dapat mulai menggunakan kapasitas yang dicadangkan pada saat itu. Format waktu mulai sebagai stempel waktu RFC 3339 sebagai berikut:
    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ganti kode berikut:

    • YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit dalam sebulan, yang dipisahkan oleh tanda hubung (-).
    • HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).
    • OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan -08:00. Untuk tidak menggunakan offset, tentukan Z.
  • Waktu berakhir: waktu berakhir periode pemesanan. Format sebagai stempel waktu RFC 3339. Pada saat itu, Compute Engine melakukan hal berikut:
    • Compute Engine menghapus pemesanan yang dibuat otomatis.
    • Berdasarkan tindakan penghentian yang Anda tentukan untuk instance komputasi, Compute Engine akan menghentikan atau menghapus instance komputasi yang Anda buat menggunakan pemesanan yang dibuat otomatis.
  • Nama pemesanan: nama pemesanan yang dibuat Compute Engine untuk memberikan kapasitas yang dipesan. Compute Engine hanya dapat membuat reservasi yang ditargetkan secara khusus.
  • Penghapusan otomatis pemesanan: apakah Anda ingin Compute Engine menghapus pemesanan yang dibuat otomatis secara otomatis di akhir periode pemesanan. Jika Anda ingin menghapus pemesanan secara manual, Anda harus menghubungi tim akun untuk menghapus pemesanan.
  • Jenis penjadwalan pemeliharaan: cara Compute Engine menjadwalkan pemeliharaan host untuk instance komputasi di cluster Anda. Tentukan salah satu opsi berikut:
    • Untuk menyinkronkan pemeliharaan di semua instance A4X Max, A4X, A4, atau A3 Ultra dalam blok yang dicadangkan, gunakan GROUPED.
    • Untuk menggunakan jadwal pemeliharaan yang berbeda untuk instance A4 atau A3 Ultra, gunakan INDEPENDENT.
  • Mode operasional reservasi: apakah Anda atau Google Cloud mengelola proses pemulihan instance komputasi setelah terjadi error host atau laporan host yang rusak. Mode yang Anda gunakan bergantung pada jenis mesin yang Anda pesan:
    • Semua mode kapasitas (ALL_CAPACITY). Mode ini hanya untuk jenis mesin A4X Max dan A4X. Anda harus mengelola proses pemeliharaan dan pemulihan instance komputasi secara manual. Namun, Anda memiliki akses penuh ke semua mesin dalam reservasi, serta kontrol yang lebih terperinci atas topologi dan pemeliharaan instance komputasi.
    • Mode terkelola (HIGHLY_AVAILABLE_CAPACITY). Mode ini hanya untuk jenis mesin A4, A3 Ultra, A3 Mega, dan A3 High. Anda mengizinkan Google Cloud mengelola proses pemeliharaan dan pemulihan untuk instance komputasi dengan mengganti mesin yang rusak secara otomatis. Pendekatan ini meningkatkan ketersediaan instance komputasi Anda dan membantu Anda memulainya kembali dengan cepat di host baru. Namun, topologi instance komputasi Anda mungkin berubah setelah Compute Engine mengganti mesin.
  • Jenis berbagi: apakah hanya project Anda yang dapat menggunakan pemesanan yang dibuat otomatis (LOCAL), atau project lain dapat menggunakan pemesanan tersebut (SPECIFIC_PROJECTS). Properti ini tidak dapat diubah setelah Anda mengirimkan permintaan. Untuk membagikan kapasitas yang dipesan ke project lain di organisasi Anda, lakukan langkah-langkah berikut:
    1. Jika belum, pastikan project tempat Google membuat permintaan diizinkan untuk membuat pemesanan bersama.
    2. Berikan nomor project yang akan menggunakan kapasitas yang dicadangkan. Anda dapat menentukan hingga 100 project di organisasi Anda.
  • Nama komitmen: jika periode reservasi Anda adalah satu tahun atau lebih, Anda harus membeli dan melampirkan komitmen berbasis resource ke resource yang Anda pesan. Untuk periode reservasi dari 1 tahun hingga kurang dari 3 tahun, komitmen memberi Anda tarif diskon abonemen (CUD) 1 tahun. Untuk periode reservasi dari 3 tahun hingga di bawah 6 tahun, komitmen ini memberikan tarif CUD 3 tahun.

    Jika Anda membagikan kapasitas yang dicadangkan dengan project lain, project tersebut hanya akan mendapatkan diskon jika menggunakan akun Penagihan Cloud yang sama dengan project tempat Anda mencadangkan kapasitas. Untuk detailnya, lihat Mengaktifkan berbagi DA untuk komitmen berbasis resource.

    Komitmen memiliki tanggal mulai dan akhir yang sama dengan reservasi Anda, tetapi waktu aktivasi mungkin berbeda. Jika Anda menentukan waktu mulai reservasi sebagai pukul 00.00 Waktu Pasifik AS dan Kanada, maka komitmen akan aktif pada pukul 00.00 pada tanggal mulai yang Anda pilih. Jika Anda menentukan waktu mulai yang berbeda, maka komitmen akan aktif pada pukul 00.00 pada hari berikutnya dari tanggal mulai yang Anda pilih.

Setelah Google membuat draf permintaan pemesanan untuk masa mendatang, tim akun Anda akan menghubungi Anda.

Meninjau dan mengirimkan draf permintaan pemesanan

Setelah Anda memberikan jenis dan jumlah resource yang akan dipesan kepada tim akun Anda, Google akan membuat draf permintaan pemesanan untuk masa mendatang. Anda dapat meninjau permintaan draf dan, jika sudah benar, mengirimkannya untuk ditinjau. Anda harus mengirimkan permintaan sebelum waktu mulai permintaan.

Untuk meninjau dan mengirimkan draf permintaan pemesanan untuk masa mendatang, pilih salah satu opsi berikut:

Konsol

  1. Di konsol Google Cloud , buka halaman Reservations.

    Buka Pemesanan

  2. Klik tab Future reservations. Tabel Future Reservations mencantumkan setiap permintaan pemesanan untuk masa mendatang di project Anda, dan setiap kolom tabel menjelaskan properti.
  3. Di kolom Name, klik nama draf permintaan yang dibuat Google untuk Anda. Halaman yang memberikan detail permintaan pemesanan untuk masa mendatang akan terbuka.
  4. Di bagian Informasi dasar, pastikan detail permintaan, seperti Tanggal dan Jenis berbagi, sudah benar. Selain itu, jika Anda meminta komitmen, pastikan komitmen tersebut ditentukan. Jika ada detail yang salah, hubungi tim akun Anda.
  5. Jika semuanya sudah akurat, kirim permintaan Anda:

    1. Klik Edit draft. Halaman untuk mengubah permintaan draf akan muncul.
    2. Klik Create. Halaman Reservation akan muncul. Google Cloud menyetujui permintaan Anda dalam beberapa menit, lalu Compute Engine akan membuat pemesanan kosong dengan resource yang Anda minta.

gcloud

  1. Untuk melihat daftar permintaan pemesanan untuk masa mendatang di project Anda, gunakan perintah gcloud compute future-reservations list dengan flag --filter yang ditetapkan ke PROCUREMENT_STATUS=DRAFTING:
    gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
    
  2. Di output perintah, cari permintaan reservasi yang memiliki nama yang Anda berikan kepada tim akun Anda.
  3. Untuk melihat detail permintaan draf, gunakan perintah gcloud compute future-reservations describe:
    gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \
        --zone=ZONE
    

    Ganti kode berikut:

    • FUTURE_RESERVATION_NAME: nama draf permintaan pemesanan untuk masa mendatang.
    • ZONE: zona tempat Google membuat permintaan.

    Outputnya mirip dengan hal berikut ini:

    autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z'
    creationTimestamp: '2025-11-27T11:14:58.305-08:00'
    deploymentType: DENSE
    id: '7979651787097007552'
    kind: compute#futureReservation
    name: example-draft-request
    planningStatus: DRAFT
    reservationName: example-reservation
    schedulingType: INDEPENDENT
    selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request
    selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552
    specificReservationRequired: true
    specificSkuProperties:
      instanceProperties:
        guestAccelerators:
        -   acceleratorCount: 8
          acceleratorType: nvidia-h200-141gb
        localSsds:
        -   diskSizeGb: '375'
          interface: NVME
        ...
      machineType: a3-ultragpu-8g
    totalCount: '2'
    status:
      autoCreatedReservations:
      -   https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation
      fulfilledCount: '2'
      lockTime: '2026-01-27T19:15:00Z'
      procurementStatus: DRAFTING
    timeWindow:
      endTime: '2026-02-10T19:20:00Z'
      startTime: '2026-01-27T19:20:00Z'
    zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b
    
  4. Di output perintah, verifikasi bahwa detail permintaan, seperti periode reservasi dan jenis berbagi, sudah benar. Selain itu, jika Anda membeli komitmen, pastikan komitmen tersebut ditentukan. Jika detailnya salah, hubungi tim akun Anda.
  5. Untuk mengirimkan draf permintaan untuk ditinjau, gunakan perintah gcloud compute future-reservations update dengan flag --planning-status yang ditetapkan ke SUBMITTED:
    gcloud compute future-reservations update FUTURE_RESERVATION_NAME \
        --planning-status=SUBMITTED \
        --zone=ZONE
    

    Dalam beberapa menit, Google Cloud akan menyetujui permintaan Anda, lalu Compute Engine akan membuat pemesanan kosong dengan resource yang Anda minta.

REST

  1. Untuk melihat daftar permintaan pemesanan untuk masa mendatang dalam project Anda, buat permintaan GET ke metode futureReservations.list. Di URL permintaan, sertakan parameter kueri filter dan tetapkan ke status.procurementStatus=DRAFTING:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
    

    Ganti kode berikut:

    • PROJECT_ID: ID project tempat Google membuat draf permintaan pemesanan untuk masa mendatang.
    • ZONE: zona tempat permintaan berada.
  2. Dalam output permintaan, cari permintaan reservasi yang memiliki nama yang Anda berikan kepada tim akun Anda.
  3. Untuk melihat detail permintaan draf, buat permintaan GET ke metode beta futureReservations.get:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
    

    Ganti FUTURE_RESERVATION_NAME dengan nama permintaan pemesanan untuk masa mendatang versi draf.

    Outputnya mirip dengan hal berikut ini:

    {
      "specificSkuProperties": {
        "instanceProperties": {
          "machineType": "a3-ultragpu-8g",
          "guestAccelerators": [
            {
              "acceleratorType": "nvidia-h200-141gb",
              "acceleratorCount": 8
            }
          ],
          "localSsds": [
            {
              "diskSizeGb": "375",
              "interface": "NVME"
            },
            ...
          ]
        },
        "totalCount": "2"
      },
      "kind": "compute#futureReservation",
      "id": "7979651787097007552",
      "creationTimestamp": "2025-11-27T11:14:58.305-08:00",
      "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request",
      "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552",
      "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b",
      "name": "example-draft-request",
      "timeWindow": {
        "startTime": "2026-01-27T19:20:00Z",
        "endTime": "2026-02-10T19:20:00Z"
      },
      "status": {
        "procurementStatus": "DRAFTING",
        "lockTime": "2026-01-27T19:15:00Z"
      },
      "planningStatus": "DRAFT",
      "specificReservationRequired": true,
      "reservationName": "example-reservation",
      "deploymentType": "DENSE",
      "schedulingType": "INDEPENDENT",
      "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z"
    }
    
  4. Dalam output, pastikan detail permintaan, seperti periode pemesanan dan jenis berbagi, sudah benar. Selain itu, jika Anda meminta komitmen, pastikan komitmen tersebut ditentukan. Jika detailnya salah, hubungi tim akun Anda.
  5. Untuk mengirimkan draf permintaan untuk ditinjau, buat permintaan PATCH ke metode beta futureReservations.update. Di URL permintaan, sertakan parameter kueri updateMask dan tetapkan ke planningStatus:
    PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "planningStatus": "SUBMITTED"
    }
    

    Dalam beberapa menit, Google Cloud akan menyetujui permintaan Anda, lalu Compute Engine membuat pemesanan kosong dengan resource yang Anda minta.

Langkah berikutnya