Mencadangkan kapasitas melalui tim akun Anda

Dokumen ini menjelaskan cara mendapatkan kapasitas saat Anda ingin menggunakan pemesanan mendatang dalam opsi penggunaan AI Hypercomputer. Untuk mempelajari semua opsi kapasitas di AI Hypercomputer, lihat Ringkasan kapasitas.

Untuk mendapatkan jaminan yang sangat tinggi bahwa workload Anda memiliki resource yang dibutuhkan, minta pemesanan untuk masa mendatang dari Google. Tindakan ini memungkinkan Anda memesan blok kapasitas untuk durasi yang ditentukan, dimulai pada tanggal dan waktu tertentu yang Anda pilih. Berdasarkan permintaan Anda, Google akan membuat draf permintaan pemesanan untuk masa mendatang. Setelah Anda meninjau dan mengirimkan permintaan draf ini, dan Google Cloud menyetujuinya, Compute Engine akan otomatis membuat (membuat secara otomatis) pemesanan kosong. Kemudian, pada waktu mulai yang Anda pilih, Compute Engine akan menyediakan kapasitas yang Anda minta ke dalam pemesanan yang dibuat otomatis. Selanjutnya, Anda dapat menggunakan reservasi untuk membuat instance virtual machine (VM) hingga periode reservasi berakhir.

Batasan

Bagian ini menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang, dan untuk pemesanan yang dibuat otomatis untuk permintaan.

Batasan untuk permintaan pemesanan untuk masa mendatang

Setelah Google membuat draf permintaan pemesanan untuk masa mendatang bagi Anda, batasan berikut berlaku:

  • Anda tidak dapat mengubah detail permintaan, termasuk jenis berbagi.
  • Setelah permintaan dikirim, disetujui, dan statusnya berubah menjadi PROVISIONING, Anda tidak dapat membatalkan atau menghapusnya. Anda berkomitmen untuk membayar kapasitas yang diminta sejak waktu mulai permintaan, terlepas dari penggunaan.

Batasan untuk pemesanan yang dibuat otomatis

Setelah Compute Engine membuat pemesanan on-demand untuk memenuhi kapasitas yang Anda minta, batasan berikut berlaku:

  • Anda hanya dapat menggunakan atau mengubah pemesanan setelah waktu mulai permintaan.
  • Anda hanya dapat mengubah pemesanan sebagai berikut:

    Untuk mengubah properti lain dalam pemesanan, Anda harus menghubungi tim akun Anda.

  • Anda tidak dapat menghapus reservasi secara manual. Jika, saat memesan kapasitas, Anda menentukan bahwa Anda tidak ingin menghapus pemesanan secara otomatis di akhir periode pemesanannya, maka Anda harus menghubungi tim akun Anda untuk menghapus pemesanan.

Sebelum memulai

  • Jika belum, tinjau konfigurasi VM dan cluster yang tersedia.

  • Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

    REST

    Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

      Instal Google Cloud CLI. Setelah penginstalan, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:

      gcloud init

      Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.

    Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna membuat permintaan pemesanan untuk masa mendatang, minta administrator untuk memberi Anda peran IAM Compute Future Reservation User (roles/compute.futureReservationUser) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat permintaan pemesanan untuk masa mendatang:

  • Agar Compute Engine dapat membuat pemesanan secara otomatis: compute.reservations.create pada project
  • Untuk membuat permintaan pemesanan untuk masa mendatang: compute.futureReservations.create pada project
  • Untuk menentukan template instance: compute.instanceTemplates.useReadOnly pada template instance

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Kuota

Sebagai bagian dari proses permintaan pemesanan untuk masa mendatang, Google mengelola kuota untuk resource yang dipesan. Anda tidak perlu meminta kuota. Pada waktu mulai pemesanan untuk masa mendatang yang disetujui, Google akan meningkatkan kuota Anda jika Anda tidak memilikinya untuk resource yang dipesan.

Ringkasan

Untuk memesan blok kapasitas, selesaikan langkah-langkah berikut:

  1. Minta kapasitas melalui tim akun Anda. Hubungi tim akun Anda untuk menentukan jenis dan jumlah resource yang ingin Anda pesan.
  2. Meninjau dan mengirimkan draf permintaan pemesanan. Setelah Google membuat draf permintaan pemesanan untuk masa mendatang, tinjau draf tersebut. Jika sudah benar, kirimkan permintaan untuk ditinjau. Google Cloud akan segera menyetujuinya.

Meminta kapasitas melalui tim akun Anda

Hubungi tim akun Anda dan berikan informasi berikut agar Google dapat membuat draf permintaan pemesanan untuk masa mendatang:

  • Nomor project: nomor project tempat tim akun Anda membuat permintaan dan Compute Engine menyediakan kapasitas.
  • Jenis mesin: jenis mesin yang akan dicadangkan. Anda dapat menentukan salah satu opsi berikut:
    • A4X (a4x-highgpu-4g)
    • A4 (a4-highgpu-8g)
    • A3 Ultra (a3-ultragpu-8g)
    • A3 Mega (a3-megagpu-8g)
    • A3 Tinggi (a3-highgpu-8g)
  • Zone: zona tempat Anda ingin memesan kapasitas. Untuk meninjau region dan zona yang tersedia untuk jenis mesin GPU, lihat Ketersediaan akselerator.
  • Jumlah total: jumlah total VM yang akan dipesan. Anda hanya dapat mencadangkan kelipatan dua VM. Ukuran blok dan jumlah VM per blok bervariasi berdasarkan jenis mesin dan ketersediaan. Tim akun Anda dapat memberikan detail selengkapnya untuk permintaan Anda.
  • Waktu mulai: waktu mulai periode pemesanan. Anda dapat mulai menggunakan kapasitas yang dipesan pada saat itu. Format waktu mulai sebagai stempel waktu RFC 3339 sebagai berikut:
    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ganti kode berikut:

    • YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit dalam bulan, yang dipisahkan oleh tanda hubung (-).
    • HH:MM:SS: waktu yang diformat sebagai jam dua digit dengan menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).
    • OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan -08:00. Jika tidak ingin menggunakan offset, tentukan Z.
  • Waktu berakhir: waktu berakhir periode pemesanan. Format sebagai stempel waktu RFC 3339. Pada saat itu, Compute Engine melakukan hal berikut:
    • Compute Engine menghapus pemesanan yang dibuat otomatis.
    • Berdasarkan tindakan penghentian yang Anda tentukan untuk instance VM, Compute Engine akan menghentikan atau menghapus instance VM yang Anda buat menggunakan reservasi yang dibuat secara otomatis.
  • Nama pemesanan: nama pemesanan yang dibuat Compute Engine untuk menyediakan kapasitas yang dipesan. Compute Engine hanya dapat membuat pemesanan yang ditargetkan secara khusus.
  • Penghapusan otomatis pemesanan: apakah Anda ingin Compute Engine menghapus otomatis pemesanan yang dibuat otomatis di akhir periode pemesanan. Jika Anda ingin menghapus pemesanan secara manual, Anda harus menghubungi tim akun untuk menghapus pemesanan.
  • Jenis penjadwalan pemeliharaan: cara Compute Engine menjadwalkan pemeliharaan host untuk instance VM di cluster Anda. Tentukan salah satu opsi berikut:
    • Untuk menyinkronkan pemeliharaan di semua VM A4X, A4, atau A3 Ultra dalam blok yang dicadangkan, gunakan GROUPED.
    • Untuk menggunakan jadwal pemeliharaan yang berbeda untuk VM Ultra A4 atau A3, gunakan INDEPENDENT.
    Untuk jenis mesin A3 Mega dan A3 High, opsi penjadwalan GROUPED dan INDEPENDENT khusus tidak tersedia. Anda dapat menggunakan kebijakan pemeliharaan host Compute Engine standar yang menjadwalkan pemeliharaan secara individual per VM, bukan disinkronkan di seluruh cluster. Karena instance yang terhubung dengan GPU ini tidak mendukung migrasi langsung, instance tersebut tunduk pada kebijakan penghentian dan mulai ulang.
  • Mode operasional reservasi: apakah Anda atau Google Cloud mengelola proses pemulihan VM setelah terjadi error host atau laporan host yang rusak. Mode yang Anda gunakan bergantung pada jenis mesin yang Anda pesan:
    • Mode terkelola (HIGHLY_AVAILABLE_CAPACITY). Mode ini untuk jenis mesin A4, A3 Ultra, A3 Mega, dan A3 High. Anda mengizinkan Google Cloud mengelola proses pemeliharaan dan pemulihan VM dengan mengganti mesin yang rusak secara otomatis. Pendekatan ini meningkatkan ketersediaan VM Anda dan membantu Anda memulainya kembali dengan cepat di host baru. Namun, topologi VM Anda mungkin berubah setelah Compute Engine mengganti mesin.
    • Semua mode kapasitas (ALL_CAPACITY). Mode ini ditujukan untuk jenis mesin A4X. Anda harus mengelola proses pemeliharaan dan pemulihan VM secara manual. Namun, Anda memiliki akses penuh ke semua mesin dalam reservasi, serta kontrol yang lebih terperinci atas topologi dan pemeliharaan VM.
  • Jenis berbagi: apakah hanya project Anda yang dapat menggunakan pemesanan yang dibuat otomatis (LOCAL), atau project lain dapat menggunakan pemesanan tersebut (SPECIFIC_PROJECTS). Properti ini tidak dapat diubah setelah Anda mengirimkan permintaan. Untuk membagikan kapasitas yang dipesan dengan project lain di organisasi Anda, lakukan langkah-langkah berikut:
    1. Jika belum, pastikan bahwa project tempat Google membuat permintaan diizinkan untuk membuat pemesanan bersama.
    2. Berikan nomor project yang akan menggunakan kapasitas yang dicadangkan. Anda dapat menentukan hingga 100 project di organisasi Anda.
  • Nama komitmen: jika periode reservasi Anda adalah satu tahun atau lebih, Anda harus membeli dan melampirkan komitmen berbasis resource ke resource yang Anda pesan. Untuk periode reservasi dari 1 tahun hingga kurang dari 3 tahun, komitmen ini memberikan tarif diskon abonemen (CUD) 1 tahun. Untuk periode reservasi dari 3 tahun hingga kurang dari 6 tahun, komitmen ini memberikan tarif CUD 3 tahun.

    Jika Anda membagikan kapasitas yang dicadangkan dengan project lain, project tersebut hanya akan mendapatkan diskon jika menggunakan akun Penagihan Cloud yang sama dengan project tempat Anda mencadangkan kapasitas. Untuk mengetahui detailnya, lihat Mengaktifkan berbagi CUD untuk komitmen berbasis resource.

    Komitmen memiliki tanggal mulai dan akhir yang sama dengan reservasi Anda, tetapi waktu aktivasi mungkin berbeda. Jika Anda menentukan waktu mulai reservasi sebagai pukul 00.00 Waktu Pasifik AS dan Kanada, maka komitmen akan aktif pada pukul 00.00 pada tanggal mulai yang Anda pilih. Jika Anda menentukan waktu mulai yang berbeda, komitmen akan aktif pada pukul 00.00 pada hari berikutnya dari tanggal mulai yang Anda pilih.

Setelah Google membuat draf permintaan pemesanan untuk masa mendatang, tim akun Anda akan menghubungi Anda.

Meninjau dan mengirimkan draf permintaan pemesanan

Setelah Anda memberikan jenis dan jumlah resource yang akan dipesan kepada tim akun Anda, Google akan membuat draf permintaan pemesanan untuk masa mendatang. Anda dapat meninjau draf permintaan dan, jika sudah benar, kirimkan untuk ditinjau. Anda harus mengirimkan permintaan sebelum waktu mulai permintaan.

Untuk meninjau dan mengirimkan draf permintaan pemesanan untuk masa mendatang, pilih salah satu opsi berikut:

Konsol

  1. Di konsol Google Cloud , buka halaman Reservations.

    Buka Pemesanan

  2. Klik tab Future reservations. Tabel Future Reservations mencantumkan setiap permintaan pemesanan untuk masa mendatang di project Anda, dan setiap kolom tabel menjelaskan properti.
  3. Di kolom Name, klik nama permintaan draf yang dibuat Google untuk Anda. Halaman yang memberikan detail permintaan pemesanan untuk masa mendatang akan terbuka.
  4. Di bagian Informasi dasar, pastikan detail permintaan, seperti Tanggal dan Jenis berbagi, sudah benar. Selain itu, jika Anda meminta komitmen, pastikan komitmen tersebut ditentukan. Jika ada detail yang salah, hubungi tim akun Anda.
  5. Jika semuanya sudah akurat, kirim permintaan Anda:

    1. Klik Edit draft. Halaman untuk mengubah draf permintaan akan muncul.
    2. Klik Create. Halaman Reservasi akan muncul. Google Cloud menyetujui permintaan Anda dalam beberapa menit, dan kemudian Compute Engine membuat pemesanan kosong dengan resource yang Anda minta.

gcloud

  1. Untuk melihat daftar permintaan pemesanan untuk masa mendatang di project Anda, gunakan perintah gcloud compute future-reservations list dengan flag --filter ditetapkan ke PROCUREMENT_STATUS=DRAFTING:
    gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
    
  2. Di output perintah, cari permintaan reservasi yang memiliki nama yang Anda berikan kepada tim akun Anda.
  3. Untuk melihat detail permintaan draf, gunakan perintah gcloud compute future-reservations describe:
    gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \
        --zone=ZONE
    

    Ganti kode berikut:

    • FUTURE_RESERVATION_NAME: nama draf permintaan pemesanan untuk masa mendatang.
    • ZONE: zona tempat Google membuat permintaan.

    Outputnya mirip dengan hal berikut ini:

    autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z'
    creationTimestamp: '2025-11-27T11:14:58.305-08:00'
    deploymentType: DENSE
    id: '7979651787097007552'
    kind: compute#futureReservation
    name: example-draft-request
    planningStatus: DRAFT
    reservationName: example-reservation
    schedulingType: INDEPENDENT
    selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request
    selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552
    specificReservationRequired: true
    specificSkuProperties:
      instanceProperties:
        guestAccelerators:
        -   acceleratorCount: 8
          acceleratorType: nvidia-h200-141gb
        localSsds:
        -   diskSizeGb: '375'
          interface: NVME
        ...
      machineType: a3-ultragpu-8g
    totalCount: '2'
    status:
      autoCreatedReservations:
      -   https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation
      fulfilledCount: '2'
      lockTime: '2026-01-27T19:15:00Z'
      procurementStatus: DRAFTING
    timeWindow:
      endTime: '2026-02-10T19:20:00Z'
      startTime: '2026-01-27T19:20:00Z'
    zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b
    
  4. Di output perintah, verifikasi bahwa detail permintaan, seperti periode reservasi dan jenis berbagi, sudah benar. Selain itu, jika Anda membeli komitmen, pastikan komitmen tersebut ditentukan. Jika detailnya salah, hubungi tim akun Anda.
  5. Untuk mengirimkan draf permintaan untuk ditinjau, gunakan perintah gcloud compute future-reservations update dengan flag --planning-status ditetapkan ke SUBMITTED:
    gcloud compute future-reservations update FUTURE_RESERVATION_NAME \
        --planning-status=SUBMITTED \
        --zone=ZONE
    

    Dalam beberapa menit, Google Cloud menyetujui permintaan Anda, lalu Compute Engine membuat pemesanan kosong dengan resource yang Anda minta.

REST

  1. Untuk melihat daftar permintaan pemesanan untuk masa mendatang dalam project Anda, buat permintaan GET ke metode futureReservations.list. Di URL permintaan, sertakan parameter kueri filter dan tetapkan ke status.procurementStatus=DRAFTING:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
    

    Ganti kode berikut:

    • PROJECT_ID: ID project tempat Google membuat permintaan pemesanan untuk masa mendatang versi draf.
    • ZONE: zona tempat permintaan berada.
  2. Dalam output permintaan, cari permintaan reservasi yang memiliki nama yang Anda berikan kepada tim akun Anda.
  3. Untuk melihat detail permintaan draf, buat permintaan GET ke metode beta futureReservations.get:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
    

    Ganti FUTURE_RESERVATION_NAME dengan nama draf permintaan pemesanan untuk masa mendatang.

    Outputnya mirip dengan hal berikut ini:

    {
      "specificSkuProperties": {
        "instanceProperties": {
          "machineType": "a3-ultragpu-8g",
          "guestAccelerators": [
            {
              "acceleratorType": "nvidia-h200-141gb",
              "acceleratorCount": 8
            }
          ],
          "localSsds": [
            {
              "diskSizeGb": "375",
              "interface": "NVME"
            },
            ...
          ]
        },
        "totalCount": "2"
      },
      "kind": "compute#futureReservation",
      "id": "7979651787097007552",
      "creationTimestamp": "2025-11-27T11:14:58.305-08:00",
      "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request",
      "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552",
      "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b",
      "name": "example-draft-request",
      "timeWindow": {
        "startTime": "2026-01-27T19:20:00Z",
        "endTime": "2026-02-10T19:20:00Z"
      },
      "status": {
        "procurementStatus": "DRAFTING",
        "lockTime": "2026-01-27T19:15:00Z"
      },
      "planningStatus": "DRAFT",
      "specificReservationRequired": true,
      "reservationName": "example-reservation",
      "deploymentType": "DENSE",
      "schedulingType": "INDEPENDENT",
      "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z"
    }
    
  4. Di output, pastikan detail permintaan, seperti periode reservasi dan jenis berbagi, sudah benar. Selain itu, jika Anda meminta komitmen, pastikan komitmen tersebut ditentukan. Jika detailnya salah, hubungi tim akun Anda.
  5. Untuk mengirimkan draf permintaan untuk ditinjau, buat permintaan PATCH ke metode beta futureReservations.update. Di URL permintaan, sertakan parameter kueri updateMask dan tetapkan ke planningStatus:
    PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "planningStatus": "SUBMITTED"
    }
    

    Dalam beberapa menit, Google Cloud menyetujui permintaan Anda, lalu Compute Engine membuat pemesanan kosong dengan resource yang Anda minta.

Langkah berikutnya