Membuat instance dengan model terikat pemesanan

Dokumen ini menjelaskan cara membuat instance Compute Engine mandiri dengan menggunakan model penyediaan terikat pemesanan. Model penyediaan ini memungkinkan Anda membuat instance A4X Max, A4X, A4, atau A3 Ultra dengan menggunakan kapasitas yang telah dicadangkan sebelumnya.

Untuk metode lain dalam membuat instance menggunakan model penyediaan yang terikat dengan reservasi, lihat Ringkasan opsi deployment dalam dokumentasi AI Hypercomputer.

Sebelum memulai

  • Siapkan autentikasi jika Anda belum melakukannya. Autentikasi memverifikasi identitas Anda untuk mengakses layanan Google Cloud dan API. Untuk menjalankan kode atau contoh dari lingkungan pengembangan lokal, Anda dapat mengautentikasi ke Compute Engine dengan memilih salah satu opsi berikut:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Instal Google Cloud CLI. Setelah penginstalan, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:

      gcloud init

      Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.

    2. Set a default region and zone.

    REST

    Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

      Instal Google Cloud CLI. Setelah penginstalan, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:

      gcloud init

      Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.

    Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna membuat instance komputasi menggunakan model penyediaan terikat reservasi, minta administrator untuk memberi Anda peran IAM Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membuat instance komputasi menggunakan model penyediaan yang terikat dengan reservasi. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat instance komputasi menggunakan model penyediaan terikat pemesanan:

  • compute.instances.create di project
  • Untuk menggunakan image kustom guna membuat VM: compute.images.useReadOnly pada image
  • Untuk menggunakan snapshot guna membuat VM: compute.snapshots.useReadOnly pada snapshot
  • Untuk menggunakan template instance guna membuat VM: compute.instanceTemplates.useReadOnly pada template instance
  • Untuk menentukan subnet bagi VM Anda: compute.subnetworks.use di project atau di subnet yang dipilih
  • Untuk menentukan alamat IP statis untuk VM: compute.addresses.use pada project
  • Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan VPC: compute.subnetworks.useExternalIp di project atau di subnet yang dipilih
  • Untuk menetapkan jaringan lama ke VM: compute.networks.use pada project
  • Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan lama: compute.networks.useExternalIp di project
  • Untuk menetapkan metadata instance VM bagi VM: compute.instances.setMetadata di project
  • Untuk menyetel tag untuk VM: compute.instances.setTags di VM
  • Untuk menetapkan label bagi VM: compute.instances.setLabels di VM
  • Untuk menyetel akun layanan yang akan digunakan VM: compute.instances.setServiceAccount di VM
  • Untuk membuat disk baru untuk VM: compute.disks.create pada project
  • Untuk memasang disk yang ada dalam mode hanya baca atau baca-tulis: compute.disks.use pada disk
  • Untuk memasang disk yang ada dalam mode hanya baca: compute.disks.useReadOnly pada disk

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Buat instance yang menggunakan model penyediaan terikat reservasi

Untuk membuat instance komputasi A4X Max, A4X, A4, atau A3 Ultra menggunakan model penyediaan terikat reservasi, Anda harus menunggu hingga reservasi yang dibuat otomatis yang ingin Anda gunakan mencapai waktu mulainya. Selain itu, instance yang ingin Anda buat harus memenuhi semua persyaratan berikut:

Contoh berikut membuat permintaan pemesanan untuk masa mendatang dalam mode kalender untuk lima instance A3 Ultra, lalu membuat instance A3 Ultra dengan menggunakan pemesanan yang dibuat otomatis untuk permintaan tersebut.

Untuk membuat instance contoh menggunakan model penyediaan terikat pemesanan, pilih salah satu opsi berikut:

Konsol

  1. Buat contoh permintaan untuk lima instance A3 Ultra dan kirimkan untuk ditinjau:

    1. Di konsol Google Cloud , buka halaman Reservations.

      Buka Reservations

    2. Klik tab Future reservations.

    3. Klik Create future reservation. Halaman Create a future reservation akan muncul.

    4. Di bagian Konfigurasi hardware, pilih Tentukan jenis mesin, lalu tentukan instance A3 Ultra.

    5. Di bagian Metode perolehan, selesaikan langkah-langkah berikut:

      1. Pilih Cari kapasitas hingga 90 hari.

      2. Di daftar Region dan Zone, tentukan region dan zona tempat Anda ingin memesan resource. Untuk contoh ini, pilih us-central1 dan us-central1-a.

      3. Di kolom Total kapasitas yang diperlukan, masukkan 5.

      4. Di bagian Reservation period, tentukan periode pemesanan untuk pemesanan.

    6. Tentukan kolom lainnya, lalu klik Kirim.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra yang akan menggunakan contoh pemesanan yang dibuat otomatis, lakukan hal berikut:

    1. Di konsol Google Cloud , buka halaman Create an instance.

      Buka halaman Buat instance

    2. Di kolom Name, masukkan nama untuk instance. Untuk contoh ini, masukkan example-instance.

    3. Tentukan Region dan Zona tempat Anda ingin memesan resource. Untuk contoh ini, pilih us-central1 dan us-central1-a.

    4. Klik tab GPU, lalu di daftar GPU type, pilih NVIDIA H200 141 GB. Tindakan ini menentukan instance A3 Ultra dan menetapkan model penyediaan ke Reservation-bound.

    5. Di menu navigasi, klik Lanjutan.

    6. Di bagian Reservations, pilih Choose a reservation, lalu klik Choose a reservation.

    7. Di panel Pilih reservasi, lakukan hal berikut:

      1. Pilih reservasi tertentu. Jika Anda ingin menggunakan pemesanan bersama yang ada di project lain, pilih project tempat pemesanan berada di daftar Project.

      2. Klik Pilih.

    8. Di bagian Model penyediaan, luaskan bagian Setelan lanjutan model penyediaan VM.

    9. Dalam daftar On VM termination, pilih Stop (default) atau Delete.

    10. Klik Create.

gcloud

  1. Untuk membuat contoh permintaan lima instance A3 Ultra dan mengirimkannya untuk ditinjau, gunakan perintah gcloud beta compute future-reservations create:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Anggap saja Google Cloud menyetujui permintaan dan Compute Engine otomatis membuat pemesanan kosong. Pada waktu mulai permintaan, 5 Oktober 2025, Compute Engine menambah jumlah instance GPU yang dicadangkan dalam reservasi. Kemudian, Anda dapat menggunakan pemesanan.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra yang akan menggunakan contoh pemesanan yang dibuat otomatis, gunakan perintah gcloud compute instances create dengan flag berikut:

    • Flag --instance-termination-action.

    • Flag --provisioning-model ditetapkan ke RESERVATION_BOUND.

    • Flag --reservation.

    • Flag --reservation-affinity ditetapkan ke specific.

    Perintahnya mirip dengan berikut ini. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.

    gcloud compute instance create example-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    Perintah ini mencakup nilai berikut:

    • TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance di akhir periode pemesanan.

    • RESERVATION_URL: URL pemesanan, yang diformat sebagai berikut:

      • Jika pemesanan yang dibuat otomatis ada di project Anda: example-reservation.

      • Jika pemesanan yang dibuat otomatis ada di project lain: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Untuk membuat contoh permintaan lima instance A3 Ultra dan mengirimkannya untuk ditinjau, buat permintaan POST ke metode beta futureReservations.insert:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Anggap saja Google Cloud menyetujui permintaan dan Compute Engine otomatis membuat pemesanan kosong. Pada waktu mulai permintaan, 5 Oktober 2025, Compute Engine menambah jumlah instance GPU yang dicadangkan dalam reservasi. Kemudian, Anda dapat menggunakan pemesanan.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh pemesanan yang dibuat otomatis, buat permintaan POST ke metode instances.insert. Dalam isi permintaan, sertakan kolom berikut:

    • Kolom reservationAffinity.consumeReservationType ditetapkan ke SPECIFIC_RESERVATION.

    • Kolom reservationAffinity.key ditetapkan ke compute.googleapis.com/reservation-name.

    • Kolom reservationAffinity.values ditetapkan ke URL reservasi.

    • Kolom scheduling.instanceTerminationAction.

    • Kolom scheduling.provisioningModel ditetapkan ke RESERVATION_BOUND.

    Permintaannya mirip dengan berikut ini. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Isi permintaan mencakup nilai berikut:

    • RESERVATION_URL: URL pemesanan, yang diformat sebagai berikut:

      • Jika pemesanan yang dibuat otomatis ada di project Anda: example-reservation.

      • Jika pemesanan yang dibuat otomatis ada di project lain: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance di akhir periode pemesanan.

Langkah berikutnya

Coba sendiri

Jika Anda baru pertama kali menggunakan Google Cloud, buat akun untuk mengevaluasi performa Compute Engine dalam skenario dunia nyata. Pelanggan baru juga akan mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.

Coba Compute Engine gratis