Membuat instance dengan model terikat pemesanan

Dokumen ini menjelaskan cara membuat instance Compute Engine mandiri menggunakan model penyediaan terikat reservasi. Model penyediaan ini memungkinkan Anda membuat instance A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High dengan 8 GPU, A3 Edge, atau H4D dengan menggunakan kapasitas yang telah dipesan.

Untuk metode lain dalam membuat instance komputasi menggunakan model penyediaan terikat reservasi, lihat Ringkasan opsi deployment dalam dokumentasi AI Hypercomputer.

Sebelum memulai

  • Siapkan autentikasi jika Anda belum melakukannya. Autentikasi memverifikasi identitas Anda untuk mengakses Google Cloud layanan dan API. Untuk menjalankan kode atau contoh dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke Compute Engine dengan memilih salah satu opsi berikut:

    Pilih tab untuk melihat bagaimana Anda berencana menggunakan contoh di halaman ini:

    Konsol

    Saat menggunakan Google Cloud konsol untuk mengakses Google Cloud layanan dan API, Anda tidak perlu menyiapkan autentikasi.

    gcloud

    1. Instal Google Cloud CLI. Setelah penginstalan, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:

      gcloud init

      Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu .

  • Tetapkan region dan zona default.
  • REST

    Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

      Instal Google Cloud CLI.

      Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu .

    Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi. Google Cloud

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk membuat instance komputasi menggunakan model penyediaan terikat reservasi, minta administrator untuk memberi Anda peran IAM Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) pada project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran yang telah ditentukan ini berisi izin yang diperlukan untuk membuat instance komputasi menggunakan model penyediaan terikat reservasi. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat instance komputasi menggunakan model penyediaan terikat reservasi:

  • compute.instances.create di project
  • Untuk menggunakan image kustom guna membuat VM: compute.images.useReadOnly di image
  • Untuk menggunakan snapshot guna membuat VM: compute.snapshots.useReadOnly di snapshot
  • Untuk menggunakan template instance guna membuat VM: compute.instanceTemplates.useReadOnly di template instance
  • Untuk menentukan subnet bagi VM Anda: compute.subnetworks.use di project atau di subnet yang dipilih
  • Untuk menentukan alamat IP statis bagi VM: compute.addresses.use di project
  • Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan VPC: compute.subnetworks.useExternalIp di project atau di subnet yang dipilih
  • Untuk menetapkan jaringan lama ke VM: compute.networks.use di project
  • Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan lama: compute.networks.useExternalIp di project
  • Untuk menetapkan metadata instance VM bagi VM: compute.instances.setMetadata di project
  • Untuk menetapkan tag bagi VM: compute.instances.setTags di VM
  • Untuk menetapkan label bagi VM: compute.instances.setLabels di VM
  • Untuk menetapkan akun layanan bagi VM yang akan digunakan: compute.instances.setServiceAccount di VM
  • Untuk membuat disk baru bagi VM: compute.disks.create di project
  • Untuk melampirkan disk yang sudah ada dalam mode baca-saja atau baca-tulis: compute.disks.use di disk
  • Untuk melampirkan disk yang sudah ada dalam mode baca-saja: compute.disks.useReadOnly di disk

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Membuat instance yang menggunakan model penyediaan terikat reservasi

Untuk membuat instance A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High dengan 8 GPU, atau H4D menggunakan model penyediaan terikat reservasi, Anda harus menunggu hingga reservasi yang dibuat otomatis dan ingin Anda gunakan mencapai waktu mulainya. Selain itu, instance komputasi yang ingin Anda buat harus memenuhi semua persyaratan berikut:

Contoh berikut membuat permintaan reservasi untuk masa mendatang dalam mode kalender untuk lima instance A3 Ultra, lalu membuat instance A3 Ultra dengan menggunakan reservasi yang dibuat otomatis untuk permintaan tersebut.

Untuk membuat contoh instance komputasi menggunakan model penyediaan terikat reservasi, pilih salah satu opsi berikut:

Konsol

  1. Buat contoh permintaan untuk lima instance A3 Ultra dan kirimkan untuk ditinjau:

    1. Di Google Cloud konsol, buka halaman Reservations.

      Buka Reservations

    2. Klik tab Future reservations.

    3. Klik Create future reservation. Halaman Create a future reservation akan muncul.

    4. Klik tab GPUs, lalu, dalam daftar GPU type, pilih NVIDIA H200 141GB. Tindakan ini menentukan instance A3 Ultra.

    5. Di kolom Total capacity needed, masukkan 5.

    6. Di bagian Reservation period, tentukan waktu mulai dan durasi untuk periode reservasi Anda.

    7. Klik Search for capacity, lalu, di bagian Available capacity, pilih salah satu mesin yang tersedia.

    8. Klik Create.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh reservasi yang dibuat otomatis, lakukan hal berikut:

    1. Di Google Cloud konsol, buka halaman Create an instance.

      Buka halaman Create an instance

    2. Di kolom Name, masukkan nama untuk instance komputasi. Untuk contoh ini, masukkan example-instance.

    3. Tentukan Region dan Zone tempat reservasi yang dibuat otomatis berada. Untuk contoh ini, pilih us-central1 dan us-central1-b.

    4. Klik tab GPUs, lalu, dalam daftar GPU type, pilih NVIDIA H200 141GB. Tindakan ini menentukan instance A3 Ultra dan menetapkan model penyediaan ke Reservation-bound.

    5. Di menu navigasi, klik Advanced.

    6. Di bagian Reservations, pilih Choose a reservation, lalu klik Choose a reservation.

    7. Di panel Choose a reservation, lakukan hal berikut:

      1. Pilih contoh reservasi yang dibuat otomatis.

      2. Klik Choose.

    8. Di bagian Provisioning model, luaskan bagian VM provisioning model advanced settings.

    9. Dalam daftar On VM termination, pilih Stop (default) atau Delete.

    10. Klik Create.

gcloud

  1. Untuk membuat contoh permintaan untuk lima instance A3 Ultra dan mengirimkannya untuk ditinjau, gunakan gcloud beta compute future-reservations create perintah:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-setting=local \
        --start-time=2026-03-05T00:00:00Z \
        --end-time=2026-03-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-b
    

    Asumsikan bahwa Google Cloud menyetujui permintaan dan Compute Engine otomatis membuat reservasi kosong. Pada waktu mulai permintaan, 5 Maret 2026, Compute Engine akan meningkatkan jumlah instance GPU yang dipesan dalam reservasi. Kemudian, Anda dapat menggunakan reservasi tersebut.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh reservasi yang dibuat otomatis, gunakan perintah gcloud compute instances create command dengan flag berikut:

    • Flag --instance-termination-action.

    • Flag --provisioning-model yang ditetapkan ke RESERVATION_BOUND.

    • Flag --reservation.

    • Flag --reservation-affinity yang ditetapkan ke specific.

    Perintah ini mirip dengan perintah berikut. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.

    gcloud compute instance create example-a3ultra-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-b \
        ...
    

    Perintah ini mencakup nilai berikut:

    • TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance komputasi pada akhir periode reservasi.

    • RESERVATION_URL: URL reservasi, yang diformat sebagai berikut:

      • Jika reservasi yang dibuat otomatis ada di project Anda: example-reservation.

      • Jika reservasi yang dibuat otomatis ada di project lain: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Untuk membuat contoh permintaan untuk lima instance A3 Ultra dan mengirimkannya untuk ditinjau, buat permintaan POST ke metode futureReservations.insert beta:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2026-03-05T00:00:00Z",
        "endTime": "2026-03-19T00:00:00Z"
      }
    }
    

    Asumsikan bahwa Google Cloud menyetujui permintaan dan Compute Engine otomatis membuat reservasi kosong. Pada waktu mulai permintaan, 5 Maret 2026, Compute Engine akan meningkatkan jumlah instance GPU yang dipesan dalam reservasi. Kemudian, Anda dapat menggunakan reservasi tersebut.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh reservasi yang dibuat otomatis, buat permintaan POST ke instances.insert metode. Di isi permintaan, sertakan kolom berikut:

    • Kolom reservationAffinity.consumeReservationType yang ditetapkan ke SPECIFIC_RESERVATION.

    • Kolom reservationAffinity.key yang ditetapkan ke compute.googleapis.com/reservation-name.

    • Kolom reservationAffinity.values yang ditetapkan ke URL reservasi.

    • Kolom scheduling.instanceTerminationAction.

    • Kolom scheduling.provisioningModel yang ditetapkan ke RESERVATION_BOUND.

    Permintaan ini mirip dengan permintaan berikut. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
        "name": "example-a3ultra-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Isi permintaan mencakup nilai berikut:

    • RESERVATION_URL: URL reservasi, yang diformat sebagai berikut:

      • Jika reservasi yang dibuat otomatis ada di project Anda: example-reservation.

      • Jika reservasi yang dibuat otomatis ada di project lain: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance komputasi pada akhir periode reservasi.

Langkah berikutnya

Coba sendiri

Jika Anda baru pertama kali menggunakan Google Cloud, buat akun untuk mengevaluasi performa Compute Engine dalam skenario dunia nyata. Pelanggan baru juga akan mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.

Coba Compute Engine gratis