Menggunakan reservasi dengan instance Agent Platform Workbench

Dokumen ini menjelaskan cara menggunakan pemesanan Compute Engine untuk mendapatkan tingkat jaminan yang tinggi bahwa instance Gemini Enterprise Agent Platform Workbench Anda memiliki resource virtual machine (VM) yang cukup untuk dijalankan.

Pemesanan adalah fitur Compute Engine. Pemesanan membantu memastikan bahwa Anda memiliki resource yang tersedia untuk membuat VM dengan hardware yang sama (memori dan vCPU) dan resource opsional (GPU dan disk SSD Lokal) kapan pun Anda membutuhkannya.

Saat Anda membuat pemesanan, Compute Engine akan memverifikasi bahwa kapasitas yang diminta tersedia di zona yang ditentukan. Jika ya, maka Compute Engine akan memesan resource, membuat pemesanan, dan hal berikut akan terjadi:

  • Resource yang dicadangkan akan segera tersedia untuk Anda gunakan, dan tetap tersedia hingga Anda menghapus pemesanan.

  • Anda akan ditagih untuk resource yang dipesan dengan tarif on-demand yang sama seperti VM yang berjalan, termasuk diskon yang berlaku, hingga pemesanan dihapus. Saat menggunakan pemesanan, VM tidak dikenakan biaya duplikat untuk resource karena pemesanan sudah ditagih untuk biaya resource yang dicadangkan. Untuk mempelajari lebih lanjut, lihat Reservasi resource zona Compute Engine.

Batasan dan persyaratan

Semua batasan pemesanan Compute Engine berlaku saat instance Agent Platform Workbench menggunakan pemesanan. Lihat Cara kerja pemesanan.

Selain itu, saat menggunakan reservasi dengan instance Agent Platform Workbench, batasan dan persyaratan berikut berlaku:

  • Reservasi Anda harus berupa salah satu dari berikut ini:

    • Dalam project yang sama dengan instance Agent Platform Workbench Anda.
    • Dibagikan dengan project yang sama dengan instance Agent Platform Workbench Anda.
  • Properti VM pemesanan harus sama persis dengan instance Agent Platform Workbench Anda untuk menggunakan pemesanan. Misalnya, jika reservasi menentukan jenis mesin e2-standard-8, maka instance Agent Platform Workbench hanya dapat menggunakan reservasi jika juga menggunakan jenis mesin e2-standard-8. Lihat Persyaratan.

Sebelum memulai

  1. Tinjau persyaratan dan batasan untuk pemesanan.
  2. Tinjau persyaratan kuota dan batasan untuk pemesanan bersama.
  3. Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. Enable the Compute Engine and Notebooks APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk menggunakan reservasi dengan instance Agent Platform Workbench, minta administrator untuk memberi Anda peran IAM berikut pada project:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Membuat pemesanan

Buat pemesanan Compute Engine. Pemesanan ini dapat berupa reservasi project tunggal atau pemesanan bersama. Pemesanan dapat dilakukan sesuai permintaan atau pemesanan untuk masa mendatang. Untuk mengetahui informasi selengkapnya, lihat Memilih jenis reservasi.

Menggunakan reservasi dengan instance baru

Untuk membuat instance Agent Platform Workbench yang menggunakan reservasi, Anda dapat menggunakan konsol Google Cloud atau REST API.

Konsol

Untuk membuat instance Agent Platform Workbench yang menggunakan reservasi, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Instances.

    Buka Instances

  2. Klik  Buat baru.

  3. Dalam dialog Instance baru, klik Opsi lanjutan.

  4. Dalam dialog Create instance, di bagian Machine type, pilih jenis mesin dan konfigurasi GPU yang cocok dengan reservasi Anda.

  5. Di bagian CPU Platform and GPU, di menu Reservations, pilih reservasi yang akan digunakan.

  6. Klik Create.

    Agent Platform Workbench membuat instance dan otomatis memulainya. Saat instance siap digunakan, Agent Platform Workbench akan mengaktifkan link Open JupyterLab.

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • PROJECT_ID: project ID Anda
  • LOCATION adalah zona tempat instance Anda berada.
  • INSTANCE_NAME: nama instance Anda
  • MACHINE_TYPE: jenis mesin instance Anda
  • RESERVATION_TYPE: jenis reservasi; harus berupa RESERVATION_ANY atau RESERVATION_SPECIFIC
  • RESERVATION_NAME: nama reservasi Anda saat menggunakan jenis RESERVATION_SPECIFIC
    • Untuk pemesanan dalam project yang sama, Anda dapat menggunakan ID pemesanan.
    • Untuk reservasi di project lain, Anda harus menggunakan jalur reservasi lengkap. Contoh: projects/PROJECT_ID/reservations/RESERVATION_NAME.

Metode HTTP dan URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Meminta isi JSON:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:

curl

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Jika berhasil, isi respons berisi instance Operation.

Untuk mengetahui informasi selengkapnya, lihat dokumentasi projects.locations.instances.create REST API.

Berhenti menggunakan reservasi Anda

Untuk berhenti menggunakan reservasi, Anda dapat menghapus reservasi Anda.

Jika Anda ingin terus menggunakan reservasi dengan resource lain, tetapi tidak ingin instance Agent Platform Workbench yang ada menggunakannya, Anda harus menghapus instance tersebut.

Penagihan

Saat menggunakan reservasi Compute Engine, Anda akan ditagih untuk hal berikut:

  • Resource Compute Engine, termasuk diskon abonemen (CUD) yang berlaku, dengan harga Compute Engine. Biaya ini memiliki label goog-vertex-ai-product: workbench-instances pada SKU. Lihat harga Compute Engine.

  • Biaya pengelolaan Workbench Platform Agen selain penggunaan infrastruktur Anda. Lihat harga Agent Platform Workbench.

Memecahkan masalah

Untuk menemukan metode mendiagnosis dan menyelesaikan error terkait penggunaan reservasi dengan instance Agent Platform Workbench, lihat Memecahkan masalah instance Agent Platform Workbench.

Langkah berikutnya