Dokumen ini menjelaskan cara membuat kebijakan untuk grup instance terkelola (MIG) yang memiliki instance Compute Engine A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU), atau H4D. Untuk mempelajari lebih lanjut persyaratan dan batasan yang Anda terapkan saat membuat kebijakan workload, lihat artikel Tentang kebijakan workload.
Kebijakan workload memungkinkan Anda menentukan penempatan atau topologi untuk instance Compute Engine di MIG. Misalnya, Anda dapat menggunakan kebijakan workload untuk menempatkan instance komputasi lebih berdekatan satu sama lain, sehingga meminimalkan latensi jaringan untuk workload kecerdasan buatan (AI), machine learning (ML), atau komputasi berperforma tinggi (HPC).
Sebelum memulai
-
Siapkan autentikasi jika Anda belum melakukannya.
Autentikasi memverifikasi identitas Anda untuk mengakses layanan Google Cloud dan API. Untuk menjalankan
kode atau sampel dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke
Compute Engine dengan memilih salah satu opsi berikut:
Pilih tab untuk melihat bagaimana Anda berencana menggunakan contoh di halaman ini:
gcloud
-
Instal Google Cloud CLI. Setelah penginstalan, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud initJika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
-
- Tetapkan region dan zona default.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.
Instal Google Cloud CLI.
Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk membuat dan menerapkan kebijakan workload ke MIG,
minta administrator untuk memberi Anda
peran IAM Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1)
di project.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin yang diperlukan untuk membuat dan menerapkan kebijakan workload ke MIG. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk membuat dan menerapkan kebijakan workload ke MIG:
-
Untuk membuat kebijakan beban kerja:
compute.resourcePolicies.createpada project
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Membuat kebijakan beban kerja
Untuk membuat kebijakan workload, gunakan salah satu metode berikut berdasarkan seri mesin yang digunakan instance komputasi di MIG Anda:
Membuat kebijakan beban kerja untuk instance A4X Max atau A4X
Buat kebijakan workload untuk instance A4, A3 Ultra, A3 Mega, A3 High (8 GPU), atau H4D
Membuat kebijakan workload untuk instance A4X Max atau A4X
Jika Anda menerapkan kebijakan beban kerja ke instance A4X Max atau A4X di MIG, Anda harus menentukan nilai topologi akselerator saat membuat kebijakan. Tindakan ini membantu workload Anda mencapai performa jaringan non-blocking berskala besar.
Untuk membuat kebijakan workload untuk instance A4X Max atau A4X, pilih salah satu opsi berikut:
gcloud
Untuk membuat kebijakan beban kerja untuk instance A4X Max atau A4X, gunakan
perintah gcloud compute resource-policies create workload-policy
dengan flag --accelerator-topology=1x72:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
Ganti kode berikut:
WORKLOAD_POLICY_NAME: nama untuk kebijakan workload Anda.REGION: region tempat membuat kebijakan workload Anda. Tentukan region tempat Anda ingin membuat MIG, dan tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk meninjau region tempat jenis mesin A4X Max atau A4X tersedia, lihat Region dan zona yang tersedia.
REST
Untuk membuat kebijakan beban kerja untuk instance A4X Max atau A4X, buat permintaan POST
ke
metode resourcePolicies.insert.
Dalam isi permintaan, sertakan kolom acceleratorTopology yang ditetapkan ke 1x72:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
Ganti kode berikut:
PROJECT_ID: ID project tempat Anda ingin membuat kebijakan workload.REGION: region tempat membuat kebijakan workload Anda. Tentukan region tempat Anda ingin membuat MIG, dan tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk meninjau region tempat jenis mesin A4X Max atau A4X tersedia, lihat Region dan zona yang tersedia.WORKLOAD_POLICY_NAME: nama untuk kebijakan workload Anda.
Membuat kebijakan workload untuk instance A4, A3 Ultra, A3 Mega, A3 High (8 GPU), atau H4D
Jika Anda ingin menerapkan kebijakan workload ke instance A4, A3 Ultra, A3 Mega, A3 High (8 GPU), atau H4D di MIG, sebaiknya tentukan nilai jarak topologi maksimum saat membuat kebijakan. Tindakan ini membantu memastikan penempatan yang lebih dekat di antara instance komputasi Anda. Namun, semakin ringkas penempatan yang Anda tentukan, semakin sedikit resource yang mungkin tersedia di zona tempat Anda ingin membuat instance komputasi.
Untuk membuat kebijakan workload untuk instance A4, A3 Ultra, A3 Mega, atau A3 High (8 GPU), pilih salah satu opsi berikut:
gcloud
Untuk membuat kebijakan beban kerja, gunakan
perintah gcloud compute resource-policies create workload-policy. Berdasarkan seberapa dekat Anda ingin menempatkan instance komputasi di MIG, sertakan tanda berikut dalam perintah:
Untuk menempatkan instance komputasi Anda berdekatan satu sama lain berdasarkan upaya terbaik, sertakan tanda
--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONUntuk mengontrol lebih lanjut penempatan instance komputasi, sertakan flag
--max-topology-distancedan--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
Ganti kode berikut:
WORKLOAD_POLICY_NAME: nama untuk kebijakan workload Anda.REGION: region tempat membuat kebijakan workload Anda. Tentukan region tempat Anda ingin membuat MIG, dan tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk meninjau region tempat jenis mesin GPU tersedia, lihat Region dan zona yang tersedia.TOPOLOGY_DISTANCE: jarak topologi maksimum. Jarak maksimum yang lebih pendek dapat mengurangi probabilitas ketersediaan VM. Tentukan salah satu nilai berikut:Untuk menempatkan instance A4 atau H4D dalam cluster yang sama:
CLUSTERUntuk menempatkan instance A4, A3 Ultra, A3 Mega, A3 High (8 GPU), atau H4D dalam blok yang sama:
BLOCKUntuk menempatkan instance A4, A3 Ultra, atau H4D di sub-blok yang sama:
SUBBLOCK
REST
Untuk membuat kebijakan beban kerja, buat permintaan POST ke
metode resourcePolicies.insert. Berdasarkan seberapa dekat Anda ingin menempatkan instance
komputasi dalam MIG, sertakan kolom berikut dalam isi permintaan:
Untuk menempatkan instance komputasi berdekatan satu sama lain atas dasar upaya terbaik, sertakan kolom
typedi isi permintaan:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }Untuk mengontrol lebih lanjut penempatan instance komputasi, sertakan kolom
maxTopologyDistancedantypedalam isi permintaan:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
Ganti kode berikut:
PROJECT_ID: ID project tempat Anda ingin membuat kebijakan workload.REGION: region tempat membuat kebijakan workload Anda. Tentukan region tempat Anda ingin membuat MIG, dan tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk meninjau region tempat jenis mesin GPU tersedia, lihat Region dan zona yang tersedia.WORKLOAD_POLICY_NAME: nama untuk kebijakan workload Anda.TOPOLOGY_DISTANCE: jarak topologi maksimum. Jarak maksimum yang lebih pendek dapat mengurangi probabilitas ketersediaan VM. Tentukan salah satu nilai berikut:Untuk menempatkan instance A4 atau H4D dalam cluster yang sama:
CLUSTERUntuk menempatkan instance A4, A3 Ultra, A3 Mega, A3 High (8 GPU), atau H4D dalam blok yang sama:
BLOCKUntuk menempatkan instance A4, A3 Ultra, atau H4D di sub-blok yang sama:
SUBBLOCK
Langkah berikutnya
Setelah membuat kebijakan workload, pelajari cara menerapkannya ke MIG:
Pelajari cara melihat topologi instance komputasi.
Pelajari cara melihat kebijakan workload.
Pelajari cara mengganti, menghapus, atau menghapus kebijakan beban kerja.