Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Ringkasan kebijakan penempatan rapat dan kebijakan beban kerja

Dokumen ini memberikan ringkasan dan perbandingan kebijakan penempatan rapat dan kebijakan workload. Kedua kebijakan ini memungkinkan Anda mengonfigurasi penempatan instance Compute Engine untuk meminimalkan latensi jaringan.

Secara default, Anda mengelola lokasi instance komputasi dengan hanya menentukan zonanya. Saat Anda menggunakan permintaan pemesanan untuk masa mendatang atau permintaan pengubahan ukuran grup instance terkelola (MIG) untuk mendapatkan mesin A4X, A4, A3 Ultra, A3 Mega, dan A3 High (8 GPU), instance komputasi yang Anda terima akan ditempatkan secara padat. Namun, Anda mungkin ingin menempatkan instance komputasi tertentu lebih berdekatan untuk mengoptimalkan performa antar-instance. Untuk menempatkan instance komputasi lebih berdekatan, Anda dapat menerapkan kebijakan penempatan rapat ke instance komputasi atau kebijakan workload ke MIG.

Kebijakan penempatan rapat untuk instance komputasi

Saat Anda menerapkan kebijakan penempatan rapat ke instance komputasi mandiri, atau instance komputasi yang dibuat secara massal, Compute Engine akan berupaya sebaik mungkin untuk membuat instance komputasi sedekat mungkin satu sama lain. Jika aplikasi Anda memerlukan latensi jaringan minimal, tentukan maxDistance kolom (Pratinjau) saat Anda membuat kebijakan penempatan rapat.

Untuk mengetahui informasi selengkapnya, lihat Tentang kebijakan penempatan rapat dalam dokumentasi Compute Engine.

Kebijakan workload untuk MIG

Saat Anda menerapkan kebijakan workload ke MIG, Anda dapat menentukan penempatan dan infrastruktur yang mendasarinya untuk instance komputasi di MIG Anda. Dengan menggunakan kebijakan workload dengan A4X Max, A4X, A4, A3 Ultra, A3 Mega, dan A3 High (8 GPU), Anda dapat meminimalkan latensi jaringan di antara instance komputasi dan mengoptimalkan performa.

Berdasarkan jenis mesin yang digunakan instance komputasi di MIG Anda, kebijakan workload diperlukan atau bersifat opsional dalam situasi berikut:

Untuk men-deploy sub-blok instance A4X Max atau A4X, kebijakan workload diperlukan.
Untuk menggunakan instance A4, A3 Ultra, A3 Mega, atau A3 High (8 GPU), kebijakan workload bersifat opsional.

Untuk mengetahui informasi selengkapnya, lihat Tentang kebijakan workload di MIG dalam dokumentasi Compute Engine.

Perbandingan kebijakan penempatan rapat dan kebijakan workload

Tabel berikut merangkum perbedaan antara kebijakan penempatan rapat dan kebijakan workload:

	Kebijakan penempatan rapat	Kebijakan workload
Penggunaan kebijakan	Instance mandiri Instance yang di-deploy menggunakan Bulk API	Grup instance terkelola (MIG)
Jenis mesin yang didukung	A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2, dan G2	Untuk Flex-start: A4 dan A3 Ultra Untuk Spot atau pemesanan: A4X, A4, A3 Ultra, A3 Mega, dan A3 High (8 GPU)
Semantik pengelompokan	Compute Engine menempatkan instance yang menggunakan kebijakan penempatan rapat yang sama lebih berdekatan. Sebaiknya gunakan kebijakan penempatan yang berbeda untuk setiap workload. Menggunakan kembali kebijakan penempatan di seluruh instance yang menjalankan workload yang berbeda akan menyebabkan semua instance tersebut ditempatkan bersama. Penempatan bersama ini dapat mempersulit pembuatan instance yang berdekatan saat Anda melakukan penskalaan horizontal untuk workload tertentu.	Compute Engine menempatkan instance di MIG yang menggunakan kebijakan workload lebih berdekatan. Menggunakan kembali kebijakan workload di beberapa MIG yang menjalankan workload yang berbeda akan menempatkan instance di MIG individual secara bersamaan. Penggunaan kembali is ideal untuk model pelatihan besar yang setiap grup of instance harus diisolasi satu sama lain.
Konfigurasi penempatan bersama instance komputasi	Untuk penempatan bersama instance komputasi upaya terbaik, tetapkan kolom `groupPlacementPolicy.collocation` ke `COLLOCATED`.	Untuk penempatan bersama instance komputasi upaya terbaik, tetapkan kolom `workloadPolicy.type` ke `HIGH_THROUGHPUT`.
Konfigurasi tambahan	Untuk penempatan instance komputasi yang ketat, tentukan `maxDistance` kolom. Untuk kelompok GPU yang mendukung partisi, seperti A4X, tentukan `gpuTopology` kolom.	Untuk penempatan instance komputasi yang ketat, tentukan kolom `maxTopologyDistance` Untuk kelompok GPU yang mendukung partisi, seperti A4X, tentukan `acceleratorTopology` kolom.

Perbandingan nilai jarak maksimum

Nilai jarak maksimum yang lebih rendah memastikan penempatan instance komputasi yang lebih berdekatan, tetapi juga meningkatkan kemungkinan beberapa instance komputasi tidak akan dibuat.

Tabel berikut menunjukkan seri mesin dan jumlah instance komputasi yang didukung oleh setiap nilai jarak maksimum:

`maxDistance` dalam kebijakan penempatan rapat	`maxTopologyDistance` dalam kebijakan workload	Deskripsi	Seri mesin yang didukung	Jumlah maksimum instance komputasi
Tidak ditentukan (Tidak direkomendasikan)	Tidak ditentukan (Tidak direkomendasikan)	Compute Engine berupaya sebaik mungkin untuk menempatkan instance komputasi sedekat mungkin satu sama lain, tetapi tanpa jarak maksimum di antara instance komputasi.	A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU)	1500
`3`	`CLUSTER`	Compute Engine membuat instance komputasi di blok yang berdekatan.	A4	1.500
`2`	`BLOCK`	Compute Engine membuat instance komputasi di blok yang sama.	A4 dan A3 Ultra	Untuk instance A4: 150 Untuk instance A3 Ultra, A3 Mega, dan A3 High (8 GPU): 256
`1`	`SUBBLOCK`	Compute Engine membuat instance komputasi di sub-blok yang sama.	A4 dan A3 Ultra	22

Ringkasan kebijakan penempatan rapat dan kebijakan beban kerja Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Kebijakan penempatan rapat untuk instance komputasi

Kebijakan workload untuk MIG

Perbandingan kebijakan penempatan rapat dan kebijakan workload

Perbandingan nilai jarak maksimum

Langkah berikutnya

Ringkasan kebijakan penempatan rapat dan kebijakan beban kerja