Questo documento fornisce una panoramica e un confronto tra le policy di posizionamento compatto e le policy del carico di lavoro. Entrambe le policy consentono di configurare il posizionamento delle istanze di macchine virtuali (VM) per ridurre al minimo la latenza di rete. Utilizza le policy di posizionamento compatto per le istanze create singolarmente o in blocco e le policy del workload per i gruppi di istanze gestite (MIG).
Per impostazione predefinita, gestisci la posizione delle tue VM solo specificando le relative zone. Quando utilizzi prenotazioni future o Flex-start con richieste di ridimensionamento del MIG per ottenere macchine A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU), le risorse VM che ricevi sono densamente collocate per impostazione predefinita. Tuttavia, potresti voler posizionare VM specifiche più vicine tra loro per ottimizzare le prestazioni tra le VM in ogni applicazione. Per posizionare le VM più vicine tra loro, puoi applicare policy di posizionamento compatto alle VM o policy del workload a velocità effettiva elevata ai gruppi di istanze gestite.
Policy di posizionamento compatto per le VM
Quando applichi policy di posizionamento compatto alle tue VM, Compute Engine
fa del suo meglio per creare VM il più vicine possibile tra loro. Se
la tua applicazione è sensibile alla latenza e vuoi che le VM siano il più vicine
possibile (massima compattezza), specifica il campo maxDistance
(anteprima) quando
crei una policy di posizionamento compatto.
Per saperne di più, consulta Informazioni sulle policy di posizionamento compatto nella documentazione di Compute Engine.
Policy del workload per i MIG
Una policy del workload consente di specificare il tipo di workload che vuoi eseguire sulla tua infrastruttura. Puoi anche specificare le proprietà fisiche dell'infrastruttura sottostante, ad esempio il posizionamento delle VM, per trovare la corrispondenza migliore con il tipo specificato.
Configura le seguenti impostazioni per una policy del workload:
Tipo di carico di lavoro (
type): per i carichi di lavoro a velocità effettiva elevata (high-throughput), Compute Engine tenta di posizionare le VM il più vicino possibile l'una all'altra. Il posizionamento della VM dipende dal tipo di macchina e dalla disponibilità della zona delle VM.Requisito aggiuntivo per l'utilizzo della topologia di collocazione rigida o dell'acceleratore delle VM. Puoi specificare uno dei seguenti elementi:
Collocazione rigorosa delle VM (
maxTopologyDistance): per ottenere prestazioni di rete granulari e a bassa latenza. Una collocazione rigida significa che, oltre al tentativo di posizionare le VM il più vicino possibile l'una all'altra, puoi specificare ulteriormente la distanza massima tra le VM. Se il requisito di collocazione rigida non viene soddisfatto a causa di vincoli di capacità, il MIG non crea le VM.Topologia degli acceleratori delle VM (
acceleratorTopology): per ottenere prestazioni elevate per i workload distribuiti che vengono eseguiti su più VM che utilizzano una configurazione di rete inter-acceleratore specializzata, ad esempio le VM A4X che utilizzano domini NVLink per le GPU.
Confronto tra la policy di posizionamento compatto e la policy dei carichi di lavoro
La seguente tabella riassume le differenze tra le norme di posizionamento compatto e le norme per i workload:
| Policy di posizionamento compatto | Policy workload | |
|---|---|---|
| Utilizzo con queste risorse |
|
Gruppi di istanze gestite (MIG) |
| Tipi di macchine supportati | Tutte le famiglie di GPU | A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU) |
| Semantica del raggruppamento | Compute Engine posiziona le istanze che utilizzano la stessa policy di posizionamento compatto più vicine tra loro. Ti consigliamo di utilizzare una policy di posizionamento diversa per ogni workload. Il riutilizzo di una policy di posizionamento in istanze che eseguono workload diversi fa sì che tutte queste istanze vengano posizionate insieme. Questa collocazione può rendere difficile la creazione di istanze vicine tra loro quando aumenti le dimensioni di un workload specifico. |
Compute Engine posiziona le istanze in un MIG che utilizza una policy del workload più vicine tra loro. Il riutilizzo di una policy di workload in più MIG che eseguono workload diversi raggruppa le istanze nei singoli MIG. Il riutilizzo è ideale per i modelli di addestramento di grandi dimensioni in cui ogni gruppo di istanze deve essere isolato dagli altri. |
| Configurazione di colocation delle VM | Per la collocazione delle VM con il massimo impegno, imposta il campo
|
Per la collocazione delle VM con il massimo impegno, imposta il
campo |
| Configurazioni aggiuntive |
|
|
Confronto dei valori di distanza massima
Un valore di distanza massima inferiore garantisce un posizionamento più vicino delle VM, ma aumenta anche la probabilità che alcune VM non vengano create.
La tabella seguente mostra la serie di macchine e il numero di VM supportati da ciascun valore di distanza massima:
maxDistance in una policy di posizionamento compatto |
maxTopologyDistance in una policy del workload |
Descrizione | Serie di macchine supportate | Numero massimo di VM |
|---|---|---|---|---|
| Non specificato (non consigliato) | Non specificato (non consigliato) | Compute Engine tenta di posizionare le VM il più vicino possibile l'una all'altra, ma senza una distanza massima tra le VM. | A4, A3 Ultra, A3 Mega, A3 High (8 GPU) | 1500 |
3 |
cluster |
Compute Engine crea le VM in blocchi adiacenti. | A4 | 1500 |
2 |
block |
Compute Engine crea le VM nello stesso blocco. | A4 e A3 Ultra |
|