Questo documento fornisce una panoramica e un confronto tra le policy di posizionamento compatto e le policy del workload. Entrambe le policy consentono di configurare il posizionamento delle istanze di Compute Engine per ridurre al minimo la latenza di rete.
Per impostazione predefinita, gestisci la località delle istanze di computing specificando solo le relative zone. Quando utilizzi le richieste di ridimensionamento di prenotazioni future o di gruppo di istanze gestite (MIG) per ottenere macchine A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU), le istanze di computing che ricevi sono collocate in modo denso. Tuttavia, potresti voler posizionare istanze di computing specifiche più vicine tra loro per ottimizzare le prestazioni tra le istanze. Per posizionare le istanze di computing più vicine tra loro, puoi applicare policy di posizionamento compatto alle istanze di computing o policy del workload ai MIG.
Policy di posizionamento compatto per le istanze di computing
Quando applichi le policy di posizionamento compatto alle istanze di computing autonome o alle istanze di computing create in blocco, Compute Engine tenta di creare le istanze di computing il più vicino possibile l'una all'altra. Se la tua
applicazione richiede una latenza di rete minima, specifica il maxDistance
campo (anteprima) quando
crei una policy di posizionamento compatto.
Per saperne di più, consulta Informazioni sulle policy di posizionamento compatto nella documentazione di Compute Engine.
Policy del workload per i MIG
Quando applichi le policy del workload ai MIG, puoi specificare il posizionamento e l'infrastruttura sottostante per le istanze di computing nei MIG. Utilizzando le policy del workload con A4X Max, A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU), puoi ridurre al minimo la latenza di rete tra le istanze di computing e ottimizzare le prestazioni.
A seconda dei tipi di macchine utilizzati dalle istanze di computing nel MIG, le policy del workload sono obbligatorie o facoltative nelle seguenti situazioni:
Per eseguire il deployment di sottoblocchi di istanze A4X Max o A4X, sono necessarie le policy del workload.
Per utilizzare le istanze A4, A3 Ultra, A3 Mega o A3 High (8 GPU), le policy del workload sono facoltative.
Per saperne di più, consulta Informazioni sulle policy del workload nei MIG nella documentazione di Compute Engine.
Confronto tra policy di posizionamento compatto e policy del workload
La seguente tabella riassume le differenze tra le policy di posizionamento compatto e le policy del workload:
| Policy di posizionamento compatto | Policy del workload | |
|---|---|---|
| Utilizzo delle policy |
|
Gruppi di istanze gestite (MIG) |
| Tipi di macchine supportati | A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 e G2 |
|
| Semantica di raggruppamento | Compute Engine posiziona le istanze che utilizzano la stessa policy di posizionamento compatto più vicine tra loro. Ti consigliamo di utilizzare una policy di posizionamento diversa per ogni workload. Il riutilizzo di una policy di posizionamento tra le istanze che eseguono workload diversi fa sì che tutte queste istanze vengano posizionate insieme. Questa collocazione può rendere difficile la creazione di istanze vicine tra loro quando esegui lo scale out di un workload specifico. |
Compute Engine posiziona le istanze in un MIG che utilizza una policy del workload più vicine tra loro. Il riutilizzo di una policy del workload in più MIG che eseguono workload diversi workload diversi posiziona le istanze in singoli MIG insieme. Il riutilizzo è ideale per i modelli di addestramento di grandi dimensioni in cui ogni gruppo di istanze deve essere isolato l'uno dall'altro. |
| Configurazione della collocazione delle istanze di computing | Per la collocazione delle istanze di computing con il criterio del "best effort", imposta il
|
Per la collocazione delle istanze di computing con il criterio del "best effort", imposta il
|
| Configurazioni aggiuntive |
|
|
Confronto dei valori di distanza massima
Un valore di distanza massima inferiore garantisce un posizionamento più vicino delle istanze di computing, ma aumenta anche la probabilità che alcune istanze di computing non vengano create.
La tabella seguente mostra la serie di macchine e il numero di istanze di computing supportate da ogni valore di distanza massima:
maxDistance in una policy di posizionamento compatto |
maxTopologyDistance in una policy del workload |
Descrizione | Serie di macchine supportate | Numero massimo di istanze di computing |
|---|---|---|---|---|
| Non specificato (non consigliato) | Non specificato (non consigliato) | Compute Engine tenta di posizionare le istanze di computing il più vicino possibile l'una all'altra, ma senza una distanza massima tra le istanze di computing. | A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU) | 1500 |
3 |
CLUSTER |
Compute Engine crea istanze di computing in blocchi adiacenti. | A4 | 1500 |
2 |
BLOCK |
Compute Engine crea istanze di computing nello stesso blocco. | A4 e A3 Ultra |
|
1 |
SUBBLOCK |
Compute Engine crea istanze di computing nello stesso sottoblocco. | A4 e A3 Ultra | 22 |