Questo documento fornisce una panoramica e un confronto tra le policy di posizionamento compatto e le policy dei carichi di lavoro. Entrambe le policy consentono di configurare il posizionamento delle istanze di Compute Engine per ridurre al minimo la latenza di rete.
Per impostazione predefinita, gestisci la posizione delle istanze di computing specificando solo le relative zone. Quando utilizzi prenotazioni future o richieste di ridimensionamento del gruppo di istanze gestite (MIG) per ottenere macchine A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU), le istanze di Compute che ricevi sono densamente collocate. Tuttavia, potresti voler posizionare istanze di calcolo specifiche più vicine tra loro per ottimizzare le prestazioni tra le istanze. Per posizionare le istanze di calcolo più vicine tra loro, puoi applicare policy di posizionamento compatto alle istanze di calcolo o policy di workload ai MIG.
Policy di posizionamento compatto per le istanze di calcolo
Quando applichi policy di posizionamento compatto a istanze di computing autonome o a istanze di computing create collettivamente, Compute Engine tenta di creare istanze di computing il più vicine possibile tra loro. Se la tua applicazione richiede una latenza di rete minima, specifica il campo maxDistance (anteprima) quando crei una policy di posizionamento compatto.
Per saperne di più, consulta Informazioni sulle policy di posizionamento compatto nella documentazione di Compute Engine.
Policy del workload per i MIG
Quando applichi le policy dei workload ai gruppi di istanze gestite, puoi specificare il posizionamento e l'infrastruttura sottostante per le istanze di computing nei tuoi gruppi di istanze gestite. Utilizzando le policy dei workload con A4X Max, A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU), puoi ridurre al minimo la latenza di rete tra le istanze di computing e ottimizzare le prestazioni.
In base ai tipi di macchine utilizzati dalle istanze di Compute nel MIG, le norme del workload sono obbligatorie o facoltative nelle seguenti situazioni:
Per eseguire il deployment di blocchi secondari di istanze A4X Max o A4X, sono necessarie policy del workload.
Per utilizzare le istanze A4, A3 Ultra, A3 Mega o A3 High (8 GPU), le policy del workload sono facoltative.
Per saperne di più, consulta Informazioni sulle policy dei workload nei gruppi di istanze gestite nella documentazione di Compute Engine.
Confronto tra la policy di posizionamento compatto e la policy dei carichi di lavoro
La seguente tabella riassume le differenze tra le norme di posizionamento compatto e le norme per i workload:
| Policy di posizionamento compatto | Policy workload | |
|---|---|---|
| Utilizzo delle norme |
|
Gruppi di istanze gestite (MIG) |
| Tipi di macchine supportati | A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 e G2 |
|
| Semantica del raggruppamento | Compute Engine posiziona le istanze che utilizzano la stessa policy di posizionamento compatto più vicine tra loro. Ti consigliamo di utilizzare una policy di posizionamento diversa per ogni workload. Il riutilizzo di una policy di posizionamento in istanze che eseguono workload diversi fa sì che tutte queste istanze vengano posizionate insieme. Questa collocazione può rendere difficile la creazione di istanze vicine tra loro quando fai lo scale out di un workload specifico. |
Compute Engine posiziona le istanze in un MIG che utilizza una policy del workload più vicine tra loro. Il riutilizzo di una policy di workload in più MIG che eseguono workload diversi raggruppa le istanze nei singoli MIG. Il riutilizzo è ideale per i modelli di addestramento di grandi dimensioni in cui ogni gruppo di istanze deve essere isolato dagli altri. |
| Configurazione di colocation dell'istanza di Compute | Per la collocazione migliore delle istanze di computing, imposta il campo
|
Per la collocazione migliore dell'istanza di computing, imposta il campo
|
| Configurazioni aggiuntive |
|
|
Confronto dei valori di distanza massima
Un valore di distanza massima inferiore garantisce un posizionamento più vicino delle istanze di computing, ma aumenta anche la probabilità che alcune istanze di computing non vengano create.
La tabella seguente mostra la serie di macchine e il numero di istanze di computing supportate da ogni valore di distanza massima:
maxDistance in una policy di posizionamento compatto |
maxTopologyDistance in una policy del workload |
Descrizione | Serie di macchine supportate | Numero massimo di istanze di computing |
|---|---|---|---|---|
| Non specificato (non consigliato) | Non specificato (non consigliato) | Compute Engine tenta di posizionare le istanze di calcolo il più vicino possibile l'una all'altra, ma senza una distanza massima tra le istanze di calcolo. | A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU) | 1500 |
3 |
CLUSTER |
Compute Engine crea istanze di calcolo in blocchi adiacenti. | A4 | 1500 |
2 |
BLOCK |
Compute Engine crea istanze di computing nello stesso blocco. | A4 e A3 Ultra |
|
1 |
SUBBLOCK |
Compute Engine crea istanze di calcolo nello stesso sottoblocco. | A4 e A3 Ultra | 22 |