Panoramica della policy di posizionamento compatto e della policy workload

Questo documento fornisce una panoramica e un confronto tra le policy di posizionamento compatto e le policy del workload. Entrambe le policy consentono di configurare il posizionamento delle istanze di Compute Engine per ridurre al minimo la latenza di rete.

Per impostazione predefinita, gestisci la località delle istanze di computing specificando solo le relative zone. Quando utilizzi le richieste di ridimensionamento di prenotazioni future o di gruppo di istanze gestite (MIG) per ottenere macchine A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU), le istanze di computing che ricevi sono collocate in modo denso. Tuttavia, potresti voler posizionare istanze di computing specifiche più vicine tra loro per ottimizzare le prestazioni tra le istanze. Per posizionare le istanze di computing più vicine tra loro, puoi applicare policy di posizionamento compatto alle istanze di computing o policy del workload ai MIG.

Policy di posizionamento compatto per le istanze di computing

Quando applichi le policy di posizionamento compatto alle istanze di computing autonome o alle istanze di computing create in blocco, Compute Engine tenta di creare le istanze di computing il più vicino possibile l'una all'altra. Se la tua applicazione richiede una latenza di rete minima, specifica il maxDistance campo (anteprima) quando crei una policy di posizionamento compatto.

Per saperne di più, consulta Informazioni sulle policy di posizionamento compatto nella documentazione di Compute Engine.

Policy del workload per i MIG

Quando applichi le policy del workload ai MIG, puoi specificare il posizionamento e l'infrastruttura sottostante per le istanze di computing nei MIG. Utilizzando le policy del workload con A4X Max, A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU), puoi ridurre al minimo la latenza di rete tra le istanze di computing e ottimizzare le prestazioni.

A seconda dei tipi di macchine utilizzati dalle istanze di computing nel MIG, le policy del workload sono obbligatorie o facoltative nelle seguenti situazioni:

  • Per eseguire il deployment di sottoblocchi di istanze A4X Max o A4X, sono necessarie le policy del workload.

  • Per utilizzare le istanze A4, A3 Ultra, A3 Mega o A3 High (8 GPU), le policy del workload sono facoltative.

Per saperne di più, consulta Informazioni sulle policy del workload nei MIG nella documentazione di Compute Engine.

Confronto tra policy di posizionamento compatto e policy del workload

La seguente tabella riassume le differenze tra le policy di posizionamento compatto e le policy del workload:

Policy di posizionamento compatto Policy del workload
Utilizzo delle policy
  • Istanze autonome
  • Istanze di cui è stato eseguito il deployment utilizzando l'API Bulk
Gruppi di istanze gestite (MIG)
Tipi di macchine supportati A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 e G2
  • Per l'avvio flessibile: A4 e A3 Ultra
  • Per le istanze spot o le prenotazioni: A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU)
Semantica di raggruppamento

Compute Engine posiziona le istanze che utilizzano la stessa policy di posizionamento compatto più vicine tra loro.

Ti consigliamo di utilizzare una policy di posizionamento diversa per ogni workload. Il riutilizzo di una policy di posizionamento tra le istanze che eseguono workload diversi fa sì che tutte queste istanze vengano posizionate insieme. Questa collocazione può rendere difficile la creazione di istanze vicine tra loro quando esegui lo scale out di un workload specifico.

Compute Engine posiziona le istanze in un MIG che utilizza una policy del workload più vicine tra loro.

Il riutilizzo di una policy del workload in più MIG che eseguono workload diversi workload diversi posiziona le istanze in singoli MIG insieme. Il riutilizzo è ideale per i modelli di addestramento di grandi dimensioni in cui ogni gruppo di istanze deve essere isolato l'uno dall'altro.

Configurazione della collocazione delle istanze di computing

Per la collocazione delle istanze di computing con il criterio del "best effort", imposta il groupPlacementPolicy.collocation campo su COLLOCATED.

Per la collocazione delle istanze di computing con il criterio del "best effort", imposta il workloadPolicy.type campo su HIGH_THROUGHPUT.

Configurazioni aggiuntive
  • Per il posizionamento rigoroso delle istanze di computing, specifica il maxDistance campo.
  • Per le famiglie di GPU che supportano il partizionamento, come A4X, specifica il gpuTopology campo.
  • Per il posizionamento rigoroso delle istanze di computing, specifica il maxTopologyDistance campo.
  • Per le famiglie di GPU che supportano il partizionamento, come A4X, specifica il acceleratorTopology campo.

Confronto dei valori di distanza massima

Un valore di distanza massima inferiore garantisce un posizionamento più vicino delle istanze di computing, ma aumenta anche la probabilità che alcune istanze di computing non vengano create.

La tabella seguente mostra la serie di macchine e il numero di istanze di computing supportate da ogni valore di distanza massima:

maxDistance in una policy di posizionamento compatto maxTopologyDistance in una policy del workload Descrizione Serie di macchine supportate Numero massimo di istanze di computing
Non specificato (non consigliato) Non specificato (non consigliato) Compute Engine tenta di posizionare le istanze di computing il più vicino possibile l'una all'altra, ma senza una distanza massima tra le istanze di computing. A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU) 1500
3 CLUSTER Compute Engine crea istanze di computing in blocchi adiacenti. A4 1500
2 BLOCK Compute Engine crea istanze di computing nello stesso blocco. A4 e A3 Ultra
  • Per le istanze A4: 150
  • Per le istanze A3 Ultra, A3 Mega e A3 High (8 GPU) : 256
1 SUBBLOCK Compute Engine crea istanze di computing nello stesso sottoblocco. A4 e A3 Ultra 22

Passaggi successivi