Descripción general de la política de posición compacta y la política de cargas de trabajo

En este documento, se proporciona una descripción general y una comparación de las políticas de posición compactas y las políticas de cargas de trabajo. Ambas políticas te permiten configurar la posición de las instancias de Compute Engine para minimizar la latencia de red.

De forma predeterminada, la ubicación de las instancias de procesamiento se administra especificando solo sus zonas. Cuando usas reservas futuras o solicitudes de cambio de tamaño de grupo de instancias administrado (MIG) para obtener máquinas A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs), las instancias de procesamiento que recibes están ubicadas de forma densa. Sin embargo, es posible que desees colocar instancias de procesamiento específicas más cerca entre sí para optimizar el rendimiento entre instancias. Para colocar instancias de procesamiento más cerca, puedes aplicar políticas de posición compacta a instancias de procesamiento o políticas de cargas de trabajo a MIGs.

Políticas de posición compacta para instancias de procesamiento

Cuando aplicas políticas de posición compacta a instancias de procesamiento independientes o a instancias de procesamiento creadas de forma masiva, Compute Engine hace todo lo posible para crear instancias de procesamiento lo más cerca posible unas de otras. Si tu aplicación requiere una latencia de red mínima, especifica el campo maxDistance (vista previa) cuando crees una política de posición compacta.

Para obtener más información, consulta Acerca de las políticas de posición compacta en la documentación de Compute Engine.

Políticas de cargas de trabajo para MIG

Cuando aplicas políticas de cargas de trabajo a los MIG, puedes especificar la infraestructura subyacente y la posición de las instancias de procesamiento en tus MIG. Si usas políticas de carga de trabajo con A4X Max, A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs), puedes minimizar la latencia de red entre tus instancias de procesamiento y optimizar el rendimiento.

Según los tipos de máquinas que usan las instancias de procesamiento en tu MIG, las políticas de carga de trabajo son obligatorias u opcionales en las siguientes situaciones:

  • Para implementar subbloques de instancias A4X Max o A4X, se requieren políticas de carga de trabajo.

  • Las políticas de carga de trabajo son opcionales para usar instancias A4, A3 Ultra, A3 Mega o A3 High (8 GPUs).

Para obtener más información, consulta Acerca de las políticas de cargas de trabajo en los MIG en la documentación de Compute Engine.

Comparación entre la política de posición compacta y la política de carga de trabajo

En la siguiente tabla, se resumen las diferencias entre las políticas de ubicación compacta y las políticas de cargas de trabajo:

Política de posición compacta Política de cargas de trabajo
Uso de la política
  • Instancias independientes
  • Instancias implementadas con la API de Bulk
Grupos de instancias administrados (MIG)
Tipos de máquinas admitidos A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 y G2
  • Para inicio flexible: A4 y A3 Ultra
  • Para instancias Spot o reservas: A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs)
Semántica de agrupación

Compute Engine coloca las instancias que usan la misma política de posición compacta más cerca entre sí.

Te recomendamos que uses una política de posición diferente para cada carga de trabajo. Si se reutiliza una política de posición en instancias que ejecutan diferentes cargas de trabajo, todas esas instancias se colocarán juntas. Esta ubicación conjunta puede dificultar la creación de instancias cercanas entre sí cuando se expande una carga de trabajo específica.

Compute Engine coloca las instancias en un MIG que usa una política de cargas de trabajo más cerca entre sí.

Si se reutiliza una política de cargas de trabajo en varios MIGs que ejecutan diferentes cargas de trabajo, las instancias se colocan juntas en los MIGs individuales. La reutilización es ideal para modelos de entrenamiento grandes en los que cada grupo de instancias debe aislarse de los demás.

Configuración de la colocación de instancias de procesamiento

Para la colocación de instancias de procesamiento con el mayor esfuerzo posible, establece el campo groupPlacementPolicy.collocation en COLLOCATED.

Para la colocación de instancias de procesamiento con el mayor esfuerzo posible, establece el campo workloadPolicy.type en HIGH_THROUGHPUT.

Configuraciones adicionales
  • Para la colocación estricta de instancias de procesamiento, especifica el campo maxDistance.
  • En el caso de las familias de GPU que admiten particiones, como A4X, especifica el campo gpuTopology.
  • Para la colocación estricta de instancias de procesamiento, especifica el campo maxTopologyDistance.
  • En el caso de las familias de GPU que admiten particiones, como A4X, especifica el campo acceleratorTopology.

Comparación de los valores de distancia máxima

Un valor de distancia máxima más bajo garantiza una posición más cercana de las instancias de procesamiento, pero también aumenta la probabilidad de que no se creen algunas instancias de procesamiento.

En la siguiente tabla, se muestran las series de máquinas y la cantidad de instancias de procesamiento que admite cada valor de distancia máxima:

maxDistance en una política de posición de compactación maxTopologyDistance en una política de cargas de trabajo Descripción Serie de máquinas compatible Cantidad máxima de instancias de procesamiento
Sin especificar (no recomendado) Sin especificar (no recomendado) Compute Engine hace su mejor esfuerzo para colocar las instancias de procesamiento lo más cerca posible entre sí, pero sin una distancia máxima entre ellas. A4X Max, A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs) 1500
3 CLUSTER Compute Engine crea instancias de procesamiento en bloques adyacentes. A4 1,500
2 BLOCK Compute Engine crea instancias de procesamiento en el mismo bloque. A4 y A3 Ultra
  • Para instancias A4: 150
  • Para instancias A3 Ultra, A3 Mega y A3 High (8 GPUs): 256
1 SUBBLOCK Compute Engine crea instancias de procesamiento en el mismo subbloque. A4 y A3 Ultra 22

¿Qué sigue?