En este documento, se proporciona una descripción general y una comparación de las políticas de posición compactas y las políticas de cargas de trabajo. Ambas políticas te permiten configurar la posición de las instancias de Compute Engine para minimizar la latencia de red.
De forma predeterminada, la ubicación de las instancias de procesamiento se administra especificando solo sus zonas. Cuando usas reservas futuras o solicitudes de cambio de tamaño de grupo de instancias administrado (MIG) para obtener máquinas A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs), las instancias de procesamiento que recibes están ubicadas de forma densa. Sin embargo, es posible que desees colocar instancias de procesamiento específicas más cerca entre sí para optimizar el rendimiento entre instancias. Para colocar instancias de procesamiento más cerca, puedes aplicar políticas de posición compacta a instancias de procesamiento o políticas de cargas de trabajo a MIGs.
Políticas de posición compacta para instancias de procesamiento
Cuando aplicas políticas de posición compacta a instancias de procesamiento independientes o a instancias de procesamiento creadas de forma masiva, Compute Engine hace todo lo posible para crear instancias de procesamiento lo más cerca posible unas de otras. Si tu aplicación requiere una latencia de red mínima, especifica el campo maxDistance (vista previa) cuando crees una política de posición compacta.
Para obtener más información, consulta Acerca de las políticas de posición compacta en la documentación de Compute Engine.
Políticas de cargas de trabajo para MIG
Cuando aplicas políticas de cargas de trabajo a los MIG, puedes especificar la infraestructura subyacente y la posición de las instancias de procesamiento en tus MIG. Si usas políticas de carga de trabajo con A4X Max, A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs), puedes minimizar la latencia de red entre tus instancias de procesamiento y optimizar el rendimiento.
Según los tipos de máquinas que usan las instancias de procesamiento en tu MIG, las políticas de carga de trabajo son obligatorias u opcionales en las siguientes situaciones:
Para implementar subbloques de instancias A4X Max o A4X, se requieren políticas de carga de trabajo.
Las políticas de carga de trabajo son opcionales para usar instancias A4, A3 Ultra, A3 Mega o A3 High (8 GPUs).
Para obtener más información, consulta Acerca de las políticas de cargas de trabajo en los MIG en la documentación de Compute Engine.
Comparación entre la política de posición compacta y la política de carga de trabajo
En la siguiente tabla, se resumen las diferencias entre las políticas de ubicación compacta y las políticas de cargas de trabajo:
| Política de posición compacta | Política de cargas de trabajo | |
|---|---|---|
| Uso de la política |
|
Grupos de instancias administrados (MIG) |
| Tipos de máquinas admitidos | A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 y G2 |
|
| Semántica de agrupación | Compute Engine coloca las instancias que usan la misma política de posición compacta más cerca entre sí. Te recomendamos que uses una política de posición diferente para cada carga de trabajo. Si se reutiliza una política de posición en instancias que ejecutan diferentes cargas de trabajo, todas esas instancias se colocarán juntas. Esta ubicación conjunta puede dificultar la creación de instancias cercanas entre sí cuando se expande una carga de trabajo específica. |
Compute Engine coloca las instancias en un MIG que usa una política de cargas de trabajo más cerca entre sí. Si se reutiliza una política de cargas de trabajo en varios MIGs que ejecutan diferentes cargas de trabajo, las instancias se colocan juntas en los MIGs individuales. La reutilización es ideal para modelos de entrenamiento grandes en los que cada grupo de instancias debe aislarse de los demás. |
| Configuración de la colocación de instancias de procesamiento | Para la colocación de instancias de procesamiento con el mayor esfuerzo posible, establece el campo |
Para la colocación de instancias de procesamiento con el mayor esfuerzo posible, establece el campo |
| Configuraciones adicionales |
|
|
Comparación de los valores de distancia máxima
Un valor de distancia máxima más bajo garantiza una posición más cercana de las instancias de procesamiento, pero también aumenta la probabilidad de que no se creen algunas instancias de procesamiento.
En la siguiente tabla, se muestran las series de máquinas y la cantidad de instancias de procesamiento que admite cada valor de distancia máxima:
maxDistance en una política de posición de compactación |
maxTopologyDistance en una política de cargas de trabajo |
Descripción | Serie de máquinas compatible | Cantidad máxima de instancias de procesamiento |
|---|---|---|---|---|
| Sin especificar (no recomendado) | Sin especificar (no recomendado) | Compute Engine hace su mejor esfuerzo para colocar las instancias de procesamiento lo más cerca posible entre sí, pero sin una distancia máxima entre ellas. | A4X Max, A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs) | 1500 |
3 |
CLUSTER |
Compute Engine crea instancias de procesamiento en bloques adyacentes. | A4 | 1,500 |
2 |
BLOCK |
Compute Engine crea instancias de procesamiento en el mismo bloque. | A4 y A3 Ultra |
|
1 |
SUBBLOCK |
Compute Engine crea instancias de procesamiento en el mismo subbloque. | A4 y A3 Ultra | 22 |