En este documento, se proporciona una descripción general y una comparación de las políticas de posición compactas y las políticas de cargas de trabajo. Ambas políticas te permiten configurar la posición de las instancias de máquinas virtuales (VM) para minimizar la latencia de red. Usa políticas de posición compacta para las instancias que se crean de forma individual o masiva, y usa políticas de cargas de trabajo para los grupos de instancias administrados (MIG).
De forma predeterminada, solo especificas las zonas de tus VMs para administrar su ubicación. Cuando usas reservas futuras o Flex-start con solicitudes de cambio de tamaño de MIG para obtener máquinas A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs), los recursos de VM que recibes se colocan de forma densa de forma predeterminada. Sin embargo, es posible que desees colocar VMs específicas más cerca entre sí para optimizar el rendimiento entre VM en cada aplicación. Para colocar las VMs más cerca, puedes aplicar políticas de posición de compactación a las VMs o políticas de cargas de trabajo de alto rendimiento a los MIGs.
Política de posición compacta para VMs
Cuando aplicas políticas de posición compacta a tus VMs, Compute Engine hace todo lo posible para crear VMs lo más cerca posible entre sí. Si tu aplicación es sensible a la latencia y deseas que las VMs estén lo más cerca posible (máxima compactación), especifica el campo maxDistance (versión preliminar) cuando crees una política de posición compacta.
Para obtener más información, consulta Acerca de las políticas de posición compacta en la documentación de Compute Engine.
Política de cargas de trabajo para MIGs
Una política de carga de trabajo te permite especificar el tipo de carga de trabajo que deseas ejecutar en tu infraestructura. También puedes especificar las propiedades físicas de la infraestructura subyacente, como la ubicación de la VM, para que coincidan mejor con el tipo especificado.
Establece los siguientes parámetros de configuración para una política de cargas de trabajo:
Tipo de carga de trabajo (
type): Para las cargas de trabajo de alto rendimiento (high-throughput), Compute Engine hace todo lo posible para colocar las VMs lo más cerca posible entre sí. La posición de la VM depende del tipo de máquina y de la disponibilidad de la zona de las VMs.Es un requisito adicional para usar la colocación estricta o la topología de aceleradores de las VMs. Puedes especificar una de las siguientes opciones:
Colocación estricta de VMs (
maxTopologyDistance): Para lograr un rendimiento de red granular y de baja latencia. Una colocación estricta significa que, además del mejor esfuerzo para colocar tus VMs lo más cerca posible entre sí, puedes especificar aún más la distancia máxima entre las VMs. Si no se cumple el requisito de ubicación conjunta estricta debido a restricciones de capacidad, el MIG no crea las VMs.Topología de aceleradores de VMs (
acceleratorTopology): Para lograr un alto rendimiento en cargas de trabajo distribuidas que se ejecutan en varias VMs que usan una configuración de red interacelerador especializada, por ejemplo, VMs A4X que usan dominios NVLink para GPUs.
Comparación entre la política de posición compacta y la política de carga de trabajo
En la siguiente tabla, se resumen las diferencias entre las políticas de ubicación compacta y las políticas de cargas de trabajo:
| Política de posición compacta | Política de cargas de trabajo | |
|---|---|---|
| Uso con estos recursos |
|
Grupos de instancias administrados (MIG) |
| Tipos de máquinas admitidos | Todas las familias de GPU | A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs) |
| Semántica de la agrupación | Compute Engine coloca las instancias que usan la misma política de posición de compactación más cerca entre sí. Te recomendamos que uses una política de posición diferente para cada carga de trabajo. Si se reutiliza una política de posición en instancias que ejecutan diferentes cargas de trabajo, todas esas instancias se colocarán juntas. Esta ubicación conjunta puede dificultar la creación de instancias cercanas entre sí cuando se expande una carga de trabajo específica. |
Compute Engine coloca las instancias en un MIG que usa una política de cargas de trabajo más cerca entre sí. Reutilizar una política de carga de trabajo en varios MIGs que ejecutan diferentes cargas de trabajo coloca las instancias en MIGs individuales. La reutilización es ideal para modelos de entrenamiento grandes en los que cada grupo de instancias debe aislarse de los demás. |
| Configuración de colocación de VMs | Para la colocación de VM con el mejor esfuerzo posible, establece el campo |
Para la colocación de VM con el mayor esfuerzo posible, establece el campo |
| Configuraciones adicionales |
|
|
Comparación de los valores de distancia máxima
Un valor de distancia máxima más bajo garantiza una colocación más cercana de las VM, pero también aumenta la probabilidad de que no se creen algunas VMs.
En la siguiente tabla, se muestran las series de máquinas y la cantidad de VMs que admite cada valor de distancia máxima:
maxDistance en una política de posición compacta |
maxTopologyDistance en una política de cargas de trabajo |
Descripción | Serie de máquinas compatible | Cantidad máxima de VMs |
|---|---|---|---|---|
| Sin especificar (no recomendado) | Sin especificar (no recomendado) | Compute Engine hace todo lo posible para colocar las VMs lo más cerca posible entre sí, pero sin una distancia máxima entre ellas. | A4, A3 Ultra, A3 Mega y A3 High (8 GPUs) | 1500 |
3 |
cluster |
Compute Engine crea VMs en bloques adyacentes. | A4 | 1,500 |
2 |
block |
Compute Engine crea VMs en el mismo bloque. | A4 y A3 Ultra |
|