Visão geral das políticas de posicionamento compacto e de carga de trabalho

Este documento apresenta uma visão geral e uma comparação das políticas de posicionamento compacto e de carga de trabalho. As duas políticas permitem configurar o posicionamento de instâncias de máquina virtual (VM) para minimizar a latência de rede. Use políticas de posicionamento compacto para instâncias criadas individualmente ou em massa e políticas de carga de trabalho para grupos gerenciados de instâncias (MIGs).

Por padrão, você gerencia o local das VMs apenas especificando as zonas delas. Quando você usa reservas futuras ou Flex-start com solicitações de redimensionamento do MIG para receber máquinas A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs), os recursos de VM que você recebe são densamente colocados por padrão. No entanto, talvez você queira colocar VMs específicas mais próximas umas das outras para otimizar o desempenho entre elas em cada aplicativo. Para colocar as VMs mais próximas, aplique políticas de posicionamento compacto a VMs ou políticas de carga de trabalho de alta capacidade de transferência a MIGs.

Política de posicionamento compacto para VMs

Quando você aplica políticas de posicionamento compacto às VMs, o Compute Engine faz o possível para criar VMs o mais próximas possível umas das outras. Se o aplicativo for sensível à latência e você quiser que as VMs estejam o mais próximo possível (compactação máxima), especifique o campo maxDistance (Prévia) ao criar uma política de posicionamento compacto.

Para mais informações, consulte Sobre as políticas de posicionamento compacto na documentação do Compute Engine.

Política de carga de trabalho para MIGs

Com uma política de carga de trabalho, é possível especificar o tipo de carga de trabalho que você quer executar na sua infraestrutura. Também é possível especificar as propriedades físicas da infraestrutura subjacente, como o posicionamento da VM, para corresponder melhor ao tipo especificado.

Você faz as seguintes configurações para uma política de carga de trabalho:

  • Tipo de carga de trabalho (type): para cargas de trabalho de alta capacidade (high-throughput), o Compute Engine faz o possível para colocar as VMs o mais perto possível umas das outras. O posicionamento da VM depende do tipo de máquina e da disponibilidade de zona das VMs.

  • Requisito adicional para usar a colocalização estrita ou a topologia de acelerador de VMs. É possível especificar uma das seguintes opções:

    • Colocação estrita de VMs (maxTopologyDistance): para alcançar um desempenho de rede granular e de baixa latência. Uma colocation estrita significa que, além do melhor esforço para colocar as VMs o mais próximo possível umas das outras, você pode especificar ainda mais a distância máxima entre elas. Se o requisito de colocation estrita não for atendido devido a restrições de capacidade, o MIG não vai criar as VMs.

    • Topologia de aceleradores de VMs (acceleratorTopology): para alcançar alto desempenho em cargas de trabalho distribuídas que são executadas em várias VMs que usam uma configuração de rede interaceleradora especializada, por exemplo, VMs A4X que usam domínios NVLink para GPUs.

Comparação entre a política de posicionamento compacto e a política de carga de trabalho

A tabela a seguir resume as diferenças entre as políticas de posicionamento compacto e de carga de trabalho:

Política de posicionamento compacto Política de carga de trabalho
Use com estes recursos
  • Instâncias independentes
  • Instâncias implantadas usando a API em massa
Grupos de instâncias gerenciadas (MIGs)
Tipos de máquina aceitos Todas as famílias de GPU A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs)
Semântica de agrupamento

O Compute Engine coloca as instâncias que usam a mesma política de posicionamento compacto mais próximas umas das outras.

Recomendamos que você use uma política de posicionamento diferente para cada carga de trabalho. Reutilizar uma política de posicionamento em instâncias que executam cargas de trabalho diferentes faz com que todas essas instâncias sejam colocadas juntas. Essa colocalização pode dificultar a criação de instâncias próximas umas das outras ao escalonar horizontalmente uma carga de trabalho específica.

O Compute Engine coloca as instâncias em um MIG que usa uma política de carga de trabalho mais próxima.

Reutilizar uma política de carga de trabalho em vários MIGs que executam cargas de trabalho diferentes coloca as instâncias em MIGs individuais juntas. A reutilização é ideal para modelos de treinamento grandes em que cada grupo de instâncias precisa ser isolado um do outro.

Configuração de colocation de VM

Para a colocalização de VMs com o melhor esforço possível, defina o campo groupPlacementPolicy.collocation como COLLOCATED.

Para a colocalização de VMs com o melhor esforço possível, defina o campo workloadPolicy.type como HIGH_THROUGHPUT.

Outras configurações
  • Para um posicionamento estrito de VM, especifique o campo maxDistance.
  • Para famílias de GPU que oferecem suporte a particionamento, como A4X, especifique o campo gpuTopology.
  • Para um posicionamento estrito de VM, especifique o campo maxTopologyDistance.
  • Para famílias de GPU que oferecem suporte a particionamento, como A4X, especifique o campo acceleratorTopology.

Comparação de valores de distância máxima

Um valor de distância máxima menor garante um posicionamento mais próximo da VM, mas também aumenta a chance de algumas VMs não serem criadas.

A tabela a seguir mostra as séries de máquinas e o número de VMs que cada valor de distância máxima aceita:

maxDistance em uma política de posicionamento compacto maxTopologyDistance em uma política de carga de trabalho Descrição Série de máquinas compatível Número máximo de VMs
Não especificado (não recomendado) Não especificado (não recomendado) O Compute Engine faz o possível para colocar as VMs o mais próximo possível uma da outra, mas sem distância máxima entre elas. A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) 1500
3 cluster O Compute Engine cria VMs em blocos adjacentes. A4 1.500
2 block O Compute Engine cria VMs no mesmo bloco. A4 e A3 Ultra
  • Para VMs A4: 150
  • Para VMs A3 Ultra, A3 Mega e A3 High (8 GPUs): 256

A seguir