Este documento apresenta uma visão geral e uma comparação das políticas de posicionamento compacto e das políticas de carga de trabalho. Com as duas políticas, é possível configurar o posicionamento das instâncias do Compute Engine para minimizar a latência de rede.
Por padrão, você gerencia o local das instâncias de computação especificando apenas as zonas delas. Ao usar reservas futuras ou solicitações de redimensionamento de grupo gerenciado de instâncias (MIG) para receber máquinas A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs), as instâncias de computação recebidas são densamente colocadas. No entanto, talvez seja necessário colocar instâncias de computação específicas mais próximas para otimizar o desempenho entre elas. Para colocar instâncias de computação mais próximas, aplique políticas de posicionamento compacto a instâncias de computação ou políticas de carga de trabalho a MIGs.
Políticas de posicionamento compacto para instâncias de computação
Quando você aplica políticas de posicionamento compacto a instâncias de computação independentes ou criadas em massa, o Compute Engine faz o possível para criar instâncias de computação o mais próximo possível umas das outras. Se o aplicativo exigir latência de rede mínima, especifique o campo maxDistance (pré-lançamento) ao criar uma política de posicionamento compacto.
Para mais informações, consulte Sobre as políticas de posicionamento compacto na documentação do Compute Engine.
Políticas de cargas de trabalho para MIGs
Ao aplicar políticas de carga de trabalho a MIGs, é possível especificar o posicionamento e a infraestrutura subjacente das instâncias de computação nos MIGs. Ao usar políticas de carga de trabalho com A4X Max, A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs), é possível minimizar a latência de rede entre as instâncias de computação e otimizar o desempenho.
Com base nos tipos de máquina usados pelas instâncias de computação no MIG, as políticas de carga de trabalho são obrigatórias ou opcionais nas seguintes situações:
Para implantar sub-blocos de instâncias A4X Max ou A4X, são necessárias políticas de carga de trabalho.
Para usar instâncias A4, A3 Ultra, A3 Mega ou A3 High (8 GPUs), as políticas de carga de trabalho são opcionais.
Para mais informações, consulte Sobre políticas de carga de trabalho em MIGs na documentação do Compute Engine.
Comparação entre a política de posicionamento compacto e a política de carga de trabalho
A tabela a seguir resume as diferenças entre as políticas de posicionamento compacto e de carga de trabalho:
| Política de posicionamento compacto | Política de carga de trabalho | |
|---|---|---|
| Uso da política |
|
Grupos de instâncias gerenciadas (MIGs) |
| Tipos de máquina aceitos | A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 e G2 |
|
| Semântica de agrupamento | O Compute Engine coloca as instâncias que usam a mesma política de posicionamento compacto mais próximas umas das outras. Recomendamos que você use uma política de posicionamento diferente para cada carga de trabalho. Reutilizar uma política de posicionamento em instâncias que executam cargas de trabalho diferentes faz com que todas essas instâncias sejam colocadas juntas. Essa colocalização pode dificultar a criação de instâncias próximas umas das outras ao escalonar horizontalmente uma carga de trabalho específica. |
O Compute Engine coloca as instâncias em um MIG que usa uma política de carga de trabalho mais próxima. Reutilizar uma política de carga de trabalho em vários MIGs que executam cargas de trabalho diferentes coloca as instâncias em MIGs individuais juntas. A reutilização é ideal para modelos de treinamento grandes em que cada grupo de instâncias precisa ser isolado um do outro. |
| Configuração de colocation de instâncias de computação | Para a colocação conjunta de instâncias de computação com o melhor esforço possível, defina o campo |
Para a colocalização de instâncias de computação com o melhor esforço, defina o campo
|
| Outras configurações |
|
|
Comparação de valores de distância máxima
Um valor de distância máxima menor garante um posicionamento mais próximo das instâncias de computação, mas também aumenta a chance de algumas não serem criadas.
A tabela a seguir mostra a série de máquinas e o número de instâncias de computação que cada valor de distância máxima aceita:
maxDistance em uma política de posicionamento compacto |
maxTopologyDistance em uma política de carga de trabalho |
Descrição | Série de máquinas compatível | Número máximo de instâncias de computação |
|---|---|---|---|---|
| Não especificado (não recomendado) | Não especificado (não recomendado) | O Compute Engine faz o possível para colocar as instâncias de computação o mais próximo possível umas das outras, mas sem distância máxima entre elas. | A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) | 1500 |
3 |
CLUSTER |
O Compute Engine cria instâncias de computação em blocos adjacentes. | A4 | 1.500 |
2 |
BLOCK |
O Compute Engine cria instâncias de computação no mesmo bloco. | A4 e A3 Ultra |
|
1 |
SUBBLOCK |
O Compute Engine cria instâncias de computação no mesmo sub-bloco. | A4 e A3 Ultra | 22 |