Este documento oferece uma visão geral das VMs de início flexível, detalhando as principais características delas, bem como os requisitos e as limitações aplicados ao criá-las.
As VMs de início flexível são instâncias de máquina virtual (VMs) criadas usando o modelo de provisionamento de início flexível. Esse modelo usa o Programador Dinâmico de Cargas de Trabalho (DWS, na sigla em inglês) para provisionar recursos de computação com desconto de um pool seguro de capacidade, melhorando suas chances de conseguir recursos de alta demanda, como GPUs. Depois de criar VMs de início flexível, o Compute Engine tenta alocar os recursos solicitados em um período específico. Se isso acontecer, as VMs de início flexível serão iniciadas e continuarão em execução por no máximo sete dias.
Para cargas de trabalho que exigem recursos por mais de sete dias ou com uma garantia de capacidade maior, é possível criar uma solicitação de reserva adiantada no modo de calendário para ainda se beneficiar dos descontos do DWS.
Casos de uso de VMs de início flexível
As VMs de início flexível são ideais para executar cargas de trabalho que podem ser iniciadas a qualquer momento, como as seguintes:
Pré-treinamento de modelos pequenos
Ajuste de modelos
Simulação de computação de alto desempenho (HPC)
Inferência em lote
Principais características das VMs de início flexível
Em comparação com outros tipos de instâncias do Compute Engine, as VMs de início flexível têm as seguintes características:
Um tempo de espera para alocar recursos: é possível criar VMs de início flexível antes que o Compute Engine possa alocar os recursos solicitados. No entanto, as VMs só serão iniciadas se os recursos ficarem disponíveis dentro do período especificado. Se os recursos não estiverem disponíveis, a solicitação de criação da VM falhará.
Para mais informações, consulte Tempo de espera da VM flex-start neste documento.
Uma duração de execução limitada: as VMs de início flexível são executadas sem interrupção por até sete dias. Após esse período, o Compute Engine interrompe ou exclui automaticamente as VMs com base na ação de encerramento especificada nas propriedades da VM.
Para mais informações, consulte Duração de execução limitada da VM flex-start neste documento.
Como o Compute Engine aloca VMs: o Compute Engine faz o possível para criar VMs de início flexível bem próximas para minimizar a latência de rede. Para controlar o posicionamento das VMs de início flexível, é possível usar políticas de posicionamento compactas ou políticas de carga de trabalho.
Para mais informações, consulte VM flex-start neste documento.
O modelo de provisionamento de início flexível: você cria VMs de início flexível usando o modelo de provisionamento de início flexível. Esse modelo de provisionamento oferece melhor disponibilidade de recursos e preços com desconto em comparação com as VMs criadas usando o modelo de provisionamento padrão.
Para mais informações sobre cada modelo de provisionamento, consulte Modelos de provisionamento de instâncias do Compute Engine.
Tempo de espera da VM flex-start
Quando você cria uma VM flex-start, a VM não é iniciada imediatamente. O Compute Engine tenta alocar os recursos solicitados e iniciar a VM dentro de um período específico. Se você tiver cota suficiente para os recursos solicitados e o Compute Engine os alocar até o final do tempo de espera, a VM flex-start será iniciada em até dois minutos após a capacidade ficar disponível. Caso contrário, a solicitação de criação da VM falhará.
O tempo de espera varia de acordo com o método usado para criar VMs:
Tempo de espera de VMs de início flexível independentes
Para criar uma VM flex-start independente, especifique um tempo de espera usando o campo requestValidForDuration. É possível definir um tempo de espera de zero segundo ou entre 90 segundos e 7.200 segundos (duas horas).
Com base nos requisitos zonais da carga de trabalho, recomendamos os seguintes tempos de espera para aumentar as chances de sucesso da solicitação de criação de VM flex-start:
Requisitos zonais estritos: se a carga de trabalho exigir que você crie uma VM flex-start em uma zona específica, recomendamos que você defina o campo
requestValidForDurationcomo 90 segundos ou mais, até duas oras. Tempos de espera mais longos ajudam a aumentar suas chances de conseguir recursos. A VM permanece no estadoPENDINGdurante todo esse período.Sem requisitos zonais: se a VM flex-start puder ser executada em qualquer zona da região, recomendamos que você defina o
requestValidForDurationcampo como zero segundo. Esse valor especifica que o Compute Engine só aloca recursos se eles estiverem disponíveis imediatamente. Se a solicitação falhar porque os recursos não estão disponíveis, tente criar a VM flex-start em uma zona diferente.
Para interromper uma solicitação de criação de VM enquanto o Compute Engine tenta alocar recursos, exclua a VM de início flexível.
Tempo de espera de MIGs com VMs de início flexível
Se você adicionar VMs de início flexível a um grupo gerenciado de instâncias (MIG), o Compute Engine continuará tentando provisionar os recursos solicitados até que ele seja bem-sucedido ou você cancele a solicitação. A maneira como o Compute Engine adiciona VMs ao MIG varia de acordo com o método de criação:
Solicitações de redimensionamento do MIG: o Compute Engine adiciona as VMs solicitadas ao MIG de uma só vez quando todos os recursos ficam disponíveis. A menos que você exclua as VMs antes do final da duração da execução, o Compute Engine as exclui ao mesmo tempo. Para mais informações, consulte Sobre solicitações de redimensionamento do MIG.
MIGs com um tamanho de destino: o Compute Engine cria cada VM individualmente quando a capacidade fica disponível. Assim, o MIG pode criar inicialmente apenas uma parte das VMs solicitadas e, em seguida, adicionar as VMs restantes mais tarde, conforme a capacidade permitir. A menos que você exclua as VMs antes do final da duração da execução, o Compute Engine exclui cada VM em relação ao próprio horário de criação. Para mais informações, consulte Criar um MIG que usa VMs de início flexível.
Duração de execução limitada da VM flex-start
Ao criar uma VM flex-start, é necessário especificar o seguinte:
A duração da execução da VM: é necessário especificar por quanto tempo as VMs podem ser executadas. A duração da execução pode ser de até sete dias. Se a carga de trabalho for concluída antes do término da duração da execução das VMs, será possível interromper ou excluir as VMs independentes ou excluir as VMs em um MIG para evitar custos desnecessários.
A ação de encerramento da VM: é necessário escolher se o Compute Engine interrompe ou exclui automaticamente as VMs no final da duração da execução. Para VMs de início flexível em um MIG, só é possível especificar a exclusão de VMs no final da duração da execução.
Alocação de VM flex-start
O Compute Engine faz o possível para criar suas VMs de início flexível de forma densa com base na disponibilidade. Esse posicionamento denso minimiza os saltos da rede e otimiza a baixa latência, o que é ideal para cargas de trabalho que exigem comunicação constante de VM, como cargas de trabalho de IA ou ML. Se você quiser controlar o posicionamento das VMs de início flexível para evitar que elas sejam criadas inesperadamente muito distantes, faça o seguinte:
Para VMs de início flexível independentes, aplique uma política de posicionamento compacto às VMs.
Para MIGs com um tamanho de destino, aplique uma política de carga de trabalho com um tipo de alta capacidade de processamento ao MIG.
Quota
Para criar ou reiniciar uma VM flex-start, é necessário ter cota preemptiva suficiente para as vCPUs, a memória e todas as GPUs ou discos SSD locais anexados solicitados.
Se você tentar criar ou reiniciar uma VM flex-start sem cota suficiente, uma das seguintes situações ocorrerá:
Solicitações de criação de VM: sua solicitação permanecerá pendente até que você adquira cota suficiente. Se você não adquirir a cota necessária antes do término do tempo de espera, a solicitação falhará.
Solicitações de reinicialização de VM: sua solicitação falha imediatamente.
Preços
Para VMs de início flexível, você incorre em cobranças da seguinte maneira:
Você paga conforme o uso (PAYG, na sigla em inglês). Para mais informações sobre os preços de uma VM durante o ciclo de vida dela, consulte Preços.
Para os tipos de máquina A4, A3, A2, G4 e H4D, você recebe vCPUs, memória e todas as GPUs anexadas a um preço com desconto. Outros tipos de máquina otimizados para aceleradores compatíveis não são qualificados para descontos. Para mais informações, consulte Preços do DWS.
Limitações
As seções a seguir descrevem as limitações das VMs de início flexível.
Limitações para todas as VMs de início flexível
Todas as VMs de início flexível têm as seguintes limitações:
As VMs de início flexível só podem usar os seguintes tipos de máquina:
Qualquer tipo de máquina otimizado para aceleradores, exceto A4X Max e A4X
Tipos de máquina H4D
É necessário criar VMs de início flexível usando o modelo de provisionamento de início flexível.
É necessário especificar se as VMs de início flexível serão interrompidas ou excluídas no final da duração da execução usando os
instanceTerminationActionemaxRunDurationcampos. Para MIGs, só é possível especificar a exclusão de VMs de início flexível.É necessário interromper as VMs de início flexível durante eventos de manutenção do host.
Só é possível aplicar políticas de posicionamento compacto a VMs de início flexível independentes.
Não é possível aplicar políticas de posicionamento expandidas a VMs de início flexível.
Não é possível usar reservas.
Limitações para MIGs com VMs de início flexível
Todos os MIGs com VMs de início flexível têm as seguintes limitações:
É necessário desativar os reparos no MIG.
Você deve excluir a configuração de escalonamento automático.
Só é possível criar VMs de início flexível em MIGs regionais usando os seguintes formatos de distribuição de destino:
Para MIGs com um tamanho de destino:
ANYouANY_SINGLE_ZONEPara solicitações de redimensionamento do MIG:
ANY_SINGLE_ZONE
Só é possível definir o modo de pool em espera do MIG como
manual(padrão).Não é possível adicionar um segundo modelo de instância para iniciar uma atualização canário no MIG.
Além disso, se você quiser criar VMs de início flexível usando solicitações de redimensionamento do MIG, consulte Limitações para solicitações de redimensionamento do MIG.
A seguir
Para saber como criar VMs flex-start independentes, consulte Criar uma VM flex-start.
Para saber como criar VMs de início flexível em um MIG, consulte o seguinte:
Faça um teste
Se você tiver começado a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
Faça uma avaliação sem custos do Compute Engine