Modelos de provisionamento de instâncias do Compute Engine

Ao criar uma instância do Compute Engine, é necessário definir o método, chamado de modelo de provisionamento, que você quer usar para receber os recursos solicitados. Cada modelo de provisionamento determina a disponibilidade, o ciclo de vida e os preços das instâncias de computação.

Este documento explica os diferentes modelos de provisionamento que podem ser especificados ao criar instâncias de computação. Ao entender esses modelos, você pode escolher a melhor opção para sua carga de trabalho.

Modelos de provisionamento disponíveis

Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.

  • Padrão

  • Spot

  • Início flexível

  • Vinculada à reserva

A tabela a seguir ajuda a comparar os casos de uso e os preços de cada modelo de provisionamento:

Padrão Spot Início flexível Vinculada à reserva
Resumo
  • Com base na disponibilidade de recursos, é possível criar instâncias de computação imediatamente.
  • Você pode controlar quando interromper ou excluir instâncias de computação.
  • Com base na disponibilidade de recursos, é possível criar instâncias de computação imediatamente.
  • Você pode controlar quando interromper ou excluir instâncias de computação. No entanto, você também permite que o Compute Engine interrompa ou exclua instâncias de computação a qualquer momento para recuperar a capacidade.
  • Com base na disponibilidade de recursos, é possível criar instâncias de computação em um tempo de espera especificado. Para uma VM de início flexível independente, é possível especificar um tempo de espera de até duas horas. Para uma solicitação de redimensionamento de MIG, o tempo de espera é indefinido.
  • Você pode controlar quando interromper ou excluir instâncias de computação. No entanto, não é possível suspender ou recriar essas contas. As instâncias de computação são executadas por um mínimo de 10 minutos e até um máximo de sete dias. Quando as instâncias de computação atingem o fim da duração da execução, o Compute Engine as interrompe ou exclui com base na ação de encerramento.
  • É possível solicitar a reserva de capacidade em uma data futura para criar instâncias de computação. Se Google Cloud aprovar sua solicitação, o Compute Engine vai criar uma reserva. No início do período de reserva, é possível consumir a reserva criando instâncias de computação que correspondam a ela.
  • Durante o período de reserva aprovado, é possível parar, reiniciar, excluir e recriar instâncias de computação para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias de computação que consomem a reserva com base na ação de encerramento.
Casos de uso

Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como:

  • Servidores da Web
  • Bancos de dados
  • Aplicativos empresariais
  • Desenvolvimento e teste

Ideal para cargas de trabalho que toleram interrupções, como as seguintes:

  • Processamento em lote
  • Computação de alto desempenho (HPC)
  • Integração e implantação contínuas (CI/CD)
  • Análise de dados
  • Codificação de mídia
  • Inferência on-line

Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como:

  • Pré-treinamento de modelo pequeno
  • Ajuste de modelos
  • Simulação de HPC
  • Inferência em lote

Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como:

  • Para cargas de trabalho que duram até 90 dias:

    • Jobs de pré-treinamento de modelos
    • Jobs de ajuste de modelos
    • Cargas de trabalho de simulação de HPC
    • Aumentos esperados de curto prazo nas cargas de trabalho de inferência
  • Para cargas de trabalho com mais de 90 dias:

    • Cargas de trabalho de treinamento
    • Cargas de trabalho de inferência
Alocação de recursos Melhor esforço. O Compute Engine coloca fisicamente os recursos próximos uns dos outros com base no melhor esforço. Para controlar o posicionamento, use políticas de posicionamento (opcional). Melhor esforço. O Compute Engine coloca fisicamente os recursos próximos uns dos outros com base no melhor esforço. Para controlar o posicionamento, use políticas de posicionamento (opcional).

A alocação de recursos varia de acordo com a forma de criação das instâncias de computação:

  • Melhor esforço. Se você criar VMs flexíveis independentes, o Compute Engine vai colocar os recursos fisicamente próximos uns dos outros da melhor maneira possível. Para controlar o posicionamento, use políticas de posicionamento.
  • Dense. Se você criar VMs de início flexível com solicitações de redimensionamento do MIG, o Compute Engine vai posicionar fisicamente os recursos em hosts fortemente acoplados conectados por uma estrutura de rede de alta velocidade para minimizar a latência de rede.
Dense. O Compute Engine posiciona fisicamente os recursos em hosts de acoplamento rígido conectados por uma estrutura de rede de alta velocidade para minimizar a latência da rede.
Preços
  • Você vai pagar os preços padrão das instâncias de computação. Consulte Preços de instâncias de VM.
  • Você recebe cobranças com base no método usado para criar instâncias de computação:

    • Se você criar instâncias de computação imediatamente, vai pagar conforme o uso (PAYG).
    • Se você criar instâncias de computação usando uma reserva sob demanda ou uma reserva criada automaticamente para uma reserva adiantada, a cobrança será feita até que a reserva exista. Para mais informações, consulte faturamento de reservas.
  • Você recebe descontos de até 91% em muitos tipos de máquina, GPUs, TPUs e discos SSD locais. Para mais informações, consulte Preços das VMs spot.
  • Você usa o PAYG.
  • Com base na série de máquinas usadas pelas instâncias de computação, você recebe um desconto da seguinte forma:

    • Para as séries de máquinas A4, A3 e A2, você recebe um desconto de 53% em vCPUs, memória e GPUs.
    • Para a série de máquinas H4D, você recebe um desconto de 25% em vCPUs e memória.
    Outras famílias de máquinas compatíveis não se qualificam para descontos. Para mais informações, consulte Preços do programador dinâmico de cargas de trabalho (DWS).
  • Você usa o PAYG.
Cota Quando você cria uma instância de computação, a cota padrão é consumida. Quando você cria uma instância de computação, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. Os créditos do Nível sem custos financeirosGoogle Cloud não se aplicam às VMs do Spot. Quando o MIG adiciona instâncias de computação ao grupo, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. A cota não se aplica ao modelo de provisionamento vinculado à reserva. No entanto, você ainda precisa de cota para os recursos que não fazem parte da capacidade reservada, como discos e endereços IP.

Disponibilidade e vida útil da instância de computação

A tabela a seguir mostra a disponibilidade e o ciclo de vida da instância de computação para cada modelo de provisionamento:

Padrão Spot Início flexível Vinculada à reserva
Pré-requisitos para a criação Não há pré-requisitos de criação. Não há pré-requisitos de criação. Não há pré-requisitos de criação.

Para criar instâncias de computação, primeiro reserve capacidade usando um dos seguintes métodos:

Na data e hora de entrega escolhidas, o Compute Engine provisiona a capacidade solicitada. Em seguida, é possível consumir a capacidade criando instâncias de computação.

Série de máquinas compatível Você pode usar qualquer série de máquinas, exceto A4X Max, A4X, A4 e A3 Ultra. Você pode usar qualquer série de máquinas, exceto instâncias A4X e bare metal (A4X Max, C4D, C4, C3, X4 e Z3).

Só é possível usar as seguintes séries de máquinas:

Dependendo de como você reserva capacidade para criar VMs, só é possível usar as seguintes séries de máquinas:

Disponibilidade da instância de computação É possível criar instâncias de computação a qualquer momento, desde que os recursos solicitados estejam disponíveis. É possível criar instâncias de computação a qualquer momento, desde que os recursos solicitados estejam disponíveis.

É possível criar instâncias de computação da seguinte maneira:

O Compute Engine usa o DWS para programar o provisionamento da capacidade solicitada com base na disponibilidade de recursos. O DWS ajuda você a ter acesso a recursos de alta demanda, como GPUs.

Só é possível criar instâncias de computação depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias de computação. Se você reservar recursos usando reservas adiantadas no modo de calendário, o Compute Engine usará o DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.
Garantia de capacidade Com base no método de criação. A garantia de capacidade varia de acordo com o método usado para criar instâncias de computação, da seguinte forma:
  • Se você criar instâncias de computação imediatamente, o Compute Engine fará o possível para provisionar a capacidade solicitada.
  • Se você criar instâncias de computação consumindo uma reserva sob demanda ou uma reserva criada automaticamente para uma reserva adiantada, terá uma garantia muito alta de que o Compute Engine provisionará a capacidade solicitada se a reserva tiver capacidade reservada disponível.
Melhor esforço. Ao criar Spot VMs, o Compute Engine faz o possível para provisionar a capacidade solicitada. Melhor esforço. Quando você cria uma solicitação de redimensionamento de MIG, o Compute Engine faz o possível para programar o provisionamento da capacidade solicitada. Muito alto. Se o Google Cloud aprovar sua solicitação de reserva, você terá uma garantia muito alta de que o Compute Engine vai provisionar a capacidade reservada na data e hora de entrega escolhidas. Você tem acesso exclusivo à capacidade reservada durante o período da reserva.
Ciclo de vida da instância de computação Você pode controlar quando interromper ou excluir uma instância de computação. No entanto, se o tipo de máquina usado pela instância de computação não for compatível com a migração em tempo real, o Compute Engine vai interromper a instância durante os eventos de manutenção do host.

Você pode controlar quando interromper ou excluir uma instância de computação, exceto nos seguintes casos:

  • O Compute Engine interrompe ou exclui a instância de computação para recuperar a capacidade. Esse processo é chamado de preempção.
  • Se o tipo de máquina usado pela instância de computação não for compatível com a migração em tempo real, o Compute Engine vai interromper a instância durante os eventos de manutenção do host.

Antes que uma instância de computação chegue ao fim da duração da execução, você pode fazer o seguinte:

  • Parar a instância de computação: é possível interromper a instância de computação a qualquer momento, apenas se ela tiver sido criada como uma instância de computação independente.
  • Exclua a instância de computação: é possível excluir a instância de computação a qualquer momento.

Quando uma instância de computação atinge o fim da duração da execução, o Compute Engine a exclui.

Você pode controlar quando interromper ou excluir uma instância de computação, exceto nos seguintes casos:

  • O Compute Engine interrompe a instância de computação durante eventos de manutenção do host.
  • A reserva criada automaticamente para provisionar a capacidade solicitada atinge o fim do período de reserva comprometida. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias de computação que a consomem com base na ação de encerramento especificada na configuração.

A seguir