Modelos de provisionamento de instâncias do Compute Engine

Linux Windows

Ao criar uma instância do Compute Engine, é necessário definir o método, chamado de modelo de provisionamento, que você quer usar para receber os recursos solicitados. Cada modelo de provisionamento determina a disponibilidade, o ciclo de vida e os preços das instâncias de computação.

Este documento explica os diferentes modelos de provisionamento que podem ser especificados ao criar instâncias de computação. Ao entender esses modelos, você pode escolher a melhor opção para sua carga de trabalho.

Modelos de provisionamento disponíveis

Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.

Padrão
Spot
Início flexível
Vinculada à reserva

A tabela a seguir ajuda a comparar os casos de uso e os preços de cada modelo de provisionamento:

	Padrão	Spot	Início flexível	Vinculada à reserva
Resumo	Com base na disponibilidade de recursos, é possível criar instâncias de computação imediatamente. Você pode controlar quando interromper ou excluir instâncias de computação.	Com base na disponibilidade de recursos, é possível criar instâncias de computação imediatamente. Você pode controlar quando interromper ou excluir instâncias de computação. No entanto, você também permite que o Compute Engine interrompa ou exclua instâncias de computação a qualquer momento para recuperar a capacidade.	Com base na disponibilidade de recursos, é possível criar instâncias de computação em um tempo de espera especificado. Para uma VM de início flexível independente, é possível especificar um tempo de espera de até duas horas. Para uma solicitação de redimensionamento de MIG, o tempo de espera é indefinido. Você pode controlar quando interromper ou excluir instâncias de computação. No entanto, não é possível suspender ou recriar essas contas. As instâncias de computação são executadas por um mínimo de 10 minutos e até um máximo de sete dias. Quando as instâncias de computação atingem o fim da duração da execução, o Compute Engine as interrompe ou exclui com base na ação de encerramento.	É possível solicitar a reserva de capacidade em uma data futura para criar instâncias de computação. Se Google Cloud aprovar sua solicitação, o Compute Engine vai criar uma reserva. No início do período de reserva, é possível consumir a reserva criando instâncias de computação que correspondam a ela. Durante o período de reserva aprovado, é possível parar, reiniciar, excluir e recriar instâncias de computação para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias de computação que consomem a reserva com base na ação de encerramento.
Casos de uso	Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como: Servidores da Web Bancos de dados Aplicativos empresariais Desenvolvimento e teste	Ideal para cargas de trabalho que toleram interrupções, como as seguintes: Processamento em lote Computação de alto desempenho (HPC) Integração e implantação contínuas (CI/CD) Análise de dados Codificação de mídia Inferência on-line	Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como: Pré-treinamento de modelo pequeno Ajuste de modelos Simulação de HPC Inferência em lote	Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como: Para cargas de trabalho que duram até 90 dias: Jobs de pré-treinamento de modelos Jobs de ajuste de modelos Cargas de trabalho de simulação de HPC Aumentos esperados de curto prazo nas cargas de trabalho de inferência Para cargas de trabalho com mais de 90 dias: Cargas de trabalho de treinamento Cargas de trabalho de inferência
Alocação de recursos	Melhor esforço. O Compute Engine coloca fisicamente os recursos próximos uns dos outros com base no melhor esforço. Para controlar o posicionamento, use políticas de posicionamento (opcional).	Melhor esforço. O Compute Engine coloca fisicamente os recursos próximos uns dos outros com base no melhor esforço. Para controlar o posicionamento, use políticas de posicionamento (opcional).	A alocação de recursos varia de acordo com a forma de criação das instâncias de computação: Melhor esforço. Se você criar VMs flexíveis independentes, o Compute Engine vai colocar os recursos fisicamente próximos uns dos outros da melhor maneira possível. Para controlar o posicionamento, use políticas de posicionamento. Dense. Se você criar VMs de início flexível com solicitações de redimensionamento do MIG, o Compute Engine vai posicionar fisicamente os recursos em hosts fortemente acoplados conectados por uma estrutura de rede de alta velocidade para minimizar a latência de rede.	Dense. O Compute Engine posiciona fisicamente os recursos em hosts de acoplamento rígido conectados por uma estrutura de rede de alta velocidade para minimizar a latência da rede.
Preços	Você vai pagar os preços padrão das instâncias de computação. Consulte Preços de instâncias de VM. Você recebe cobranças com base no método usado para criar instâncias de computação: Se você criar instâncias de computação imediatamente, vai pagar conforme o uso (PAYG). Se você criar instâncias de computação usando uma reserva sob demanda ou uma reserva criada automaticamente para uma reserva adiantada, a cobrança será feita até que a reserva exista. Para mais informações, consulte faturamento de reservas.	Você recebe descontos de até 91% em muitos tipos de máquina, GPUs, TPUs e discos SSD locais. Para mais informações, consulte Preços das VMs spot. Você usa o PAYG.	Com base na série de máquinas usadas pelas instâncias de computação, você recebe um desconto da seguinte forma: Para as séries de máquinas A4, A3 e A2, você recebe um desconto de 53% em vCPUs, memória e GPUs. Para a série de máquinas H4D, você recebe um desconto de 25% em vCPUs e memória. Outras famílias de máquinas compatíveis não se qualificam para descontos. Para mais informações, consulte Preços do programador dinâmico de cargas de trabalho (DWS). Você usa o PAYG.	Você recebe cobranças com base na forma como reserva capacidade para criar instâncias de computação da seguinte maneira: Se você reservar capacidade no Hipercomputador de IA, vai receber cobranças com base nos preços das VMs otimizadas para aceleradores. Se você reservar recursos por um ano ou mais, será necessário comprar e anexar um compromisso baseado em recursos aos recursos reservados. Se você reservar capacidade usando reservas futuras no modo de calendário, vai receber cobranças com base nos preços do Dynamic Workload Scheduler (DWS). Você recebe uma cobrança pelo período da reserva. Para mais informações, consulte faturamento de reservas.
Cota	Quando você cria uma instância de computação, a cota padrão é consumida.	Quando você cria uma instância de computação, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. Os créditos do Nível sem custos financeirosGoogle Cloud não se aplicam às VMs do Spot.	Quando o MIG adiciona instâncias de computação ao grupo, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida.	A cota não se aplica ao modelo de provisionamento vinculado à reserva. No entanto, você ainda precisa de cota para os recursos que não fazem parte da capacidade reservada, como discos e endereços IP.

Disponibilidade e vida útil da instância de computação

A tabela a seguir mostra a disponibilidade e o ciclo de vida da instância de computação para cada modelo de provisionamento:

	Padrão	Spot	Início flexível	Vinculada à reserva
Pré-requisitos para a criação	Não há pré-requisitos de criação.	Não há pré-requisitos de criação.	Não há pré-requisitos de criação.	Para criar instâncias de computação, primeiro reserve capacidade usando um dos seguintes métodos: Para reservar capacidade para cargas de trabalho de longa duração, use reservas futuras no Hipercomputador de IA. Para reservar capacidade para cargas de trabalho que são executadas por até 90 dias, use reservas adiantadas no modo de calendário. Na data e hora de entrega escolhidas, o Compute Engine provisiona a capacidade solicitada. Em seguida, é possível consumir a capacidade criando instâncias de computação.
Série de máquinas compatível	Você pode usar qualquer série de máquinas, exceto A4X Max, A4X, A4 e A3 Ultra.	Você pode usar qualquer série de máquinas, exceto instâncias A4X e bare metal (A4X Max, C4D, C4, C3, X4 e Z3).	Só é possível usar as seguintes séries de máquinas: Séries de máquinas A4, A3, A2, G4 e G2 Instâncias de máquina virtual (VM) N1 com GPUs anexadas Série de máquinas H4D	Dependendo de como você reserva capacidade para criar VMs, só é possível usar as seguintes séries de máquinas: Se você reservar capacidade no Hipercomputador de IA, só poderá usar as séries de máquinas A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs, A3 Edge e H4D. Se você criar uma reserva adiantada no modo de calendário, só poderá usar as séries de máquinas A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs ou H4D.
Disponibilidade da instância de computação	É possível criar instâncias de computação a qualquer momento, desde que os recursos solicitados estejam disponíveis.	É possível criar instâncias de computação a qualquer momento, desde que os recursos solicitados estejam disponíveis.	É possível criar instâncias de computação da seguinte maneira: Crie uma instância de computação independente. Crie uma solicitação de redimensionamento do MIG. O Compute Engine usa o DWS para programar o provisionamento da capacidade solicitada com base na disponibilidade de recursos. O DWS ajuda você a ter acesso a recursos de alta demanda, como GPUs.	Só é possível criar instâncias de computação depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias de computação. Se você reservar recursos usando reservas adiantadas no modo de calendário, o Compute Engine usará o DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.
Garantia de capacidade	Com base no método de criação. A garantia de capacidade varia de acordo com o método usado para criar instâncias de computação, da seguinte forma: Se você criar instâncias de computação imediatamente, o Compute Engine fará o possível para provisionar a capacidade solicitada. Se você criar instâncias de computação consumindo uma reserva sob demanda ou uma reserva criada automaticamente para uma reserva adiantada, terá uma garantia muito alta de que o Compute Engine provisionará a capacidade solicitada se a reserva tiver capacidade reservada disponível.	Melhor esforço. Ao criar Spot VMs, o Compute Engine faz o possível para provisionar a capacidade solicitada.	Melhor esforço. Quando você cria uma solicitação de redimensionamento de MIG, o Compute Engine faz o possível para programar o provisionamento da capacidade solicitada.	Muito alto. Se o Google Cloud aprovar sua solicitação de reserva, você terá uma garantia muito alta de que o Compute Engine vai provisionar a capacidade reservada na data e hora de entrega escolhidas. Você tem acesso exclusivo à capacidade reservada durante o período da reserva.
Ciclo de vida da instância de computação	Você pode controlar quando interromper ou excluir uma instância de computação. No entanto, se o tipo de máquina usado pela instância de computação não for compatível com a migração em tempo real, o Compute Engine vai interromper a instância durante os eventos de manutenção do host.	Você pode controlar quando interromper ou excluir uma instância de computação, exceto nos seguintes casos: O Compute Engine interrompe ou exclui a instância de computação para recuperar a capacidade. Esse processo é chamado de preempção. Se o tipo de máquina usado pela instância de computação não for compatível com a migração em tempo real, o Compute Engine vai interromper a instância durante os eventos de manutenção do host.	Antes que uma instância de computação chegue ao fim da duração da execução, você pode fazer o seguinte: Parar a instância de computação: é possível interromper a instância de computação a qualquer momento, apenas se ela tiver sido criada como uma instância de computação independente. Exclua a instância de computação: é possível excluir a instância de computação a qualquer momento. Quando uma instância de computação atinge o fim da duração da execução, o Compute Engine a exclui.	Você pode controlar quando interromper ou excluir uma instância de computação, exceto nos seguintes casos: O Compute Engine interrompe a instância de computação durante eventos de manutenção do host. A reserva criada automaticamente para provisionar a capacidade solicitada atinge o fim do período de reserva comprometida. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias de computação que a consomem com base na ação de encerramento especificada na configuração.

A seguir

Leia uma visão geral da criação de instâncias do Compute Engine.
Saiba mais sobre VMs spot.
Saiba mais sobre as VMs de início flexível.
Saiba mais sobre instâncias de computação que usam o modelo de provisionamento vinculado à reserva.

Modelos de provisionamento de instâncias do Compute Engine Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Modelos de provisionamento disponíveis

Disponibilidade e vida útil da instância de computação

A seguir

Modelos de provisionamento de instâncias do Compute Engine