Este documento descreve as instâncias do Compute Engine que usam o modelo de provisionamento vinculado à reserva, incluindo os benefícios e requisitos de criação.
Ao criar uma instância, você também precisa especificar o modelo de provisionamento subjacente, que define a disponibilidade, os preços e o ciclo de vida das instâncias. O modelo de provisionamento vinculado à reserva permite criar instâncias A4X Max, A4X, A4 ou A3 Ultra, tanto bare metal quanto de máquina virtual, usando a capacidade reservada de uma reserva futura no modo de calendário ou reserva futura no Hipercomputador de IA.
O modelo de provisionamento vinculado à reserva oferece os seguintes benefícios:
Controle de custos: você não recebe cobranças extras ao criar instâncias usando a capacidade reservada. Você só recebe cobranças por recursos que não fazem parte da sua reserva, como discos ou endereços IP.
Gerenciamento do ciclo de vida: com base na ação de encerramento especificada ao criar instâncias, o Compute Engine para ou exclui a instância ao final do período de reserva.
Entender instâncias que usam o modelo de provisionamento vinculado à reserva
As seções a seguir descrevem os requisitos que você aplica ao criar instâncias de computação usando o modelo de provisionamento vinculado à reserva.
Pré-requisitos para a criação de instâncias
Para usar o modelo de provisionamento vinculado à reserva e criar instâncias de computação, primeiro reserve recursos. Você pode reservar recursos da seguinte maneira:
Para reservar até 80 instâncias A4 ou A3 Ultra por até 90 dias, use solicitações de reserva adiantada no modo de calendário.
Para reservar mais de 80 instâncias A4X Max, A4X, A4 ou A3 Ultra e por mais de 90 dias, use os pedidos de reserva adiantada no Hipercomputador de IA.
Se Google Cloud aprovar sua solicitação de reserva adiantada, o Compute Engine vai criar automaticamente (criação automática) uma reserva no início do período de reserva. Em seguida, use a reserva para criar instâncias.
Requisitos de criação de instâncias
Para criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, especifique as seguintes configurações:
A instância e a reserva precisam ter propriedades correspondentes. Só é possível usar a capacidade reservada para criar instâncias se as propriedades da instância e da reserva criada automaticamente forem exatamente iguais. Para mais informações, consulte os requisitos para consumir reservas.
A instância precisa visar especificamente a reserva para consumo. Ao criar uma instância, especifique o nome da reserva criada automaticamente para direcionar o consumo e defina o campo
reservationAffinitycomoSPECIFIC_RESERVATION. Para mais informações, consulte Consumir uma reserva especificamente segmentada.A instância precisa usar o modelo de provisionamento vinculado à reserva. Ao criar uma instância, especifique o modelo de provisionamento vinculado à reserva da seguinte maneira:
No console do Google Cloud , na lista Modelo de provisionamento, selecione Vinculado à reserva.
Na Google Cloud CLI, inclua a flag
--provisioning-model=RESERVATION_BOUNDno comando.Na API Compute Engine, inclua o campo
"provisioningModel": "RESERVATION_BOUND"no corpo da solicitação.
A instância precisa ser interrompida ou excluída até o horário de término da reserva. Ao criar uma instância, especifique se ela será interrompida ou excluída no horário de término da reserva usando o campo
instanceTerminationAction. Para mais informações, consulte como limitar o tempo de execução de uma instância.
Depois que a instância é criada, ela começa a ser executada e continua em execução até que você a pare ou exclua, ou até que o Compute Engine pare ou exclua a instância no horário de término da reserva.
Cota
Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, não é necessário ter cota para os recursos reservados usados na criação da instância. Você só precisa de cota para os recursos que não fazem parte da sua reserva, como discos e endereços IP. Para mais informações sobre os diferentes tipos de cota, consulte Cotas de alocação.
Preços
Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, você incorre em cobranças da seguinte forma:
As cobranças começam quando você cria a instância. No entanto, não há cobranças adicionais pelos recursos reservados usados para criar a instância. Você só recebe cobranças pelos recursos que não fazem parte da reserva, como discos ou endereços IP. Para mais informações, consulte o faturamento de reservas.
As cobranças são interrompidas quando a reserva usada para criar a instância atinge o horário de término. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui a instância com base na ação de encerramento especificada nela.
Limitações
As instâncias de computação criadas usando o modelo de provisionamento vinculado à reserva só podem usar as seguintes séries de máquinas:
A4X Max
A4X
A4
A3 Ultra
Para saber como usar outras séries de máquinas otimizadas para aceleradores com o modelo de provisionamento vinculado a reservas, entre em contato com sua equipe de conta ou a equipe de vendas.
A seguir
Faça um teste
Se você tiver começado a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
Faça uma avaliação sem custos do Compute Engine