Este documento descreve as instâncias do Compute Engine que usam o modelo de provisionamento vinculado à reserva, incluindo os benefícios e requisitos de criação.
Ao criar uma instância de computação, é necessário especificar o modelo de provisionamento subjacente, que define a disponibilidade, os preços e a vida útil dos recursos usados pela instância. O modelo de provisionamento vinculado à reserva permite criar instâncias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs, A3 Edge e H4D usando a capacidade reservada de uma reserva adiantada no modo de calendário ou reserva adiantada no Hipercomputador de IA.
O modelo de provisionamento vinculado à reserva oferece os seguintes benefícios:
Controle de custos: você não recebe cobranças extras ao criar instâncias de computação usando capacidade reservada. Você só recebe cobranças por recursos que não fazem parte da sua reserva, como discos ou endereços IP.
Gerenciamento do ciclo de vida: com base na ação de encerramento especificada ao criar instâncias de computação, o Compute Engine interrompe ou exclui as instâncias de computação ao final do período de reserva.
Entender instâncias que usam o modelo de provisionamento vinculado à reserva
As seções a seguir descrevem os requisitos que você aplica ao criar instâncias de computação usando o modelo de provisionamento vinculado à reserva.
Pré-requisitos para a criação de instâncias do Compute
Para usar o modelo de provisionamento vinculado à reserva e criar instâncias de computação, primeiro reserve recursos. Você pode reservar recursos da seguinte maneira:
Para reservar até 80 instâncias A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs ou H4D por até 90 dias, use solicitações de reserva adiantada no modo de calendário.
Para reservar mais de 80 instâncias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs, A3 Edge ou H4D por mais de 90 dias, use solicitações de reserva adiantada no AI Hypercomputer.
Se Google Cloud aprovar sua solicitação de reserva adiantada, o Compute Engine vai criar automaticamente (criação automática) uma reserva no início do período de reserva. Em seguida, use a reserva para criar instâncias de computação.
Requisitos para a criação de instâncias de computação
Para criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, especifique as seguintes configurações:
A instância de computação e a reserva precisam ter propriedades correspondentes. Só é possível usar a capacidade reservada para criar instâncias se as propriedades da instância e da reserva criada automaticamente forem exatamente iguais. Para mais informações, consulte os requisitos para consumir reservas.
A instância de computação precisa visar especificamente a reserva para consumo. Ao criar uma instância de computação, especifique o nome da reserva criada automaticamente para consumo e defina o campo
reservationAffinitycomoSPECIFIC_RESERVATION. Para mais informações, consulte Consumir uma reserva especificamente segmentada.A instância de computação precisa usar o modelo de provisionamento vinculado à reserva. Ao criar uma instância de computação, especifique o modelo de provisionamento vinculado à reserva da seguinte maneira:
Se você usa o Google Cloud console, na lista Modelo de provisionamento, selecione Vinculado à reserva.
Se você usar a Google Cloud CLI, inclua a flag
--provisioning-model=RESERVATION_BOUNDno comando.Se você usar a API Compute Engine, inclua o campo
"provisioningModel": "RESERVATION_BOUND"no corpo da solicitação.
A instância de computação precisa ser interrompida ou excluída até o horário de término da reserva. Ao criar uma instância de computação, especifique se ela deve ser interrompida ou excluída no horário de término da reserva usando o campo
instanceTerminationAction. Para mais informações, consulte como limitar o tempo de execução de uma instância de computação.
Depois de criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, ela começa a ser executada e continua até que você a interrompa ou exclua, ou até que o Compute Engine a interrompa ou exclua no horário de término da reserva.
Cota
Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, não é necessário ter cota para os recursos reservados usados na criação da instância. Você só precisa de cota para os recursos que não fazem parte da capacidade reservada, como discos e endereços IP. Para mais informações sobre os diferentes tipos de cota, consulte Cotas de alocação.
Preços
Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, você incorre em cobranças da seguinte forma:
As cobranças começam quando você cria a instância de computação. Não há cobranças adicionais pelos recursos reservados que você usa para criar a instância de computação. Você só vai receber cobranças pelos recursos que não fazem parte da reserva, como discos ou endereços IP. Para mais informações, consulte o faturamento de reservas.
As cobranças são interrompidas no horário de término da reserva. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui a instância de computação com base na ação de encerramento especificada nela.
Limitações
Para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva, use uma das seguintes séries de máquinas:
A4X Max
A4X
A4
A3 Ultra
A3 Mega
A3 High com 8 GPUs
H4D
Para saber como usar outras séries de máquinas otimizadas para aceleradores com o modelo de provisionamento vinculado a reservas, entre em contato com sua equipe de conta ou a equipe de vendas.
A seguir
Faça um teste
Se você tiver começado a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
Faça uma avaliação sem custos do Compute Engine