Sobre instâncias que usam o modelo vinculado à reserva

Este documento descreve as instâncias do Compute Engine que usam o modelo de provisionamento vinculado à reserva, incluindo os benefícios e requisitos de criação.

Ao criar uma instância, você também precisa especificar o modelo de provisionamento subjacente, que define a disponibilidade, os preços e o ciclo de vida das instâncias. O modelo de provisionamento vinculado à reserva permite criar instâncias A4X Max, A4X, A4 ou A3 Ultra, tanto bare metal quanto de máquina virtual, usando a capacidade reservada de uma reserva futura no modo de calendário ou reserva futura no Hipercomputador de IA.

O modelo de provisionamento vinculado à reserva oferece os seguintes benefícios:

  • Controle de custos: você não recebe cobranças extras ao criar instâncias usando a capacidade reservada. Você só recebe cobranças por recursos que não fazem parte da sua reserva, como discos ou endereços IP.

  • Gerenciamento do ciclo de vida: com base na ação de encerramento especificada ao criar instâncias, o Compute Engine para ou exclui a instância ao final do período de reserva.

Entender instâncias que usam o modelo de provisionamento vinculado à reserva

As seções a seguir descrevem os requisitos que você aplica ao criar instâncias de computação usando o modelo de provisionamento vinculado à reserva.

Pré-requisitos para a criação de instâncias

Para usar o modelo de provisionamento vinculado à reserva e criar instâncias de computação, primeiro reserve recursos. Você pode reservar recursos da seguinte maneira:

Se Google Cloud aprovar sua solicitação de reserva adiantada, o Compute Engine vai criar automaticamente (criação automática) uma reserva no início do período de reserva. Em seguida, use a reserva para criar instâncias.

Requisitos de criação de instâncias

Para criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, especifique as seguintes configurações:

  • A instância e a reserva precisam ter propriedades correspondentes. Só é possível usar a capacidade reservada para criar instâncias se as propriedades da instância e da reserva criada automaticamente forem exatamente iguais. Para mais informações, consulte os requisitos para consumir reservas.

  • A instância precisa visar especificamente a reserva para consumo. Ao criar uma instância, especifique o nome da reserva criada automaticamente para direcionar o consumo e defina o campo reservationAffinity como SPECIFIC_RESERVATION. Para mais informações, consulte Consumir uma reserva especificamente segmentada.

  • A instância precisa usar o modelo de provisionamento vinculado à reserva. Ao criar uma instância, especifique o modelo de provisionamento vinculado à reserva da seguinte maneira:

    • No console do Google Cloud , na lista Modelo de provisionamento, selecione Vinculado à reserva.

    • Na Google Cloud CLI, inclua a flag --provisioning-model=RESERVATION_BOUND no comando.

    • Na API Compute Engine, inclua o campo "provisioningModel": "RESERVATION_BOUND" no corpo da solicitação.

  • A instância precisa ser interrompida ou excluída até o horário de término da reserva. Ao criar uma instância, especifique se ela será interrompida ou excluída no horário de término da reserva usando o campo instanceTerminationAction. Para mais informações, consulte como limitar o tempo de execução de uma instância.

Depois que a instância é criada, ela começa a ser executada e continua em execução até que você a pare ou exclua, ou até que o Compute Engine pare ou exclua a instância no horário de término da reserva.

Cota

Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, não é necessário ter cota para os recursos reservados usados na criação da instância. Você só precisa de cota para os recursos que não fazem parte da sua reserva, como discos e endereços IP. Para mais informações sobre os diferentes tipos de cota, consulte Cotas de alocação.

Preços

Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, você incorre em cobranças da seguinte forma:

  • As cobranças começam quando você cria a instância. No entanto, não há cobranças adicionais pelos recursos reservados usados para criar a instância. Você só recebe cobranças pelos recursos que não fazem parte da reserva, como discos ou endereços IP. Para mais informações, consulte o faturamento de reservas.

  • As cobranças são interrompidas quando a reserva usada para criar a instância atinge o horário de término. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui a instância com base na ação de encerramento especificada nela.

Limitações

As instâncias de computação criadas usando o modelo de provisionamento vinculado à reserva só podem usar as seguintes séries de máquinas:

  • A4X Max

  • A4X

  • A4

  • A3 Ultra

Para saber como usar outras séries de máquinas otimizadas para aceleradores com o modelo de provisionamento vinculado a reservas, entre em contato com sua equipe de conta ou a equipe de vendas.

A seguir

Faça um teste

Se você tiver começado a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

Faça uma avaliação sem custos do Compute Engine