Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Sobre instâncias que usam o modelo vinculado à reserva

Este documento descreve as instâncias do Compute Engine que usam o modelo de provisionamento vinculado à reserva, incluindo os benefícios e requisitos de criação.

Ao criar uma instância de computação, é necessário especificar o modelo de provisionamento subjacente, que define a disponibilidade, os preços e a vida útil dos recursos usados pela instância. O modelo de provisionamento vinculado à reserva permite criar instâncias de computação usando a capacidade reservada de uma reserva adiantada no modo de calendário ou de uma reserva adiantada no Hipercomputador de IA.

O modelo de provisionamento vinculado à reserva oferece os seguintes benefícios:

Controle de custos: você não recebe cobranças extras ao criar instâncias de computação usando capacidade reservada. Você só recebe cobranças por recursos que não fazem parte da sua reserva, como discos ou endereços IP.
Gerenciamento do ciclo de vida: com base na ação de encerramento especificada ao criar instâncias de computação, o Compute Engine interrompe ou exclui as instâncias de computação ao final do período de reserva.

Entender instâncias que usam o modelo de provisionamento vinculado à reserva

As seções a seguir descrevem os requisitos que você aplica ao criar instâncias de computação usando o modelo de provisionamento vinculado à reserva.

Pré-requisitos para a criação de instâncias de computação

Para usar o modelo de provisionamento vinculado à reserva e criar instâncias de computação, primeiro reserve recursos. Você pode reservar recursos da seguinte maneira:

Para reservar até 80 instâncias A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs ou H4D por até 90 dias, use solicitações de reserva adiantada no modo de calendário.
Para reservar mais de 80 instâncias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs ou H4D por mais de 90 dias, use solicitações de reserva adiantada no Hipercomputador de IA.

Se Google Cloud aprovar sua solicitação de reserva adiantada, o Compute Engine vai criar automaticamente (criação automática) uma reserva no início do período de reserva. Em seguida, use a reserva para criar instâncias de computação.

Requisitos para a criação de instâncias de computação

Para criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, especifique as seguintes configurações:

A instância de computação e a reserva precisam ter propriedades correspondentes. Só é possível usar a capacidade reservada para criar instâncias se as propriedades da instância e da reserva criada automaticamente corresponderem exatamente. Para mais informações, consulte os requisitos para consumir reservas.
A instância de computação precisa visar especificamente a reserva para consumo. Ao criar uma instância de computação, especifique o nome da reserva criada automaticamente para consumo e defina o campo reservationAffinity como SPECIFIC_RESERVATION. Para mais informações, consulte Efetivar uma reserva especificamente segmentada.
A instância de computação precisa usar o modelo de provisionamento vinculado à reserva. Ao criar uma instância de computação, especifique o modelo de provisionamento vinculado à reserva da seguinte maneira:
- Se você usa o console do Google Cloud , na lista Modelo de provisionamento, selecione Vinculado à reserva.
- Se você usar a Google Cloud CLI, inclua a flag --provisioning-model=RESERVATION_BOUND no comando.
- Se você usar a API Compute Engine, inclua o campo "provisioningModel": "RESERVATION_BOUND" no corpo da solicitação.
A instância de computação precisa ser interrompida ou excluída até o horário de término da reserva. Ao criar uma instância de computação, especifique se ela deve ser interrompida ou excluída no horário de término da reserva usando o campo instanceTerminationAction. Para mais informações, consulte como limitar o tempo de execução de uma instância de computação.

Depois de criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, ela começa a ser executada e continua até que você a interrompa ou exclua, ou até que o Compute Engine a interrompa ou exclua no horário de término da reserva.

Cota

Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, não é necessário ter cota para os recursos reservados usados na criação da instância. Você só precisa de cota para os recursos que não fazem parte da capacidade reservada, como discos e endereços IP. Para mais informações sobre os diferentes tipos de cota, consulte Cotas de alocação.

Preços

Ao criar uma instância de computação usando o modelo de provisionamento vinculado à reserva, você incorre em cobranças da seguinte maneira:

As cobranças começam quando você cria a instância de computação. Não há cobranças adicionais pelos recursos reservados que você usa para criar a instância de computação. Você só vai receber cobranças pelos recursos que não fazem parte da reserva, como discos ou endereços IP. Para mais informações, consulte o faturamento de reservas.
As cobranças são interrompidas no horário de término da reserva. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui a instância de computação com base na ação de encerramento especificada nela.

Importante: depois que o Compute Engine interrompe uma instância de computação e muda o estado dela para STOPPING, você continua recebendo cobranças por todos os recursos anexados à instância de computação, como discos. Para evitar custos desnecessários, desvincule e exclua os recursos que não são mais necessários ou exclua a instância de computação por completo. Para mais informações, consulte os preços do tempo de atividade de uma instância de computação.

Limitações

Para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva, use uma das seguintes séries de máquinas ou versões de TPU:

GPUs:
- A4X Max
- A4X
- A4
- A3 Ultra
- A3 Mega
- A3 High com 8 GPUs
Para saber como usar outras séries de máquinas com GPU com o modelo de provisionamento vinculado à reserva, entre em contato com sua equipe de conta ou com a equipe de vendas.
Versões da TPU:
- TPU7x
- v6e
- v5p
H4D

A seguir

Criar uma instância com o modelo vinculado à reserva

Faça um teste

Se você tiver começado a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

Faça uma avaliação sem custos do Compute Engine