Acerca das instâncias que usam o modelo associado a reservas

Este documento descreve as instâncias do Compute Engine que usam o modelo de aprovisionamento associado a reservas, incluindo as respetivas vantagens e requisitos de criação.

Quando cria uma instância, também tem de especificar o modelo de aprovisionamento subjacente, que define a disponibilidade, os preços e a duração das suas instâncias. O modelo de aprovisionamento associado a reservas permite-lhe criar instâncias A4X Max, A4X, A4 ou A3 Ultra, tanto instâncias bare metal como de máquinas virtuais, usando capacidade reservada de uma reserva futura no modo de calendário ou de uma reserva futura no Hipercomputador de IA.

O modelo de aprovisionamento associado à reserva oferece as seguintes vantagens:

  • Controlo de custos: não incorre em cobranças adicionais quando cria instâncias através da capacidade reservada. Só incorre em custos por recursos que não fazem parte da sua reserva, como discos ou endereços IP.

  • Gestão do ciclo de vida: com base na ação de encerramento que especificar quando criar instâncias, o Compute Engine para ou elimina a instância no final do período de reserva.

Compreenda as instâncias que usam o modelo de aprovisionamento associado a reservas

As secções seguintes descrevem os requisitos que aplica quando cria instâncias de computação através do modelo de aprovisionamento associado à reserva.

Pré-requisitos para a criação de instâncias

Para usar o modelo de aprovisionamento associado à reserva para criar instâncias de computação, tem de reservar primeiro recursos. Pode reservar recursos da seguinte forma:

Se Google Cloud aprovar o seu pedido de reserva futuro, o Compute Engine cria automaticamente (cria automaticamente) uma reserva no início do período de reserva. Em seguida, pode usar a reserva para criar instâncias.

Requisitos de criação de instâncias

Para criar uma instância de computação através do modelo de aprovisionamento associado a reservas, tem de especificar as seguintes configurações:

  • A instância e a reserva têm de ter propriedades correspondentes. Só pode usar a capacidade reservada para criar instâncias se a instância e as propriedades de reserva criadas automaticamente corresponderem exatamente. Para mais informações, consulte os requisitos para consumir reservas.

  • A instância tem de segmentar especificamente a reserva para consumo. Quando cria uma instância, tem de especificar o nome da reserva criada automaticamente para segmentar para consumo, bem como definir o campo reservationAffinity como SPECIFIC_RESERVATION. Para mais informações, consulte Consuma uma reserva especificamente segmentada.

  • A instância tem de usar o modelo de aprovisionamento associado à reserva. Quando cria uma instância, tem de especificar o modelo de aprovisionamento associado à reserva da seguinte forma:

    • Na Google Cloud consola, na lista Modelo de aprovisionamento, selecione Associado a reserva.

    • Na CLI gcloud, inclua a flag --provisioning-model=RESERVATION_BOUND no comando.

    • Na API Compute Engine, inclua o campo "provisioningModel": "RESERVATION_BOUND" no corpo do pedido.

  • A instância tem de ser parada ou eliminada na hora de fim da reserva. Quando cria uma instância, tem de especificar se quer parar ou eliminar a instância na hora de fim da reserva através do campo instanceTerminationAction. Para mais informações, veja como limitar o tempo de execução de uma instância.

Depois de criar a instância, esta começa a ser executada e continua a ser executada até a parar ou eliminar, ou até o Compute Engine parar ou eliminar a instância na hora de fim da reserva.

Quota

Quando cria uma instância de computação através do modelo de aprovisionamento associado a reservas, não precisa de quota para os recursos reservados que usa para criar a instância. Só precisa de quota para os recursos que não fazem parte da sua reserva, como discos e endereços IP. Para mais informações sobre os diferentes tipos de quota, consulte o artigo Quotas de atribuição.

Preços

Quando cria uma instância de computação através do modelo de aprovisionamento associado a reservas, incorre em custos da seguinte forma:

  • As cobranças começam quando cria a instância. No entanto, não incorre em custos adicionais pelos recursos reservados que usa para criar a sua instância. Só incorre em custos pelos recursos que não fazem parte da reserva, como discos ou endereços IP. Para mais informações, consulte o artigo Faturação de reservas.

  • Os custos param quando a reserva que usou para criar a instância atinge a hora de fim. Nesse momento, o Compute Engine elimina a reserva e para ou elimina a instância com base na ação de encerramento especificada na instância.

Limitações

As instâncias de computação que criar através do modelo de aprovisionamento associado a reservas só podem usar as seguintes séries de máquinas:

  • A4X Max

  • A4X

  • A4

  • A3 Ultra

Para consultar a utilização de outras séries de máquinas otimizadas para aceleradores com o modelo de aprovisionamento associado a reservas, contacte a sua equipa de conta ou a equipa de vendas.

O que se segue?

Experimente

Se está a usar o Google Cloud pela primeira vez, crie uma conta para avaliar o desempenho do Compute Engine em cenários reais. Os novos clientes também recebem 300 USD em créditos sem custo financeiro para executar, testar e implementar cargas de trabalho.

Experimentar o Compute Engine sem custo financeiro