Este documento descreve os diferentes tipos de reserva que podem ser usados para reservar capacidade para instâncias do Compute Engine. Para saber mais sobre os recursos usados para criar instâncias, consulte Instâncias do Compute Engine.
As reservas ajudam a garantir que você tenha os recursos disponíveis para criar instâncias com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs, clusters de HPC H4D, TPUs ou discos SSD locais) sempre que precisar. As reservas oferecem os seguintes benefícios:
Alta garantia de capacidade: você reserva recursos para acomodar aumentos futuros na demanda, como:
Crescimento
Picos de uso planejados ou não
Migrações grandes
Backup e recuperação de desastres
Acesso exclusivo: as reservas impedem que outras pessoas usem seus recursos reservados.
Propriedades herdadas: as reservas herdam as mesmas propriedades da família de máquinas escolhida.
Depois de reservar capacidade, use-a para criar instâncias que correspondam à reserva. Não há cobranças extras pela criação dessas instâncias. Você paga apenas pelos recursos que não fazem parte da reserva, como discos ou endereços IP.
Limitações
Todos os tipos de reserva têm as seguintes limitações:
As reservas são recursos específicos da zona.
Não é possível usar a capacidade reservada para criar os seguintes recursos do Compute Engine:
VMs spot ou instâncias preemptivas
Nós de locatário individual
Escolher um tipo de reserva
O diagrama a seguir ajuda você a escolher o tipo de reserva do Compute Engine mais adequado às necessidades da sua carga de trabalho:

As perguntas no diagrama anterior são as seguintes:
Você precisa de capacidade imediatamente?
Sim: vá para a próxima pergunta.
Não: vá para a pergunta 3.
Você precisa de flexibilidade no tempo de retenção da capacidade?
Sim: consulte Usar reservas imediatas.
Não: vá para a próxima pergunta.
Você precisa de recursos de alta demanda, como GPUs?
Sim: vá para a próxima pergunta.
Não: consulte Usar reservas adiantadas.
Você precisa de recursos por mais de 90 dias?
Sim: consulte Usar reservas adiantadas no Hipercomputador de IA ou para H4D, consulte Reservar capacidade com a equipe da sua conta.
Não: consulte Usar reservas adiantadas no modo de calendário.
Usar reservas imediatas
Com as reservas sob demanda, é possível reservar capacidade para instâncias de computação e recebê-la assim que você fizer a reserva. Depois de criar uma reserva sob demanda, você pode consumir, modificar ou excluir quando precisar.
Para mais informações, consulte Sobre as reservas.
Usar reservas adiantadas
Para reservar instâncias por um período definido, use as reservas adiantadas. Depois de criar uma solicitação de reserva, envie-a para análise do Google Cloud . Normalmente, oGoogle Cloud leva cinco dias para analisar sua solicitação. Se o pedido for aprovado, o Compute Engine vai criar reservas sob demanda com a capacidade solicitada na data e hora escolhidas. Para consumir essas reservas, crie instâncias de computação que as usem. Depois que o período de reserva termina, é possível modificar ou excluir as reservas.
Para mais informações, consulte Sobre solicitações de reserva adiantada.
Usar reservas adiantadas no modo de calendário
Para reservar instâncias de GPU, instâncias H4D ou TPUs por até 90 dias, use reservas adiantadas no modo de calendário. Para criar esse tipo de reserva, primeiro confira quando o número e o tipo de recursos escolhidos estão disponíveis em uma região. Em seguida, crie e envie uma solicitação de reserva com as propriedades que você confirmou como disponíveis. Se você conseguir criar a solicitação, o Google Cloud vai aprovar em um minuto. Depois que a solicitação é aprovada, o Compute Engine faz o seguinte:
O Compute Engine cria uma reserva imediata.
O Compute Engine reserva os recursos solicitados o mais próximo possível uns dos outros para minimizar a latência da rede.
No início do período de reserva, é possível consumir a reserva criando instâncias de GPU ou TPU. Ao final do período de reserva, o Compute Engine exclui a reserva e interrompe ou exclui as instâncias que a consomem com base na ação de encerramento especificada para as instâncias.
Para mais informações, consulte Sobre solicitações de reserva adiantada no modo de calendário.
Usar reservas futuras com clusters de Hipercomputador de IA ou HPC H4D
Entre em contato com a equipe da sua conta e peça para reservar instâncias de GPU para cargas de trabalho de inteligência artificial (IA) e machine learning (ML) em grande escala ou para criar um cluster de instâncias de HPC H4D com recursos aprimorados de gerenciamento de cluster. Depois que o Google cria um rascunho de solicitação de reserva para você, envie-o para análise se tudo estiver correto. Google Cloud aprova imediatamente a solicitação, e o Compute Engine faz o seguinte:
O Compute Engine cria reservas sob demanda.
O Compute Engine reserva os recursos solicitados o mais próximo possível uns dos outros para minimizar a latência da rede.
O Compute Engine reserva recursos com programação com reconhecimento de topologia, além de monitoramento e manutenção aprimorados.
No início do período de reserva, é possível consumir a reserva criando instâncias de GPU ou H4D. Ao final do período de reserva, o Compute Engine exclui a reserva e interrompe ou exclui as instâncias que a consomem com base na ação de encerramento especificada para as instâncias.
Para mais informações, consulte:
- Para instâncias de GPU: Reserve capacidade com sua equipe de conta na documentação do Hipercomputador de IA.
- Para instâncias H4D: Reserve capacidade com sua equipe de conta na documentação do Compute Engine