Crie um pedido de reserva futuro no modo de calendário

Este documento explica como criar um pedido de reserva futura no modo de calendário para reservar recursos de GPU, H4D ou TPU para as suas instâncias de máquinas virtuais (VM). Use estes pedidos para obter recursos de elevada procura para criar VMs que planeia executar durante um máximo de 90 dias.

Pode usar pedidos de reserva futuros no modo de calendário para reservar recursos para executar as seguintes cargas de trabalho:

Tarefas de pré-treino de modelos
Tarefas de ajuste do modelo
Cargas de trabalho de simulação de computação de alto desempenho (HPC)
Aumentos a curto prazo nas cargas de trabalho de inferência

Depois de Google Cloud aprovar o seu pedido, os recursos reservados ficam disponíveis para criar VMs de GPU, H4D ou TPU na data e hora de entrega especificadas. Durante o período de reserva, apenas o seu projeto e os projetos que especificar quando criar o pedido têm acesso aos recursos reservados. Pode partilhar os recursos reservados com até 100 projetos que estejam na mesma organização que o seu projeto. Para saber mais acerca dos requisitos e das limitações que aplica quando cria um pedido no modo de calendário, consulte o artigo Pedidos de reserva futuros na vista geral do modo de calendário.

Antes de começar

Se não conseguir usar pedidos de reserva futuros no modo de calendário, pode não ser elegível para aceder e usar esta funcionalidade. Neste caso, contacte a sua equipa da conta ou a equipa de vendas.
Para partilhar a sua capacidade reservada com outros projetos na sua organização, verifique se o projeto no qual quer criar pedidos de reserva futuros no modo de calendário está autorizado a criar reservas partilhadas. Caso contrário, ocorrem erros.
Se ainda não o tiver feito, configure a autenticação. A autenticação valida a sua identidade para aceder a Google Cloud serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
  gcloud init
  Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
  
  Nota: se instalou a CLI gcloud anteriormente, certifique-se de que tem a versão mais recente executando gcloud components update.
2. Set a default region and zone.
REST

Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.
Para mais informações, consulte o artigo Autenticar para usar REST na Google Cloud documentação de autenticação.

Funções necessárias

Para receber as autorizações de que precisa para criar um pedido de reserva futuro no modo de calendário, peça ao seu administrador para lhe conceder a função IAM Compute Future Reservation User (roles/compute.futureReservationUser) no projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

Esta função predefinida contém as autorizações necessárias para criar um pedido de reserva futuro no modo de calendário. Para ver as autorizações exatas que são necessárias, expanda a secção Autorizações necessárias:

Autorizações necessárias

São necessárias as seguintes autorizações para criar um pedido de reserva futuro no modo de calendário:

Para criar um pedido de reserva futuro: compute.futureReservations.create no projeto
Para permitir que o Compute Engine crie automaticamente reservas: compute.reservations.create no projeto
Para ver a disponibilidade de recursos numa data futura: compute.advice.calendarMode no projeto

Também pode conseguir estas autorizações com funções personalizadas ou outras funções predefinidas.

Crie um pedido de reserva futuro no modo de calendário

Para criar um pedido de reserva futuro no modo de calendário, conclua os seguintes passos:

Veja a disponibilidade futura do recurso. Veja a disponibilidade futura das VMs com GPU, das VMs H4D ou das TPUs que quer reservar. Em seguida, quando criar um pedido, especifique o número, o tipo e a duração da reserva dos recursos que confirmou como disponíveis. Google Cloud é mais provável que aprove o seu pedido se fornecer estas informações.

Nota: se criar um pedido através da Google Cloud consola, ignore este passo. Pode ver a disponibilidade futura de VMs com GPU, VMs H4D ou TPUs enquanto cria o pedido.

Para ver instruções, consulte o artigo Veja a disponibilidade futura de recursos.
Crie um pedido de reserva. Criar e enviar um pedido de reserva futura no modo de calendário para VMs de GPU, VMs H4D ou TPUs. Se conseguir criar um pedido com êxito, o mesmo é aprovado no prazo de um minuto. Google Cloud

Para ver instruções, consulte o artigo Crie um pedido de VMs com GPUs, VMs H4D ou TPUs.

Veja a disponibilidade futura do recurso

Pode ver a disponibilidade futura de VMs com GPU, VMs H4D ou TPUs numa região da seguinte forma:

Para VMs de GPU ou H4D, até 60 dias de antecedência
Para TPUs, até 120 dias de antecedência

Para ver a disponibilidade futura de VMs de GPU, VMs H4D ou TPUs numa região, selecione uma das seguintes opções:

Consola

Pode ver a disponibilidade futura de VMs com GPU, VMs H4D ou TPUs numa região quando cria um pedido de reserva futura no modo de calendário. Para mais informações, consulte Crie um pedido de VMs com GPU, VMs H4D ou TPUs neste documento.

gcloud

Para ver a disponibilidade futura de VMs com GPU, VMs H4D ou TPUs numa região, use o comando gcloud compute advice calendar-mode. Com base nos recursos que quer ver, inclua as seguintes flags:

Para ver a disponibilidade de VMs com GPU ou VMs H4D, inclua as flags --vm-count e --machine-type:

gcloud compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Para ver a disponibilidade da TPU, inclua as flags --chip-count e --tpu-version:

gcloud compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Substitua o seguinte:

NUMBER_OF_VMS: o número de VMs a reservar. O valor tem de ser, pelo menos, 1 e não superior a 80 para VMs de GPU ou 256 para VMs H4D.
MACHINE_TYPE: o tipo de máquina de GPU ou H4D a reservar. Especifique um dos seguintes valores:
- Para tipos de máquinas A4: a4-highgpu-8g
- Para tipos de máquinas A3 Ultra: a3-ultragpu-8g
- Para tipos de máquinas A3 Mega: a3-megagpu-8g
- Para tipos de máquinas A3 High com 8 GPUs: a3-highgpu-8g
- Para tipos de máquinas de HPC H4D: consulte Tipos de máquinas H4D
NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.
TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:
- Para TPU7x: TPU7X
- Para a TPU v6e: V6E
- Para a TPU v5p: V5P
- Para a TPU v5e: V5E
Se especificar uma TPU v5e, tem de incluir a flag --workload-type. Defina esta flag para o tipo de cargas de trabalho que quer executar nas TPUs:
- Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique BATCH.
- Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.
  
  Nota: se especificar SERVING, só pode reservar 1, 4 ou 8 chips de TPU v5e.
REGION: a região onde reservar VMs de GPU, VMs H4D ou TPUs. Para verificar que regiões e zonas são suportadas, consulte as Limitações.
FROM_START_TIME e TO_START_TIME: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como carimbos de data/hora RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Substitua o seguinte:
- YYYY-MM-DD: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífenes (-).
- HH:MM:SS: uma hora formatada como uma hora de dois dígitos com uma hora de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:).
- OFFSET: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique -08:00. Para não usar nenhum desvio, especifique Z.
MIN_DURATION e MAX_DURATION: o período mínimo e máximo durante o qual quer reservar recursos. Tem de formatar estes valores como o número de dias, horas, minutos ou segundos, seguido de d, h, m e s, respetivamente. Por exemplo, especifique 24h para 24 horas ou 1d2h3m4s para um dia, duas horas, três minutos e quatro segundos.

O resultado é semelhante ao seguinte:

- recommendationsPerSpec:
    spec:
      endTime: '2026-02-10T00:00:00Z'
      location: zones/us-central1-a
      otherLocations:
        zones/us-central1-b:
          details: Recommendation in this zone is possible.
          status: RECOMMENDED
        zones/us-central1-c:
          details: Temporarily no free capacity in this zone in the
          requested time window.
          status: NO_CAPACITY
        zones/us-central1-f:
          details: This machine family is not supported in this zone.
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2026-02-07T00:00:00Z'

Se os recursos pedidos estiverem disponíveis, o resultado contém os campos startTime, endTime e location. Estes campos especificam a hora de início mais próxima, a hora de fim mais tardia e as zonas onde os recursos estão disponíveis.

REST

Para ver a disponibilidade futura de VMs com GPU, VMs H4D ou TPUs numa região, faça um GET pedido ao método advice.calendarMode. Com base nos recursos que quer ver, inclua os seguintes campos no corpo do pedido:

Para ver a disponibilidade de VMs com GPU ou VMs H4D, inclua os campos instanceCount e machineType:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Para ver a disponibilidade da TPU, inclua os campos acceleratorCount e vmFamily:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Substitua o seguinte:

PROJECT_ID: o ID do projeto onde quer reservar recursos.
REGION: a região onde quer reservar VMs com GPUs, VMs H4D ou TPUs. Para verificar as regiões e as zonas suportadas, consulte as Limitações.
NUMBER_OF_VMS: o número de VMs com GPU ou H4D a reservar. Para VMs de GPU, o valor tem de estar entre 1 e 80. Para VMs H4D, o valor tem de estar entre 1 e 256.
MACHINE_TYPE: o tipo de máquina de GPU ou H4D a reservar. Especifique um dos seguintes valores:
- Para tipos de máquinas A4: a4-highgpu-8g
- Para tipos de máquinas A3 Ultra: a3-ultragpu-8g
- Para tipos de máquinas A3 Mega: a3-megagpu-8g
- Para tipos de máquinas A3 High com 8 GPUs: a3-highgpu-8g
- Para tipos de máquinas de HPC H4D: consulte Tipos de máquinas H4D
NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.
TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:
- Para TPU7x: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
- Para a TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- Para a TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- Para a TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se especificar uma TPU v5e, no campo aggregateResources, tem de incluir o campo workloadType. Defina este campo para o tipo de cargas de trabalho que quer executar nas TPUs:
- Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique BATCH.
- Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.
  
  Nota: se especificar SERVING, só pode reservar 1, 4 ou 8 chips de TPU v5e.
FROM_START_TIME e TO_START_TIME: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como carimbos de data/hora RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Substitua o seguinte:
- YYYY-MM-DD: uma data formatada como um ano de 4 dígitos, um mês de 2 dígitos e um dia de 2 dígitos, separados por hífenes (-).
- HH:MM:SS: uma hora formatada como uma hora de 2 dígitos com um formato de 24 horas, minutos de 2 dígitos e segundos de 2 dígitos, separados por dois pontos (:).
- OFFSET: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique -08:00. Para não usar nenhum desvio, especifique Z.
MIN_DURATION e MAX_DURATION: a quantidade mínima e máxima de tempo, em segundos, para a qual quer reservar recursos. Tem de formatar estes valores como o número de segundos, seguido de s. Por exemplo, especifique 86400s para 86 400 segundos (24 horas).

O resultado é semelhante ao seguinte:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2026-02-07T00:00:00Z",
          "endTime": "2026-02-10T00:00:00Z",
          "otherLocations": {
            "zones/us-central1-b": {
              "status": "RECOMMENDED",
              "details": "Recommendation in this zone is possible."
            },
            "zones/us-central1-c": {
              "status": "NO_CAPACITY",
              "details": "Temporarily no free capacity in this zone in the
                          requested time window."
            },
            "zones/us-central1-f": {
              "status": "NOT_SUPPORTED",
              "details": "This machine family is not supported in this zone."
            }
          },
          "location": "zones/us-central1-a"
        }
      }
    }
  ]
}

Crie um pedido de VMs com GPUs, VMs H4D ou TPUs

Quando cria um pedido de reserva futura no modo de calendário, só pode especificar um período de reserva da seguinte forma:

Hora de início: com base nos recursos que quer reservar, tem de especificar uma hora de início que seja, pelo menos, um dos seguintes valores a partir do momento em que cria e envia um pedido:
- Para VMs com GPU e H4D, 87 horas (3 dias e 15 horas)
- Para TPUs, 6 horas
Duração: pode reservar recursos durante um mínimo de 24 horas e um máximo de 90 dias.

Para criar um pedido usando uma VM de GPU ou H4D existente como referência, use a Google Cloud consola. Caso contrário, selecione uma das seguintes opções:

Consola

Na Google Cloud consola, aceda à página Reservas.

Aceder a Reservas
Clique no separador Reservas futuras.
Clique em Criar reserva futura. É apresentada a página Crie uma reserva futura e o painel Configuração de hardware é selecionado.
Na secção Configurações, especifique as propriedades das VMs com GPU, das VMs H4D ou das UTPs que quer reservar através de uma das seguintes opções:
- Para especificar diretamente as propriedades de VMs de GPU, VMs H4D ou TPUs, conclua os seguintes passos:
  1. Selecione Especificar tipo de máquina.
  2. Clique no separador GPUs, TPUs ou Otimizado para computação e, de seguida, selecione um tipo de máquina de GPU suportado, um tipo de máquina H4D ou uma versão de TPU.
- Para especificar as propriedades da GPU ou da VM H4D através de uma VM existente como referência, selecione Usar VM existente e, de seguida, selecione a VM.
Se especificou uma TPU v5e (CT5LP) no passo anterior, na lista Tipo de carga de trabalho da TPU v5, selecione uma das seguintes opções:
- Para executar cargas de trabalho nas TPUs que processam grandes quantidades de dados numa ou várias operações, como cargas de trabalho de preparação de ML, selecione Lote.
- Para executar cargas de trabalho nas TPUs que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, selecione Serviço.
  
  Nota: se selecionar Serviço, só pode reservar 1, 4 ou 8 chips TPU v5e.
Na secção Pesquisar capacidade, conclua os seguintes passos:
1. Nas listas Região e Zona, selecione a região e a zona onde quer reservar recursos.
2. No campo Capacidade total necessária (quando reserva VMs de GPU ou H4D) ou na lista Número de chips (quando reserva TPUs), especifique o número de VMs de GPU, VMs H4D ou chips de TPU a reservar. Pode especificar os seguintes valores:
  - Para VMs de GPU, um valor entre 1 e 80
  - Para VMs H4D, um valor entre 1 e 256
  - Para chips de TPU, um valor de 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024
3. Na lista Hora de início, selecione a hora de início do pedido.
4. Opcional: na lista Escolha a flexibilidade da data de início, selecione o nível de exatidão da data de início.
5. No campo Duração da reserva, especifique durante quanto tempo quer reservar recursos.
6. Clique em Pesquisar capacidade. Em seguida, na tabela Capacidade disponível, selecione uma das opções disponíveis que contenham o tipo, o número e o período de reserva das VMs de GPU, das VMs H4D ou das TPUs a reservar.
Clicar em Seguinte.
Na secção Tipo de partilha, selecione os projetos com os quais quer partilhar a capacidade pedida:
- Para usar a capacidade reservada apenas no seu projeto, selecione Local.
- Para partilhar a capacidade reservada com outros projetos, selecione Partilhada, clique em Adicionar projetos e, em seguida, siga as instruções para selecionar os projetos.
Importante: só pode especificar o tipo de partilha e os projetos partilhados quando cria um pedido. Não pode modificar estas definições após o envio.
Clicar em Seguinte.
No campo Nome da reserva futura, introduza um nome para o pedido.
No campo Nome da reserva, introduza o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.
Clique em Criar.

gcloud

Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, use o comando gcloud compute future-reservations create. Com base nos recursos que quer reservar, inclua as seguintes flags:

Para reservar VMs com GPU ou H4D, inclua as flags --total-count, --machine-type e --deployment-type=DENSE:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Para reservar TPUs, inclua as flags --chip-count e --tpu-version:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Substitua o seguinte:

FUTURE_RESERVATION_NAME: o nome do pedido.
NUMBER_OF_VMS: o número de VMs com GPU ou H4D a reservar:
- Para VMs de GPU, o valor tem de estar entre 1 e 80.
- Para VMs H4D, o valor tem de estar entre 1 e 256.
Especifique um número de VMs igual ou inferior ao número de VMs que confirmou como disponíveis.
MACHINE_TYPE: o tipo de máquina de GPU ou H4D a reservar.
NUMBER_OF_CHIPS: o número de chips de TPU a reservar. Especifique um valor igual ou inferior ao número de chips que confirmou como disponíveis. O valor tem de ser um dos seguintes: 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.
TPU_VERSION: a versão da TPU a reservar. Se especificar uma TPU v5e (V5E), tem de incluir a flag --workload-type para especificar o tipo de cargas de trabalho a executar nas TPUs.
RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.
SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:
- Para usar a capacidade apenas no seu projeto: local
- Para partilhar capacidade com outros projetos: projects
Se especificar projects, tem de incluir a flag --share-with definida como uma lista de IDs de projetos separados por vírgulas, por exemplo, project-1,project-2. Pode especificar até 100 projetos na sua organização. Não inclua o ID do projeto nesta lista. Pode consumir a capacidade reservada por predefinição.

Importante: só pode especificar o tipo de partilha e os projetos partilhados quando cria um pedido. Não pode modificar estas definições após o envio.
START_TIME: a hora de início do pedido, que tem de formatar como uma data/hora RFC 3339.
END_TIME: a hora de fim do período de reserva, que tem de formatar como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua a flag --end-time pela flag --duration.
ZONE: a zona onde quer reservar recursos.

REST

Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, faça um pedido ao método futureReservations.insert.POST Com base nos recursos que quer reservar, inclua os seguintes campos no corpo do pedido:

Para reservar VMs de GPU ou H4D, inclua os campos totalCount e machineType, bem como o campo deploymentType definido como DENSE:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Para reservar TPUs, inclua os campos acceleratorCount e vmFamily:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Substitua o seguinte:

PROJECT_ID: o ID do projeto onde quer criar o pedido.
ZONE: a zona onde quer reservar recursos.
FUTURE_RESERVATION_NAME: o nome do pedido.
RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.
SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:
- Para usar a capacidade apenas no seu projeto: LOCAL
- Para partilhar capacidade com outros projetos: SPECIFIC_PROJECTS
Se especificar SPECIFIC_PROJECTS, no campo shareSettings, tem de incluir o campo projectMap para especificar os projetos com os quais partilhar a capacidade. Pode especificar até 100 projetos na sua organização. Não especifique o ID do projeto. Pode consumir a capacidade reservada por predefinição.

Importante: só pode especificar o tipo de partilha e os projetos partilhados quando cria um pedido. Não pode modificar estas definições após o envio.

Por exemplo, para partilhar a capacidade pedida com outros dois projetos, inclua o seguinte:
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
Substitua CONSUMER_PROJECT_ID_1 e CONSUMER_PROJECT_ID_2 pelos IDs de dois projetos que quer permitir que consumam a capacidade pedida.
NUMBER_OF_VMS: o número de VMs com GPU ou H4D a reservar:
- Para VMs de GPU, o valor tem de estar entre 1 e 80.
- Para VMs H4D, o valor tem de estar entre 1 e 256.
Especifique um número de VMs igual ou inferior ao número de VMs que confirmou como disponíveis.
MACHINE_TYPE: o tipo de máquina de GPU ou H4D a reservar.
NUMBER_OF_CHIPS: o número de chips da TPU a reservar. Especifique um valor igual ou inferior ao número de chips que confirmou como disponíveis. O valor tem de ser um dos seguintes: 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.
TPU_VERSION: a versão da TPU a reservar. Se especificar uma TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP), no campo aggregateResources, tem de incluir o campo workloadType para especificar o tipo de cargas de trabalho a executar nas TPUs.
START_TIME: a hora de início do pedido, que tem de formatar como uma data/hora RFC 3339.
END_TIME: a hora de fim do período de reserva, que tem de formatar como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua o campo endTime pelo campo duration.

O que se segue?

Para VMs com GPU ou H4D, consuma uma reserva criada automaticamente no Compute Engine:
Consuma uma reserva criada automaticamente para VMs com GPU ou TPUs no Vertex AI:
- Use reservas com tarefas de inferência online
- Use reservas com tarefas de preparação
Consuma uma reserva criada automaticamente para TPUs no Cloud TPU
Veja reservas ou pedidos de reserva futuros

Crie um pedido de reserva futuro no modo de calendário Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Antes de começar

Console

gcloud

REST

Funções necessárias

Autorizações necessárias

Crie um pedido de reserva futuro no modo de calendário

Veja a disponibilidade futura do recurso

Consola

gcloud

REST

Crie um pedido de VMs com GPUs, VMs H4D ou TPUs

Consola

gcloud

REST

O que se segue?

Crie um pedido de reserva futuro no modo de calendário