Crie um pedido de reserva futuro no modo de calendário

Este documento explica como criar um pedido de reserva futura no modo de calendário. Use estes pedidos para reservar recursos de elevada procura para criar instâncias de máquinas virtuais (VM) com GPUs ou TPUs anexadas que são executadas durante um máximo de 90 dias.

Pode usar pedidos de reserva futuros no modo de calendário para reservar recursos de elevada procura para executar as seguintes cargas de trabalho:

  • Tarefas de pré-treino de modelos

  • Tarefas de ajuste do modelo

  • Cargas de trabalho de simulação de computação de alto desempenho (HPC)

  • Aumentos de curto prazo nas cargas de trabalho de inferência

Depois de Google Cloud aprovar um pedido no modo de calendário, os recursos reservados ficam disponíveis para criar VMs de GPU ou TPU na data e hora de entrega especificadas. Para saber mais acerca dos requisitos e das limitações que aplica quando cria um pedido no modo de calendário, consulte o artigo Vista geral dos pedidos de reserva futuros no modo de calendário.

Antes de começar

  • Se não conseguir usar pedidos de reserva futuros no modo de calendário, pode não ser elegível para aceder e usar esta funcionalidade. Neste caso, contacte a sua equipa da conta ou a equipa de vendas.
  • Para partilhar a sua capacidade reservada com outros projetos na sua organização, certifique-se de que o projeto no qual quer criar pedidos de reserva futuros no modo de calendário está autorizado a criar reservas partilhadas. Caso contrário, vai encontrar erros.
  • Se ainda não o tiver feito, configure a autenticação. A autenticação valida a sua identidade para aceder a Google Cloud serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

      gcloud init

      Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.

    2. Set a default region and zone.

    REST

    Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.

      Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

      gcloud init

      Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.

    Para mais informações, consulte o artigo Autenticar para usar REST na Google Cloud documentação de autenticação.

Funções necessárias

Para receber as autorizações de que precisa para criar um pedido de reserva futuro no modo de calendário, peça ao seu administrador para lhe conceder a função IAM Compute Future Reservation User (roles/compute.futureReservationUser) no projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

Esta função predefinida contém as autorizações necessárias para criar um pedido de reserva futuro no modo de calendário. Para ver as autorizações exatas que são necessárias, expanda a secção Autorizações necessárias:

Autorizações necessárias

As seguintes autorizações são necessárias para criar um pedido de reserva futura no modo de calendário:

  • Para criar um pedido de reserva futuro: compute.futureReservations.create no projeto
  • Para permitir que o Compute Engine crie automaticamente reservas: compute.reservations.create no projeto
  • Para especificar um modelo de instância: compute.instanceTemplates.useReadOnly no modelo de instância
  • Para ver a disponibilidade futura dos recursos: compute.advice.calendarMode no projeto

Também pode conseguir estas autorizações com funções personalizadas ou outras funções predefinidas.

Vista geral

Para criar um pedido de reserva futuro no modo de calendário, conclua os seguintes passos:

  1. Veja a disponibilidade futura do recurso. Veja a disponibilidade futura das VMs com GPUs ou das TPUs que quer reservar. Em seguida, quando criar um pedido, especifique o número, o tipo e a duração da reserva dos recursos que confirmou como disponíveis.É mais provável que o Google Cloud aprove o seu pedido se fornecer estas informações.

  2. Crie um pedido de reserva para VMs com GPUs ou TPUs. Crie e envie um pedido de reserva futura no modo de calendário para VMs com GPU ou TPUs. Se conseguir criar um pedido com êxito, o sistema aprova-o num minuto. Google Cloud

Veja a disponibilidade futura do recurso

Pode ver a disponibilidade futura de VMs de GPU ou TPUs numa região da seguinte forma:

  • Para VMs com GPU, até 60 dias de antecedência

  • Para TPUs, até 120 dias de antecedência

Para ver a disponibilidade futura de VMs com GPU ou TPUs numa região, selecione uma das seguintes opções:

Consola

Pode ver a disponibilidade futura de VMs com GPU ou TPUs numa região quando cria um pedido de reserva futura no modo de calendário. Para mais informações, consulte a secção Crie um pedido de reserva para VMs com GPUs ou TPUs neste documento.

gcloud

Para ver a disponibilidade futura de VMs com GPU ou TPU numa região, use um dos seguintes comandos gcloud beta compute advice calendar-mode. Com base nos recursos que quer ver, inclua as seguintes flags:

  • Para ver a disponibilidade de VMs com GPU, inclua as flags --vm-count e --machine-type:

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • Para ver a disponibilidade de TPUs, inclua as flags --chip-count e --tpu-version:

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

Substitua o seguinte:

  • NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre 1 e 80.

  • MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:

    • Para tipos de máquinas A4: a4-highgpu-8g

    • Para tipos de máquinas A3 Ultra: a3-ultragpu-8g

  • NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.

  • TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:

    • Para a TPU v6e: V6E

    • Para a TPU v5p: V5P

    • Para a TPU v5e: V5E

    Se especificar uma TPU v5e, tem de incluir a flag --workload-type. Defina esta flag para o tipo de cargas de trabalho que quer executar nas TPUs:

    • Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique BATCH.

    • Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • REGION: a região onde reservar VMs com GPUs ou TPUs. Para verificar que regiões e zonas são suportadas, consulte as limitações.

  • FROM_START_TIME e TO_START_TIME: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como indicações de tempo RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Substitua o seguinte:

    • YYYY-MM-DD: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífenes (-).

    • HH:MM:SS: uma hora formatada como uma hora de dois dígitos com uma hora de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:).

    • OFFSET: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique -08:00. Para não usar nenhum desvio, especifique Z.

  • FROM_END_TIME e TO_END_TIME: as datas mais antigas e mais recentes em que quer que a reserva de capacidade termine. Formate estas datas como carimbos de data/hora RFC 3339. Se quiser especificar um intervalo de durações para o período de reserva em vez de horas de fim, substitua a flag --end-time-range pela flag --duration-range.

O resultado é semelhante ao seguinte:

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Se os recursos pedidos estiverem disponíveis, o resultado contém os campos startTime, endTime e location. Estes campos especificam a hora de início mais próxima, a hora de fim mais tardia e as zonas onde os recursos estão disponíveis.

REST

Para ver a disponibilidade futura de VMs com GPU ou TPUs numa região, faça um pedido GET ao método beta advice.calendarMode. Com base nos recursos que quer ver, inclua os seguintes campos no corpo do pedido:

  • Para ver a disponibilidade de VMs com GPU, inclua os campos instanceCount e machineType:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • Para ver a disponibilidade da TPU, inclua os campos acceleratorCount e vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

Substitua o seguinte:

  • PROJECT_ID: o ID do projeto onde quer reservar recursos.

  • REGION: a região onde quer reservar VMs com GPUs ou TPUs. Para verificar as regiões e as zonas suportadas, consulte as limitações.

  • NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre 1 e 80.

  • MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:

    • Para tipos de máquinas A4: a4-highgpu-8g

    • Para tipos de máquinas A3 Ultra: a3-ultragpu-8g

  • NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.

  • TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:

    • Para a TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Para a TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Para a TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Se especificar uma TPU v5e, no campo aggregateResources, tem de incluir o campo workloadType. Defina este campo para o tipo de cargas de trabalho que quer executar nas TPUs:

    • Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique BATCH.

    • Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • FROM_START_TIME e TO_START_TIME: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como carimbos de data/hora RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Substitua o seguinte:

    • YYYY-MM-DD: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífenes (-).

    • HH:MM:SS: uma hora formatada como uma hora de dois dígitos com uma hora de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:).

    • OFFSET: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique -08:00. Para não usar nenhum desvio, especifique Z.

  • FROM_END_TIME e TO_END_TIME: as datas mais antigas e mais recentes em que quer que a reserva de capacidade termine. Formate estas datas como carimbos de data/hora RFC 3339. Se quiser especificar um intervalo de durações para o período de reserva em vez de horas de fim, substitua os campos endTimeNotEarlierThan e endTimeNotLaterThan pelos campos minDuration e maxDuration.

O resultado é semelhante ao seguinte:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

Se os recursos pedidos estiverem disponíveis, o resultado contém os campos startTime, endTime e location. Estes campos especificam a hora de início mais próxima, a hora de fim mais tardia e as zonas onde os recursos estão disponíveis.

Crie um pedido de reserva para VMs com GPUs ou TPUs

Quando cria um pedido de reserva futura no modo de calendário, só pode especificar um período de reserva da seguinte forma:

  • Hora de início: com base nos recursos que quer reservar, tem de especificar uma hora de início que seja, pelo menos, um dos seguintes valores a partir do momento em que cria e envia um pedido:

    • Para VMs com GPU, 87 horas (três dias e 15 horas)

    • Para TPUs, seis horas

  • Hora de fim: pode reservar recursos durante um máximo de 90 dias.

Para criar um pedido usando uma VM de GPU existente como referência, use a Google Cloud consola. Caso contrário, selecione uma das seguintes opções:

Consola

  1. Na Google Cloud consola, aceda à página Reservas.

    Aceder a Reservas

  2. Clique no separador Reservas futuras.

  3. Clique em Criar reserva futura. É apresentada a página Crie uma reserva futura e o painel Configuração de hardware é selecionado.

  4. Na secção Configuração, especifique as propriedades das VMs com GPU ou das TPUs que quer reservar através de uma das seguintes opções:

    • Para especificar diretamente as propriedades da VM de GPU ou da TPU, conclua os seguintes passos:

      1. Selecione Especificar tipo de máquina.

      2. Clique no separador GPUs ou TPUs e, de seguida, selecione o tipo de máquina de GPU ou a versão da TPU a reservar.

    • Para especificar as propriedades da VM de GPU através de um modelo de instância existente, selecione Modelo de instância e, de seguida, selecione o modelo.

    • Para especificar as propriedades da VM de GPU através de uma VM existente como referência, selecione Usar VM existente e, de seguida, selecione a VM.

  5. Se especificou uma TPU v5e (CT5LP) no passo anterior, na lista Tipo de carga de trabalho de TPU v5, selecione uma das seguintes opções:

    • Para executar cargas de trabalho nas TPUs que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de ML, selecione Lote.

    • Para executar cargas de trabalho nas TPUs que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, selecione Serviço.

  6. Na secção Pesquisar capacidade, conclua os seguintes passos:

    1. Nas listas Região e Zona, especifique a região e a zona onde quer reservar recursos. Para rever as regiões e as zonas suportadas, consulte as Limitações.

    2. No campo Capacidade total necessária (quando reserva VMs com GPUs) ou na lista Número de chips (quando reserva TPUs), especifique o número de VMs com GPUs ou chips de TPU a reservar. Pode especificar os seguintes valores:

      • Para VMs com GPU, um valor entre 1 e 80

      • Para chips de TPU, um valor de 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024

    3. Na lista Hora de início, selecione a hora de início do pedido.

    4. Opcional: na lista Escolha a flexibilidade da data de início, selecione o nível de exatidão da data de início.

    5. No campo Duração da reserva, especifique durante quanto tempo quer reservar recursos.

    6. Clique em Pesquisar capacidade. Em seguida, na tabela Capacidade disponível, selecione uma das opções disponíveis que contenham o tipo, o número e o período de reserva das VMs de GPU ou das TPUs a reservar.

  7. Clicar em Seguinte.

  8. Na secção Tipo de partilha, selecione os projetos com os quais quer partilhar a capacidade pedida:

    • Para usar a capacidade reservada apenas no seu projeto, selecione Local.

    • Para partilhar a capacidade reservada com outros projetos, selecione Partilhada, clique em Adicionar projetos e, em seguida, siga as instruções para selecionar os projetos.

  9. Clicar em Seguinte.

  10. No campo Nome da reserva futura, introduza um nome para o pedido.

  11. No campo Nome da reserva, introduza o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.

  12. Clique em Criar.

gcloud

Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, use um dos seguintes gcloud beta compute future-reservations createcomandos. Com base nos recursos que quer reservar, inclua as seguintes flags:

  • Para reservar VMs com GPUs, inclua as flags --total-count, --machine-type e --deployment-type=DENSE:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • Para reservar TPUs, inclua as flags --chip-count e --tpu-version:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

Substitua o seguinte:

  • FUTURE_RESERVATION_NAME: o nome do pedido.

  • NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre 1 e 80.

  • MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:

    • Para tipos de máquinas A4: a4-highgpu-8g

    • Para tipos de máquinas A3 Ultra: a3-ultragpu-8g

  • NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.

  • TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:

    • Para a TPU v6e: V6E

    • Para a TPU v5p: V5P

    • Para a TPU v5e: V5E

    Se especificar uma TPU v5e, tem de incluir a flag --workload-type. Defina o sinalizador para o tipo de cargas de trabalho que quer executar nas UTPs:

    • Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique BATCH.

    • Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.

  • SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:

    • Para usar a capacidade apenas no seu projeto: local

    • Para partilhar capacidade com outros projetos: projects

    Se especificar projects, tem de incluir a flag --share-with definida como uma lista de IDs de projetos separados por vírgulas, por exemplo, project-1,project-2. Pode especificar até 100 projetos na sua organização. Não inclua o ID do projeto nesta lista. Pode consumir a capacidade reservada por predefinição.

  • START_TIME: a hora de início do pedido, formatada como uma data/hora RFC 3339.

  • END_TIME: a hora de fim do período de reserva, formatada como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua a flag --end-time pela flag --duration.

  • ZONE: a zona onde quer reservar recursos.

REST

Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, envie o seguinte pedido POST para o método beta futureReservations.insert. Com base nos recursos que quer reservar, inclua os seguintes campos no corpo do pedido:

  • Para reservar VMs com GPU, inclua os campos totalCount e machineType, bem como o campo deploymentType definido como DENSE:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • Para reservar TPUs, inclua os campos acceleratorCount e vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

Substitua o seguinte:

  • PROJECT_ID: o ID do projeto onde quer criar o pedido.

  • ZONE: a zona onde quer reservar recursos.

  • FUTURE_RESERVATION_NAME: o nome do pedido.

  • RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.

  • SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:

    • Para usar a capacidade apenas no seu projeto: LOCAL

    • Para partilhar capacidade com outros projetos: SPECIFIC_PROJECTS

    Se especificar SPECIFIC_PROJECTS, no campo shareSettings, tem de incluir o campo projectMap para especificar os projetos com os quais partilhar a capacidade. Pode especificar até 100 projetos na sua organização. Não especifique o ID do projeto. Pode consumir a capacidade reservada por predefinição.

    Por exemplo, para partilhar a capacidade pedida com outros dois projetos, inclua o seguinte:

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    Substitua CONSUMER_PROJECT_ID_1 e CONSUMER_PROJECT_ID_2 pelos IDs de dois projetos aos quais quer permitir o consumo da capacidade pedida.

  • NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre 1 e 80.

  • MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:

    • Para tipos de máquinas A4: a4-highgpu-8g

    • Para tipos de máquinas A3 Ultra: a3-ultragpu-8g

  • NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024.

  • TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:

    • Para a TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Para a TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Para a TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Se especificar uma TPU v5e, no campo aggregateResources, tem de incluir o campo workloadType. Defina o campo para o tipo de cargas de trabalho que quer executar nas UTPs:

    • Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de ML, especifique BATCH.

    • Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • START_TIME: a hora de início do pedido, formatada como uma data/hora RFC 3339.

  • END_TIME: a hora de fim do período de reserva, formatada como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua o campo endTime pelo campo duration.

O que se segue?