Este documento explica como criar um pedido de reserva futura no modo de calendário. Use estes pedidos para reservar recursos de elevada procura para criar instâncias de máquinas virtuais (VM) com GPUs ou TPUs anexadas que são executadas durante um máximo de 90 dias.
Pode usar pedidos de reserva futuros no modo de calendário para reservar recursos de elevada procura para executar as seguintes cargas de trabalho:
Tarefas de pré-treino de modelos
Tarefas de ajuste do modelo
Cargas de trabalho de simulação de computação de alto desempenho (HPC)
Aumentos de curto prazo nas cargas de trabalho de inferência
Depois de Google Cloud aprovar um pedido no modo de calendário, os recursos reservados ficam disponíveis para criar VMs de GPU ou TPU na data e hora de entrega especificadas. Para saber mais acerca dos requisitos e das limitações que aplica quando cria um pedido no modo de calendário, consulte o artigo Vista geral dos pedidos de reserva futuros no modo de calendário.
Antes de começar
- Se não conseguir usar pedidos de reserva futuros no modo de calendário, pode não ser elegível para aceder e usar esta funcionalidade. Neste caso, contacte a sua equipa da conta ou a equipa de vendas.
- Para partilhar a sua capacidade reservada com outros projetos na sua organização, certifique-se de que o projeto no qual quer criar pedidos de reserva futuros no modo de calendário está autorizado a criar reservas partilhadas. Caso contrário, vai encontrar erros.
-
Se ainda não o tiver feito, configure a autenticação.
A autenticação valida a sua identidade para aceder a Google Cloud serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud initSe estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
- Set a default region and zone.
REST
Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud initSe estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
Para mais informações, consulte o artigo Autenticar para usar REST na Google Cloud documentação de autenticação.
Funções necessárias
Para receber as autorizações de que precisa para criar um pedido de reserva futuro no modo de calendário, peça ao seu administrador para lhe conceder a função IAM Compute Future Reservation User (
roles/compute.futureReservationUser) no projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.Esta função predefinida contém as autorizações necessárias para criar um pedido de reserva futuro no modo de calendário. Para ver as autorizações exatas que são necessárias, expanda a secção Autorizações necessárias:
Autorizações necessárias
As seguintes autorizações são necessárias para criar um pedido de reserva futura no modo de calendário:
-
Para criar um pedido de reserva futuro:
compute.futureReservations.createno projeto -
Para permitir que o Compute Engine crie automaticamente reservas:
compute.reservations.createno projeto -
Para especificar um modelo de instância:
compute.instanceTemplates.useReadOnlyno modelo de instância -
Para ver a disponibilidade futura dos recursos:
compute.advice.calendarModeno projeto
Também pode conseguir estas autorizações com funções personalizadas ou outras funções predefinidas.
Vista geral
Para criar um pedido de reserva futuro no modo de calendário, conclua os seguintes passos:
Veja a disponibilidade futura do recurso. Veja a disponibilidade futura das VMs com GPUs ou das TPUs que quer reservar. Em seguida, quando criar um pedido, especifique o número, o tipo e a duração da reserva dos recursos que confirmou como disponíveis.É mais provável que o Google Cloud aprove o seu pedido se fornecer estas informações.
Crie um pedido de reserva para VMs com GPUs ou TPUs. Crie e envie um pedido de reserva futura no modo de calendário para VMs com GPU ou TPUs. Se conseguir criar um pedido com êxito, o sistema aprova-o num minuto. Google Cloud
Veja a disponibilidade futura do recurso
Pode ver a disponibilidade futura de VMs de GPU ou TPUs numa região da seguinte forma:
Para VMs com GPU, até 60 dias de antecedência
Para TPUs, até 120 dias de antecedência
Para ver a disponibilidade futura de VMs com GPU ou TPUs numa região, selecione uma das seguintes opções:
Consola
Pode ver a disponibilidade futura de VMs com GPU ou TPUs numa região quando cria um pedido de reserva futura no modo de calendário. Para mais informações, consulte a secção Crie um pedido de reserva para VMs com GPUs ou TPUs neste documento.
gcloud
Para ver a disponibilidade futura de VMs com GPU ou TPU numa região, use um dos seguintes comandos
gcloud beta compute advice calendar-mode. Com base nos recursos que quer ver, inclua as seguintes flags:Para ver a disponibilidade de VMs com GPU, inclua as flags
--vm-counte--machine-type:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIMEPara ver a disponibilidade de TPUs, inclua as flags
--chip-counte--tpu-version:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Substitua o seguinte:
NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre1e80.MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:Para tipos de máquinas A4:
a4-highgpu-8gPara tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
V6EPara a TPU v5p:
V5PPara a TPU v5e:
V5E
Se especificar uma TPU v5e, tem de incluir a flag
--workload-type. Defina esta flag para o tipo de cargas de trabalho que quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique
BATCH.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING.
REGION: a região onde reservar VMs com GPUs ou TPUs. Para verificar que regiões e zonas são suportadas, consulte as limitações.FROM_START_TIMEeTO_START_TIME: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como indicações de tempo RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETSubstitua o seguinte:
YYYY-MM-DD: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífenes (-).HH:MM:SS: uma hora formatada como uma hora de dois dígitos com uma hora de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:).OFFSET: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique-08:00. Para não usar nenhum desvio, especifiqueZ.
FROM_END_TIMEeTO_END_TIME: as datas mais antigas e mais recentes em que quer que a reserva de capacidade termine. Formate estas datas como carimbos de data/hora RFC 3339. Se quiser especificar um intervalo de durações para o período de reserva em vez de horas de fim, substitua a flag--end-time-rangepela flag--duration-range.
O resultado é semelhante ao seguinte:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'Se os recursos pedidos estiverem disponíveis, o resultado contém os campos
startTime,endTimeelocation. Estes campos especificam a hora de início mais próxima, a hora de fim mais tardia e as zonas onde os recursos estão disponíveis.REST
Para ver a disponibilidade futura de VMs com GPU ou TPUs numa região, faça um pedido
GETao método betaadvice.calendarMode. Com base nos recursos que quer ver, inclua os seguintes campos no corpo do pedido:Para ver a disponibilidade de VMs com GPU, inclua os campos
instanceCountemachineType:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }Para ver a disponibilidade da TPU, inclua os campos
acceleratorCountevmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Substitua o seguinte:
PROJECT_ID: o ID do projeto onde quer reservar recursos.REGION: a região onde quer reservar VMs com GPUs ou TPUs. Para verificar as regiões e as zonas suportadas, consulte as limitações.NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre1e80.MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:Para tipos de máquinas A4:
a4-highgpu-8gPara tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EPara a TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PPara a TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se especificar uma TPU v5e, no campo
aggregateResources, tem de incluir o campoworkloadType. Defina este campo para o tipo de cargas de trabalho que quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique
BATCH.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING.
FROM_START_TIMEeTO_START_TIME: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como carimbos de data/hora RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETSubstitua o seguinte:
YYYY-MM-DD: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífenes (-).HH:MM:SS: uma hora formatada como uma hora de dois dígitos com uma hora de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:).OFFSET: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique-08:00. Para não usar nenhum desvio, especifiqueZ.
FROM_END_TIMEeTO_END_TIME: as datas mais antigas e mais recentes em que quer que a reserva de capacidade termine. Formate estas datas como carimbos de data/hora RFC 3339. Se quiser especificar um intervalo de durações para o período de reserva em vez de horas de fim, substitua os camposendTimeNotEarlierThaneendTimeNotLaterThanpelos camposminDurationemaxDuration.
O resultado é semelhante ao seguinte:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }Se os recursos pedidos estiverem disponíveis, o resultado contém os campos
startTime,endTimeelocation. Estes campos especificam a hora de início mais próxima, a hora de fim mais tardia e as zonas onde os recursos estão disponíveis.Crie um pedido de reserva para VMs com GPUs ou TPUs
Quando cria um pedido de reserva futura no modo de calendário, só pode especificar um período de reserva da seguinte forma:
Hora de início: com base nos recursos que quer reservar, tem de especificar uma hora de início que seja, pelo menos, um dos seguintes valores a partir do momento em que cria e envia um pedido:
Para VMs com GPU, 87 horas (três dias e 15 horas)
Para TPUs, seis horas
Hora de fim: pode reservar recursos durante um máximo de 90 dias.
Para criar um pedido usando uma VM de GPU existente como referência, use a Google Cloud consola. Caso contrário, selecione uma das seguintes opções:
Consola
Na Google Cloud consola, aceda à página Reservas.
Clique no separador Reservas futuras.
Clique em Criar reserva futura. É apresentada a página Crie uma reserva futura e o painel Configuração de hardware é selecionado.
Na secção Configuração, especifique as propriedades das VMs com GPU ou das TPUs que quer reservar através de uma das seguintes opções:
Para especificar diretamente as propriedades da VM de GPU ou da TPU, conclua os seguintes passos:
Selecione Especificar tipo de máquina.
Clique no separador GPUs ou TPUs e, de seguida, selecione o tipo de máquina de GPU ou a versão da TPU a reservar.
Para especificar as propriedades da VM de GPU através de um modelo de instância existente, selecione Modelo de instância e, de seguida, selecione o modelo.
Para especificar as propriedades da VM de GPU através de uma VM existente como referência, selecione Usar VM existente e, de seguida, selecione a VM.
Se especificou uma TPU v5e (CT5LP) no passo anterior, na lista Tipo de carga de trabalho de TPU v5, selecione uma das seguintes opções:
Para executar cargas de trabalho nas TPUs que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de ML, selecione Lote.
Para executar cargas de trabalho nas TPUs que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, selecione Serviço.
Na secção Pesquisar capacidade, conclua os seguintes passos:
Nas listas Região e Zona, especifique a região e a zona onde quer reservar recursos. Para rever as regiões e as zonas suportadas, consulte as Limitações.
No campo Capacidade total necessária (quando reserva VMs com GPUs) ou na lista Número de chips (quando reserva TPUs), especifique o número de VMs com GPUs ou chips de TPU a reservar. Pode especificar os seguintes valores:
Para VMs com GPU, um valor entre
1e80Para chips de TPU, um valor de
1,4,8,16,32,64,128,256,512ou1024
Na lista Hora de início, selecione a hora de início do pedido.
Opcional: na lista Escolha a flexibilidade da data de início, selecione o nível de exatidão da data de início.
No campo Duração da reserva, especifique durante quanto tempo quer reservar recursos.
Clique em Pesquisar capacidade. Em seguida, na tabela Capacidade disponível, selecione uma das opções disponíveis que contenham o tipo, o número e o período de reserva das VMs de GPU ou das TPUs a reservar.
Clicar em Seguinte.
Na secção Tipo de partilha, selecione os projetos com os quais quer partilhar a capacidade pedida:
Para usar a capacidade reservada apenas no seu projeto, selecione Local.
Para partilhar a capacidade reservada com outros projetos, selecione Partilhada, clique em Adicionar projetos e, em seguida, siga as instruções para selecionar os projetos.
Clicar em Seguinte.
No campo Nome da reserva futura, introduza um nome para o pedido.
No campo Nome da reserva, introduza o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.
Clique em Criar.
gcloud
Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, use um dos seguintes
gcloud beta compute future-reservations createcomandos. Com base nos recursos que quer reservar, inclua as seguintes flags:Para reservar VMs com GPUs, inclua as flags
--total-count,--machine-typee--deployment-type=DENSE:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONEPara reservar TPUs, inclua as flags
--chip-counte--tpu-version:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Substitua o seguinte:
FUTURE_RESERVATION_NAME: o nome do pedido.NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre1e80.MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:Para tipos de máquinas A4:
a4-highgpu-8gPara tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
V6EPara a TPU v5p:
V5PPara a TPU v5e:
V5E
Se especificar uma TPU v5e, tem de incluir a flag
--workload-type. Defina o sinalizador para o tipo de cargas de trabalho que quer executar nas UTPs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique
BATCH.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING.
RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:Para usar a capacidade apenas no seu projeto:
localPara partilhar capacidade com outros projetos:
projects
Se especificar
projects, tem de incluir a flag--share-withdefinida como uma lista de IDs de projetos separados por vírgulas, por exemplo,project-1,project-2. Pode especificar até 100 projetos na sua organização. Não inclua o ID do projeto nesta lista. Pode consumir a capacidade reservada por predefinição.START_TIME: a hora de início do pedido, formatada como uma data/hora RFC 3339.END_TIME: a hora de fim do período de reserva, formatada como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua a flag--end-timepela flag--duration.ZONE: a zona onde quer reservar recursos.
REST
Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, envie o seguinte pedido
POSTpara o método betafutureReservations.insert. Com base nos recursos que quer reservar, inclua os seguintes campos no corpo do pedido:Para reservar VMs com GPU, inclua os campos
totalCountemachineType, bem como o campodeploymentTypedefinido comoDENSE:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }Para reservar TPUs, inclua os campos
acceleratorCountevmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Substitua o seguinte:
PROJECT_ID: o ID do projeto onde quer criar o pedido.ZONE: a zona onde quer reservar recursos.FUTURE_RESERVATION_NAME: o nome do pedido.RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:Para usar a capacidade apenas no seu projeto:
LOCALPara partilhar capacidade com outros projetos:
SPECIFIC_PROJECTS
Se especificar
SPECIFIC_PROJECTS, no camposhareSettings, tem de incluir o campoprojectMappara especificar os projetos com os quais partilhar a capacidade. Pode especificar até 100 projetos na sua organização. Não especifique o ID do projeto. Pode consumir a capacidade reservada por predefinição.Por exemplo, para partilhar a capacidade pedida com outros dois projetos, inclua o seguinte:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }Substitua
CONSUMER_PROJECT_ID_1eCONSUMER_PROJECT_ID_2pelos IDs de dois projetos aos quais quer permitir o consumo da capacidade pedida.NUMBER_OF_VMS: o número de VMs com GPU a reservar. O valor tem de estar compreendido entre1e80.MACHINE_TYPE: o tipo de máquina de GPU a reservar. Especifique um dos seguintes valores:Para tipos de máquinas A4:
a4-highgpu-8gPara tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: o número de chips da TPU a reservar. O valor tem de ser1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EPara a TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PPara a TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se especificar uma TPU v5e, no campo
aggregateResources, tem de incluir o campoworkloadType. Defina o campo para o tipo de cargas de trabalho que quer executar nas UTPs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de ML, especifique
BATCH.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING.
START_TIME: a hora de início do pedido, formatada como uma data/hora RFC 3339.END_TIME: a hora de fim do período de reserva, formatada como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua o campoendTimepelo campoduration.
O que se segue?
Consuma uma reserva criada automaticamente para VMs de GPU no Compute Engine
Consuma uma reserva criada automaticamente para TPUs no Cloud TPU
Consuma uma reserva criada automaticamente usando tarefas de previsão da Vertex AI
Consuma uma reserva criada automaticamente usando tarefas de preparação do Vertex AI
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-10-19 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-10-19 UTC."],[],[]] -