En este documento, se explica cómo crear una solicitud de reserva futura en el modo de calendario. Usa estas solicitudes para reservar recursos de alta demanda para crear instancias de máquinas virtuales (VM) con GPU o TPU conectadas que se ejecuten hasta por 90 días.
Puedes usar solicitudes de reserva futuras en el modo de calendario para reservar recursos de alta demanda y ejecutar las siguientes cargas de trabajo:
Trabajos de entrenamiento previo del modelo
Trabajos de ajuste de modelos
Cargas de trabajo de simulación de computación de alto rendimiento (HPC)
Aumentos a corto plazo en las cargas de trabajo de inferencia
Después de que Google Cloud aprueba una solicitud en modo de calendario, los recursos reservados estarán disponibles para que crees VMs con GPU o TPU en la fecha y hora de entrega especificadas. Para obtener más información sobre los requisitos y las limitaciones que se aplican cuando creas una solicitud en el modo de calendario, consulta Descripción general de las solicitudes de reserva futuras en el modo de calendario.
Antes de comenzar
- Si no puedes usar solicitudes de reserva futuras en el modo de calendario, es posible que no cumplas con los requisitos para acceder a esta función y usarla. En ese caso, comunícate con tu equipo de cuentas o con el equipo de ventas.
- Para compartir tu capacidad reservada con otros proyectos de tu organización, asegúrate de que el proyecto en el que deseas crear solicitudes de reserva futura en modo de calendario esté habilitado para crear reservas compartidas. De lo contrario, encontrarás errores.
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:
gcloud initSi usas un proveedor de identidad externo (IdP), primero debes acceder a la CLI de gcloud con tu identidad federada.
- Set a default region and zone.
REST
Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a gcloud CLI.
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:
gcloud initSi usas un proveedor de identidad externo (IdP), primero debes acceder a la CLI de gcloud con tu identidad federada.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .
Roles requeridos
Para obtener los permisos que necesitas para crear una solicitud de reserva futura en el modo de calendario, pídele a tu administrador que te otorgue el rol de IAM de Usuario de reserva futura de Compute (
roles/compute.futureReservationUser) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.Este rol predefinido contiene los permisos necesarios para crear una solicitud de reserva futura en el modo de calendario. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para crear una solicitud de reserva futura en el modo de calendario:
-
Para crear una solicitud de reserva futura, usa
compute.futureReservations.createen el proyecto. -
Para permitir que Compute Engine cree reservas automáticamente, usa
compute.reservations.createen el proyecto. -
Para especificar una plantilla de instancias: usa
compute.instanceTemplates.useReadOnlyen la plantilla de instancias -
Para ver la disponibilidad futura de los recursos, usa
compute.advice.calendarModeen el proyecto.
También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.
Descripción general
Para crear una solicitud de reserva futura en el modo de calendario, completa los siguientes pasos:
Consulta la disponibilidad futura de los recursos. Consulta la disponibilidad futura de las VMs con GPU o las TPU que deseas reservar. Luego, cuando crees una solicitud, especifica la cantidad, el tipo y la duración de la reserva de los recursos que confirmaste como disponibles. Google Cloud es más probable que apruebe tu solicitud si proporcionas esta información.
Crea una solicitud de reserva para VMs de GPU o TPU. Crea y envía una solicitud de reserva futura en modo de calendario para VMs de GPU o TPU. Si puedes crear una solicitud correctamente, Google Cloud la aprobará en un minuto.
Consulta la disponibilidad futura de los recursos
Puedes ver la disponibilidad futura de las VMs con GPU o TPU en una región de la siguiente manera:
En el caso de las VMs con GPU, hasta con 60 días de anticipación
En el caso de las TPU, hasta con 120 días de anticipación
Para ver la disponibilidad futura de VMs con GPU o TPU en una región, selecciona una de las siguientes opciones:
Console
Puedes ver la disponibilidad futura de las VMs con GPU o las TPU en una región cuando creas una solicitud de reserva futura en el modo de calendario. Para obtener más información, consulta Crea una solicitud de reserva para VMs con GPU o TPU en este documento.
gcloud
Para ver la disponibilidad futura de las VMs con GPU o TPU en una región, usa uno de los siguientes comandos
gcloud beta compute advice calendar-mode. Según los recursos que desees ver, incluye las siguientes marcas:Para ver la disponibilidad de las VMs con GPU, incluye las marcas
--vm-county--machine-type:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIMEPara ver la disponibilidad de la TPU, incluye las marcas
--chip-county--tpu-version:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Reemplaza lo siguiente:
NUMBER_OF_VMS: Es la cantidad de VMs con GPU que se reservarán. El valor debe ser de entre1y80.MACHINE_TYPE: Es el tipo de máquina de GPU que se reservará. Especifica uno de los siguientes valores:Para los tipos de máquinas A4:
a4-highgpu-8gPara los tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. El valor debe ser1,4,8,16,32,64,128,256,512o1024.TPU_VERSION: Es la versión de TPU que se reservará. Especifica uno de los siguientes valores:Para TPU v6e:
V6EPara TPU v5p:
V5PPara TPU v5e:
V5E
Si especificas una TPU v5e, debes incluir la marca
--workload-type. Establece esta marca en el tipo de cargas de trabajo que deseas ejecutar en las TPU:Para las cargas de trabajo que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (AA), especifica
BATCH.Para las cargas de trabajo que controlan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de ML, especifica
SERVING.
REGION: Es la región en la que se reservarán las VMs con GPU o las TPU. Para verificar qué regiones y zonas son compatibles, consulta Limitaciones.FROM_START_TIMEyTO_START_TIME: Las fechas más temprana y más tardía en las que deseas reservar capacidad. Formatea estas fechas como marcas de tiempo RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETReemplaza lo siguiente:
YYYY-MM-DD: Una fecha con formato de un año de cuatro dígitos, un mes de dos dígitos y un día de dos dígitos, separados por guiones (-).HH:MM:SS: Una hora con formato de hora de dos dígitos con un formato de 24 horas, minutos de dos dígitos y segundos de dos dígitos, separados por dos puntos (:).OFFSET: la zona horaria con formato como una compensación del horario universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica-08:00. Para no usar compensación, especificaZ.
FROM_END_TIMEyTO_END_TIME: Son las fechas más temprana y más tardía en las que deseas que finalice tu reserva de capacidad. Formatea estas fechas como marcas de tiempo RFC 3339. Si deseas especificar un rango de duraciones para tu período de reserva en lugar de horas de finalización, reemplaza la marca--end-time-rangepor la--duration-range.
El resultado es similar a este:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'Si los recursos solicitados están disponibles, el resultado contiene los campos
startTime,endTimeylocation. Estos campos especifican la hora de inicio más temprana, la hora de finalización más tardía y las zonas en las que los recursos están disponibles.REST
Para ver la disponibilidad futura de las VMs con GPU o TPU en una región, realiza una solicitud
GETal métodoadvice.calendarModeen versión beta. Según los recursos que desees ver, incluye los siguientes campos en el cuerpo de la solicitud:Para ver la disponibilidad de las VMs con GPU, incluye los campos
instanceCountymachineType:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }Para ver la disponibilidad de las TPU, incluye los campos
acceleratorCountyvmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Reemplaza lo siguiente:
PROJECT_ID: el ID del proyecto en el que deseas reservar los recursos.REGION: Es la región en la que deseas reservar VMs con GPU o TPU. Para verificar las regiones y zonas admitidas, consulta Limitaciones.NUMBER_OF_VMS: Es la cantidad de VMs con GPU que se reservarán. El valor debe ser de entre1y80.MACHINE_TYPE: Es el tipo de máquina de GPU que se reservará. Especifica uno de los siguientes valores:Para los tipos de máquinas A4:
a4-highgpu-8gPara los tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. El valor debe ser1,4,8,16,32,64,128,256,512o1024.TPU_VERSION: Es la versión de TPU que se reservará. Especifica uno de los siguientes valores:Para TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EPara TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PPara TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si especificas una TPU v5e, en el campo
aggregateResources, debes incluir el campoworkloadType. Configura este campo en el tipo de cargas de trabajo que deseas ejecutar en las TPU:Para las cargas de trabajo que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (AA), especifica
BATCH.Para las cargas de trabajo que controlan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de ML, especifica
SERVING.
FROM_START_TIMEyTO_START_TIME: Las fechas más temprana y más tardía en las que deseas reservar capacidad. Formatea estas fechas como marcas de tiempo RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSETReemplaza lo siguiente:
YYYY-MM-DD: Una fecha con formato de un año de cuatro dígitos, un mes de dos dígitos y un día de dos dígitos, separados por guiones (-).HH:MM:SS: Una hora con formato de hora de dos dígitos con un formato de 24 horas, minutos de dos dígitos y segundos de dos dígitos, separados por dos puntos (:).OFFSET: la zona horaria con formato como una compensación del horario universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica-08:00. Para no usar compensación, especificaZ.
FROM_END_TIMEyTO_END_TIME: Son las fechas más temprana y más tardía en las que deseas que finalice tu reserva de capacidad. Formatea estas fechas como marcas de tiempo RFC 3339. Si deseas especificar un rango de duraciones para tu período de reserva en lugar de horas de finalización, reemplaza los camposendTimeNotEarlierThanyendTimeNotLaterThanpor los camposminDurationymaxDuration.
El resultado es similar a este:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }Si los recursos solicitados están disponibles, el resultado contiene los campos
startTime,endTimeylocation. Estos campos especifican la hora de inicio más temprana, la hora de finalización más tardía y las zonas en las que los recursos están disponibles.Crea una solicitud de reserva para VMs de GPU o TPU
Cuando creas una solicitud de reserva futura en el modo de calendario, solo puedes especificar un período de reserva de la siguiente manera:
Hora de inicio: Según los recursos que desees reservar, debes especificar una hora de inicio que sea al menos uno de los siguientes valores desde el momento en que creas y envías una solicitud:
En el caso de las VMs con GPU, 87 horas (tres días y 15 horas)
En el caso de las TPU, seis horas
Hora de finalización: Puedes reservar recursos por un máximo de 90 días.
Para crear una solicitud con una VM de GPU existente como referencia, usa la consola deGoogle Cloud . De lo contrario, selecciona una de las siguientes opciones:
Console
En la consola de Google Cloud , ve a la página Reservas.
Haz clic en la pestaña Reservas futuras.
Haz clic en Crear reserva futura. Aparecerá la página Crear una reserva futura y se seleccionará el panel Configuración de hardware.
En la sección Configuración, especifica las propiedades de las VMs con GPU o TPU que deseas reservar de una de las siguientes maneras:
Para especificar directamente las propiedades de la VM con GPU o TPU, completa los siguientes pasos:
Selecciona Especificar tipo de máquina.
Haz clic en la pestaña GPUs o TPUs y, luego, selecciona el tipo de máquina con GPU o la versión de TPU que deseas reservar.
Para especificar las propiedades de la VM con GPU usando una plantilla de instancias existente, selecciona Plantilla de instancias y, luego, selecciona la plantilla.
Para especificar las propiedades de la VM de GPU con una VM existente como referencia, selecciona Usar VM existente y, luego, selecciona la VM.
Si especificaste una TPU v5e (CT5LP) en el paso anterior, en la lista Tipo de carga de trabajo de TPU v5, selecciona una de las siguientes opciones:
Para ejecutar cargas de trabajo en las TPU que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de AA, selecciona Batch.
Para ejecutar cargas de trabajo en las TPU que controlan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de ML, selecciona Serving.
En la sección Buscar capacidad, completa los siguientes pasos:
En las listas Región y Zona, especifica la región y la zona en las que deseas reservar los recursos. Para revisar las regiones y zonas admitidas, consulta Limitaciones.
En el campo Capacidad total necesaria (cuando reservas VMs con GPU) o en la lista Cantidad de chips (cuando reservas TPU), especifica la cantidad de VMs con GPU o chips de TPU que deseas reservar. Puedes especificar los siguientes valores:
En el caso de las VMs con GPU, un valor entre
1y80Para los chips de TPU, un valor de
1,4,8,16,32,64,128,256,512o1024
En la lista Hora de inicio, selecciona la hora de inicio de tu solicitud.
Opcional: En la lista Elige la flexibilidad de la fecha de inicio, selecciona qué tan exacta debe ser la fecha de inicio.
En el campo Duración de la reserva, especifica durante cuánto tiempo deseas reservar los recursos.
Haz clic en Buscar capacidad. Luego, en la tabla Capacidad disponible, selecciona una de las opciones disponibles que contengan el tipo, la cantidad y el período de reserva de las VMs con GPU o TPU que deseas reservar.
Haz clic en Siguiente.
En la sección Tipo de recurso compartido, selecciona los proyectos con los que deseas compartir la capacidad solicitada:
Para usar la capacidad reservada solo dentro de tu proyecto, selecciona Local.
Para compartir la capacidad reservada con otros proyectos, selecciona Compartido, haz clic en Agregar proyectos y, luego, sigue las indicaciones para seleccionar los proyectos.
Haz clic en Siguiente.
En el campo Nombre de la reserva futura, ingresa un nombre para la solicitud.
En el campo Nombre de la reserva, ingresa el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
Haz clic en Crear.
gcloud
Para crear una solicitud de reserva futura en modo de calendario y enviarla para su revisión, usa uno de los siguientes comandos
gcloud beta compute future-reservations create. Según los recursos que desees reservar, incluye las siguientes marcas:Para reservar VMs con GPU, incluye las marcas
--total-count,--machine-typey--deployment-type=DENSE:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONEPara reservar TPUs, incluye las marcas
--chip-county--tpu-version:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Reemplaza lo siguiente:
FUTURE_RESERVATION_NAME: Es el nombre de la solicitud.NUMBER_OF_VMS: Es la cantidad de VMs con GPU que se reservarán. El valor debe ser de entre1y80.MACHINE_TYPE: Es el tipo de máquina de GPU que se reservará. Especifica uno de los siguientes valores:Para los tipos de máquinas A4:
a4-highgpu-8gPara los tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. El valor debe ser1,4,8,16,32,64,128,256,512o1024.TPU_VERSION: Es la versión de TPU que se reservará. Especifica uno de los siguientes valores:Para TPU v6e:
V6EPara TPU v5p:
V5PPara TPU v5e:
V5E
Si especificas una TPU v5e, debes incluir la marca
--workload-type. Establece la marca en el tipo de cargas de trabajo que deseas ejecutar en las TPU:Para las cargas de trabajo que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (AA), especifica
BATCH.Para las cargas de trabajo que controlan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de ML, especifica
SERVING.
RESERVATION_NAME: Es el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.SHARE_TYPE: Indica si otros proyectos de tu organización pueden usar la capacidad reservada. Especifica uno de los siguientes valores:Para usar la capacidad solo dentro de tu proyecto, haz lo siguiente:
localPara compartir capacidad con otros proyectos, haz lo siguiente:
projects
Si especificas
projects, debes incluir la marca--share-withestablecida en una lista separada por comas de IDs de proyectos, por ejemplo,project-1,project-2. Puedes especificar hasta 100 proyectos dentro de tu organización. No incluyas el ID de tu proyecto en esta lista. Puedes consumir la capacidad reservada de forma predeterminada.START_TIME: Es la hora de inicio de la solicitud, con formato de marca de tiempo RFC 3339.END_TIME: Es la hora de finalización del período de reserva, con el formato de una marca de tiempo RFC 3339. Si deseas especificar una duración, en segundos, para el período de reserva en lugar de una hora de finalización, reemplaza la marca--end-timepor la marca--duration.ZONE: Es la zona en la que deseas reservar los recursos.
REST
Para crear una solicitud de reserva futura en el modo de calendario y enviarla para su revisión, envía la siguiente solicitud
POSTal métodofutureReservations.insertbeta. Según los recursos que desees reservar, incluye los siguientes campos en el cuerpo de la solicitud:Para reservar VMs con GPU, incluye los campos
totalCountymachineType, así como el campodeploymentTypeestablecido enDENSE:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }Para reservar TPUs, incluye los campos
acceleratorCountyvmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Reemplaza lo siguiente:
PROJECT_ID: Es el ID del proyecto en el que deseas crear la solicitud.ZONE: Es la zona en la que deseas reservar los recursos.FUTURE_RESERVATION_NAME: Es el nombre de la solicitud.RESERVATION_NAME: Es el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.SHARE_TYPE: Indica si otros proyectos de tu organización pueden usar la capacidad reservada. Especifica uno de los siguientes valores:Para usar la capacidad solo dentro de tu proyecto, haz lo siguiente:
LOCALPara compartir capacidad con otros proyectos, haz lo siguiente:
SPECIFIC_PROJECTS
Si especificas
SPECIFIC_PROJECTS, en el camposhareSettings, debes incluir el campoprojectMappara especificar los proyectos con los que se compartirá la capacidad. Puedes especificar hasta 100 proyectos dentro de tu organización. No especifiques tu ID del proyecto. Puedes consumir la capacidad reservada de forma predeterminada.Por ejemplo, para compartir la capacidad solicitada con otros dos proyectos, incluye lo siguiente:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }Reemplaza
CONSUMER_PROJECT_ID_1yCONSUMER_PROJECT_ID_2por los IDs de dos proyectos que deseas permitir que consuman la capacidad solicitada.NUMBER_OF_VMS: Es la cantidad de VMs con GPU que se reservarán. El valor debe ser de entre1y80.MACHINE_TYPE: Es el tipo de máquina de GPU que se reservará. Especifica uno de los siguientes valores:Para los tipos de máquinas A4:
a4-highgpu-8gPara los tipos de máquinas A3 Ultra:
a3-ultragpu-8g
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. El valor debe ser1,4,8,16,32,64,128,256,512o1024.TPU_VERSION: Es la versión de TPU que se reservará. Especifica uno de los siguientes valores:Para TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EPara TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PPara TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si especificas una TPU v5e, en el campo
aggregateResources, debes incluir el campoworkloadType. Configura el campo en el tipo de cargas de trabajo que deseas ejecutar en las TPU:Para las cargas de trabajo que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de AA, especifica
BATCH.Para las cargas de trabajo que controlan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de ML, especifica
SERVING.
START_TIME: Es la hora de inicio de la solicitud, con formato de marca de tiempo RFC 3339.END_TIME: Es la hora de finalización del período de reserva, con el formato de una marca de tiempo RFC 3339. Si deseas especificar una duración, en segundos, para tu período de reserva en lugar de una hora de finalización, reemplaza el campoendTimepor el campoduration.
¿Qué sigue?
Cómo consumir una reserva creada automáticamente para VMs con GPU en Compute Engine
Cómo consumir una reserva creada automáticamente para las TPU en Cloud TPU
Consume una reserva creada automáticamente con trabajos de predicción de Vertex AI
Cómo consumir una reserva creada automáticamente con trabajos de entrenamiento de Vertex AI
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-10-19 (UTC)
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-10-19 (UTC)"],[],[]] -