Crea una solicitud de reserva futura en el modo de calendario

En este documento, se explica cómo crear una solicitud de reserva futura en modo de calendario para reservar recursos de GPU, H4D o TPU para tus instancias de máquina virtual (VM). Usa estas solicitudes para obtener recursos con alta demanda para crear VMs que planeas ejecutar durante un máximo de 90 días.

Puedes usar solicitudes de reserva futuras en el modo de calendario para reservar recursos y ejecutar las siguientes cargas de trabajo:

Trabajos de entrenamiento previo del modelo
Trabajos de ajuste de modelos
Cargas de trabajo de simulación de computación de alto rendimiento (HPC)
Aumentos a corto plazo en las cargas de trabajo de inferencia

Después de que Google Cloud apruebe tu solicitud, los recursos reservados estarán disponibles para que crees VMs con GPU, H4D o TPU en la fecha y hora de entrega especificadas. Durante el período de reserva, solo tu proyecto y los proyectos que especifiques cuando crees la solicitud tendrán acceso a los recursos reservados. Puedes compartir los recursos reservados con hasta 100 proyectos que se encuentren en la misma organización que tu proyecto. Para obtener más información sobre los requisitos y las limitaciones que se aplican cuando creas una solicitud en el modo de calendario, consulta Descripción general de las solicitudes de reserva futuras en el modo de calendario.

Antes de comenzar

Si no puedes usar solicitudes de reserva futura en el modo de calendario, es posible que no cumplas con los requisitos para acceder a esta función y usarla. En ese caso, comunícate con tu equipo de cuentas o con el equipo de ventas.
Para compartir tu capacidad reservada con otros proyectos de tu organización, verifica que el proyecto en el que deseas crear solicitudes de reserva futuras en modo de calendario esté autorizado para crear reservas compartidas. De lo contrario, encontrarás errores.
Si aún no lo hiciste, configura la autenticación. La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
  gcloud init
  Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.
  
  Nota: Si ya instalaste la gcloud CLI, asegúrate de tener la versión más reciente. Para esto, ejecuta gcloud components update.
2. Set a default region and zone.
REST

Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .

Roles obligatorios

Para obtener los permisos que necesitas para crear una solicitud de reserva futura en modo de calendario, pídele a tu administrador que te otorgue el rol de IAM Usuario de reserva futura de Compute (roles/compute.futureReservationUser) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para crear una solicitud de reserva futura en el modo de calendario. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para crear una solicitud de reserva futura en el modo de calendario:

Para crear una solicitud de reserva futura, usa compute.futureReservations.create en el proyecto.
Para permitir que Compute Engine cree reservas automáticamente, usa compute.reservations.create en el proyecto.
Para ver la disponibilidad de recursos en una fecha futura, usa compute.advice.calendarMode en el proyecto.

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Crea una solicitud de reserva futura en el modo de calendario

Para crear una solicitud de reserva futura en el modo de calendario, completa los siguientes pasos:

Consulta la disponibilidad futura de los recursos. Consulta la disponibilidad futura de las VMs con GPU, las VMs H4D o las TPU que quieras reservar. Luego, cuando crees una solicitud, especifica la cantidad, el tipo y la duración de la reserva de los recursos que confirmaste como disponibles.Es más probable que Google Cloud apruebe tu solicitud si proporcionas esta información.

Nota: Si creas una solicitud con la consola de Google Cloud , omite este paso. Puedes ver la disponibilidad futura de las VMs con GPU, las VM H4D o las TPU mientras creas la solicitud.

Para obtener instrucciones, consulta Consulta la disponibilidad futura de los recursos.
Crea una solicitud de reserva. Crea y envía una solicitud de reserva futura en el modo de calendario para VMs con GPU, VMs H4D o TPUs. Si puedes crear una solicitud correctamente, Google Cloud la aprobará en un minuto.

Para obtener instrucciones, consulta Crea una solicitud para VMs con GPU, VMs H4D o TPU.

Consulta la disponibilidad futura de los recursos

Puedes consultar la disponibilidad futura de las VMs con GPU, las VMs H4D o las TPU en una región de la siguiente manera:

En el caso de las VMs con GPU o H4D, hasta con 60 días de anticipación
En el caso de las TPU, hasta con 120 días de anticipación

Para ver la disponibilidad futura de las VMs con GPU, las VM de H4D o las TPU en una región, selecciona una de las siguientes opciones:

Console

Puedes ver la disponibilidad futura de VMs con GPU, VM H4D o TPU en una región cuando creas una solicitud de reserva futura en modo de calendario. Para obtener más información, consulta Crea una solicitud para VMs con GPU, VMs H4D o TPUs en este documento.

gcloud

Para ver la disponibilidad futura de las VMs con GPU, las VM H4D o las TPU en una región, usa el comando gcloud compute advice calendar-mode. Según los recursos que desees ver, incluye las siguientes marcas:

Para ver la disponibilidad de las VMs con GPU o las VM H4D, incluye las marcas --vm-count y --machine-type:

gcloud compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Para ver la disponibilidad de las TPU, incluye las marcas --chip-count y --tpu-version:

gcloud compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Reemplaza lo siguiente:

NUMBER_OF_VMS: La cantidad de VMs que se reservarán. El valor debe ser al menos 1 y no mayor que 80 para las VMs con GPU o 256 para las VMs H4D.
MACHINE_TYPE: Es el tipo de máquina con GPU o H4D que se reservará. Especifica uno de los siguientes valores:
- Para los tipos de máquinas A4: a4-highgpu-8g
- Para los tipos de máquinas A3 Ultra: a3-ultragpu-8g
- Para los tipos de máquinas A3 Mega: a3-megagpu-8g
- Para los tipos de máquinas A3 High con 8 GPUs: a3-highgpu-8g
- Para los tipos de máquinas H4D de HPC, consulta Tipos de máquinas H4D.
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. El valor debe ser 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: Es la versión de TPU que se reservará. Especifica uno de los siguientes valores:
- Para TPU7x: TPU7X
- Para TPU v6e: V6E
- Para TPU v5p: V5P
- Para TPU v5e: V5E
Si especificas una TPU v5e, debes incluir la marca --workload-type. Establece esta marca en el tipo de cargas de trabajo que deseas ejecutar en las TPU:
- Para las cargas de trabajo que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (AA), especifica BATCH.
- Para las cargas de trabajo que controlan solicitudes simultáneas y que requieren una latencia de red mínima, como las cargas de trabajo de inferencia de AA, especifica SERVING.
  
  Nota: Si especificas SERVING, solo puedes reservar 1, 4 u 8 chips de TPU v5e.
REGION: Es la región en la que se reservarán las VMs con GPU, las VMs H4D o las TPU. Para verificar qué regiones y zonas son compatibles, consulta Limitaciones.
FROM_START_TIME y TO_START_TIME: Las fechas más temprana y más tardía en las que deseas reservar capacidad. Formatea estas fechas como marcas de tiempo RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Reemplaza lo siguiente:
- YYYY-MM-DD: Una fecha con formato de un año de cuatro dígitos, un mes de dos dígitos y un día de dos dígitos, separados por guiones (-).
- HH:MM:SS: Una hora con formato de hora de dos dígitos con un formato de 24 horas, minutos de dos dígitos y segundos de dos dígitos, separados por dos puntos (:).
- OFFSET: la zona horaria con formato como una compensación del horario universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica -08:00. Para no usar compensación, especifica Z.
MIN_DURATION y MAX_DURATION: La cantidad mínima y máxima de tiempo para la que deseas reservar recursos. Debes darles formato a estos valores como la cantidad de días, horas, minutos o segundos, seguidos de d, h, m y s, respectivamente. Por ejemplo, especifica 24h para 24 horas o 1d2h3m4s para un día, dos horas, tres minutos y cuatro segundos.

El resultado es similar a lo siguiente:

- recommendationsPerSpec:
    spec:
      endTime: '2026-02-10T00:00:00Z'
      location: zones/us-central1-a
      otherLocations:
        zones/us-central1-b:
          details: Recommendation in this zone is possible.
          status: RECOMMENDED
        zones/us-central1-c:
          details: Temporarily no free capacity in this zone in the
          requested time window.
          status: NO_CAPACITY
        zones/us-central1-f:
          details: This machine family is not supported in this zone.
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2026-02-07T00:00:00Z'

Si los recursos solicitados están disponibles, el resultado contendrá los campos startTime, endTime y location. Estos campos especifican la hora de inicio más temprana, la hora de finalización más tardía y las zonas en las que los recursos están disponibles.

REST

Para ver la disponibilidad futura de las VMs con GPU, las VM H4D o las TPU en una región, realiza una solicitud GET al método advice.calendarMode. Según los recursos que desees ver, incluye los siguientes campos en el cuerpo de la solicitud:

Para ver la disponibilidad de las VMs con GPU o las VM H4D, incluye los campos instanceCount y machineType:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Para ver la disponibilidad de las TPU, incluye los campos acceleratorCount y vmFamily:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Reemplaza lo siguiente:

PROJECT_ID: el ID del proyecto en el que deseas reservar los recursos.
REGION: Es la región en la que deseas reservar VMs con GPU, VMs H4D o TPUs. Para verificar las regiones y zonas admitidas, consulta Limitaciones.
NUMBER_OF_VMS: Es la cantidad de VMs con GPU o H4D que se reservarán. En el caso de las VMs con GPU, el valor debe estar entre 1 y 80. En el caso de las VMs H4D, el valor debe estar entre 1 y 256.
MACHINE_TYPE: Es el tipo de máquina con GPU o H4D que se reservará. Especifica uno de los siguientes valores:
- Para los tipos de máquinas A4: a4-highgpu-8g
- Para los tipos de máquinas A3 Ultra: a3-ultragpu-8g
- Para los tipos de máquinas A3 Mega: a3-megagpu-8g
- Para los tipos de máquinas A3 High con 8 GPUs: a3-highgpu-8g
- Para los tipos de máquinas H4D de HPC, consulta Tipos de máquinas H4D.
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. El valor debe ser 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: Es la versión de TPU que se reservará. Especifica uno de los siguientes valores:
- Para TPU7x: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
- Para TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- Para TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- Para TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si especificas una TPU v5e, en el campo aggregateResources, debes incluir el campo workloadType. Configura este campo en el tipo de cargas de trabajo que deseas ejecutar en las TPU:
- Para las cargas de trabajo que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (AA), especifica BATCH.
- Para las cargas de trabajo que controlan solicitudes simultáneas y que requieren una latencia de red mínima, como las cargas de trabajo de inferencia de AA, especifica SERVING.
  
  Nota: Si especificas SERVING, solo puedes reservar 1, 4 u 8 chips de TPU v5e.
FROM_START_TIME y TO_START_TIME: Las fechas más temprana y más tardía en las que deseas reservar capacidad. Formatea estas fechas como marcas de tiempo RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Reemplaza lo siguiente:
- YYYY-MM-DD: Una fecha con formato de un año de 4 dígitos, un mes de 2 dígitos y un día de 2 dígitos, separados por guiones (-).
- HH:MM:SS: una hora con formato de hora de 2 dígitos con un formato de 24 horas, minutos de 2 dígitos y segundos de 2 dígitos separados por dos puntos (:)
- OFFSET: la zona horaria con formato como una compensación del horario universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica -08:00. Para no usar compensación, especifica Z.
MIN_DURATION y MAX_DURATION: La cantidad mínima y máxima de tiempo, en segundos, para la que deseas reservar recursos. Debes darles formato como la cantidad de segundos, seguida de s. Por ejemplo, especifica 86400s para 86,400 segundos (24 horas).

El resultado es similar a lo siguiente:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2026-02-07T00:00:00Z",
          "endTime": "2026-02-10T00:00:00Z",
          "otherLocations": {
            "zones/us-central1-b": {
              "status": "RECOMMENDED",
              "details": "Recommendation in this zone is possible."
            },
            "zones/us-central1-c": {
              "status": "NO_CAPACITY",
              "details": "Temporarily no free capacity in this zone in the
                          requested time window."
            },
            "zones/us-central1-f": {
              "status": "NOT_SUPPORTED",
              "details": "This machine family is not supported in this zone."
            }
          },
          "location": "zones/us-central1-a"
        }
      }
    }
  ]
}

Crea una solicitud para VMs de GPU, VMs de H4D o TPUs

Cuando creas una solicitud de reserva futura en el modo de calendario, solo puedes especificar un período de reserva de la siguiente manera:

Hora de inicio: Según los recursos que desees reservar, debes especificar una hora de inicio que sea al menos uno de los siguientes valores desde el momento en que creas y envías una solicitud:
- En el caso de las VMs con GPU y H4D, 87 horas (3 días y 15 horas)
- En el caso de las TPU, 6 horas
Duración: Puedes reservar recursos por un mínimo de 24 horas y un máximo de 90 días.

Para crear una solicitud con una VM de GPU o H4D existente como referencia, usa la consola deGoogle Cloud . De lo contrario, selecciona una de las siguientes opciones:

Console

En la consola de Google Cloud , ve a la página Reservas.

Ir a Reservas
Haz clic en la pestaña Reservas futuras.
Haz clic en Crear reserva futura. Aparecerá la página Crear una reserva futura y se seleccionará el panel Configuración de hardware.
En la sección Configuraciones, especifica las propiedades de las VMs con GPU, las VMs H4D o las TPU que deseas reservar de una de las siguientes maneras:
- Para especificar directamente las propiedades de la VM con GPU, la VM H4D o la TPU, completa los siguientes pasos:
  1. Selecciona Especificar tipo de máquina.
  2. Haz clic en las pestañas GPUs, TPUs o Optimizado para procesamiento y, luego, selecciona un tipo de máquina de GPU, un tipo de máquina H4D o una versión de TPU compatibles.
- Para especificar las propiedades de la GPU o la VM H4D con una VM existente como referencia, selecciona Usar VM existente y, luego, selecciona la VM.
Si especificaste una TPU v5e (CT5LP) en el paso anterior, en la lista Tipo de carga de trabajo de TPU v5, selecciona una de las siguientes opciones:
- Para ejecutar cargas de trabajo en las TPU que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de AA, selecciona Batch.
- Para ejecutar cargas de trabajo en las TPU que controlan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de AA, selecciona Serving.
  
  Nota: Si seleccionas Serving, solo podrás reservar 1, 4 u 8 chips de TPU v5e.
En la sección Buscar capacidad, completa los siguientes pasos:
1. En las listas Región y Zona, selecciona la región y la zona en las que deseas reservar los recursos.
2. En el campo Capacidad total necesaria (cuando reservas VMs con GPU o H4D) o en la lista Cantidad de chips (cuando reservas TPU), especifica la cantidad de VMs con GPU, VMs con H4D o chips de TPU que deseas reservar. Puedes especificar los siguientes valores:
  - En el caso de las VMs con GPU, un valor entre 1 y 80
  - Para las VMs H4D, un valor entre 1 y 256
  - Para los chips de TPU, un valor de 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024
3. En la lista Hora de inicio, selecciona la hora de inicio de tu solicitud.
4. Opcional: En la lista Elige la flexibilidad de la fecha de inicio, selecciona qué tan exacta debe ser la fecha de inicio.
5. En el campo Duración de la reserva, especifica durante cuánto tiempo deseas reservar los recursos.
6. Haz clic en Buscar capacidad. Luego, en la tabla Capacidad disponible, selecciona una de las opciones disponibles que contengan el tipo, la cantidad y el período de reserva de las VMs con GPU, las VMs H4D o las TPU que deseas reservar.
Haz clic en Siguiente.
En la sección Tipo de recurso compartido, selecciona los proyectos con los que deseas compartir la capacidad solicitada:
- Para usar la capacidad reservada solo dentro de tu proyecto, selecciona Local.
- Para compartir la capacidad reservada con otros proyectos, selecciona Compartido, haz clic en Agregar proyectos y, luego, sigue las indicaciones para seleccionar los proyectos.
Importante: Solo puedes especificar el tipo de uso compartido y los proyectos compartidos cuando creas una solicitud. No podrás modificar estos parámetros de configuración después de enviar la solicitud.
Haz clic en Siguiente.
En el campo Nombre de la reserva futura, ingresa un nombre para la solicitud.
En el campo Nombre de la reserva, ingresa el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
Haz clic en Crear.

gcloud

Para crear una solicitud de reserva futura en el modo de calendario y enviarla para su revisión, usa el comando gcloud compute future-reservations create. Según los recursos que desees reservar, incluye las siguientes marcas:

Para reservar VMs con GPU o H4D, incluye las marcas --total-count, --machine-type y --deployment-type=DENSE:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Para reservar TPUs, incluye las marcas --chip-count y --tpu-version:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Reemplaza lo siguiente:

FUTURE_RESERVATION_NAME: Es el nombre de la solicitud.
NUMBER_OF_VMS: Es la cantidad de VMs con GPU o H4D que se reservarán.
- En el caso de las VMs con GPU, el valor debe estar entre 1 y 80.
- En el caso de las VMs H4D, el valor debe estar entre 1 y 256.
Especifica una cantidad de VMs que sea igual o inferior a la cantidad de VMs que confirmaste como disponibles.
MACHINE_TYPE: Es el tipo de máquina con GPU o H4D que se reservará.
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. Especifica un valor igual o inferior a la cantidad de chips que confirmaste como disponibles. El valor debe ser uno de los siguientes: 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: Es la versión de TPU que se reservará. Si especificas una TPU v5e (V5E), debes incluir la marca --workload-type para especificar el tipo de cargas de trabajo que se ejecutarán en las TPU.
RESERVATION_NAME: Es el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
SHARE_TYPE: Indica si otros proyectos de tu organización pueden consumir la capacidad reservada. Especifica uno de los siguientes valores:
- Para usar la capacidad solo dentro de tu proyecto, haz lo siguiente: local
- Para compartir capacidad con otros proyectos, haz lo siguiente: projects
Si especificas projects, debes incluir la marca --share-with establecida en una lista separada por comas de los IDs de los proyectos, por ejemplo, project-1,project-2. Puedes especificar hasta 100 proyectos en tu organización. No incluyas el ID de tu proyecto en esta lista. Puedes consumir la capacidad reservada de forma predeterminada.

Importante: Solo puedes especificar el tipo de uso compartido y los proyectos compartidos cuando creas una solicitud. No podrás modificar estos parámetros de configuración después de enviar la solicitud.
START_TIME: Es la hora de inicio de la solicitud, que debes formatear como una marca de tiempo RFC 3339.
END_TIME: La hora de finalización del período de reserva, que debe tener el formato de una marca de tiempo RFC 3339. Si deseas especificar una duración, en segundos, para tu período de reserva en lugar de una hora de finalización, reemplaza la marca --end-time por la marca --duration.
ZONE: Es la zona en la que deseas reservar los recursos.

REST

Para crear una solicitud de reserva futura en el modo de calendario y enviarla para su revisión, realiza una solicitud POST al método futureReservations.insert. Según los recursos que desees reservar, incluye los siguientes campos en el cuerpo de la solicitud:

Para reservar VMs con GPU o H4D, incluye los campos totalCount y machineType, así como el campo deploymentType establecido en DENSE:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Para reservar TPUs, incluye los campos acceleratorCount y vmFamily:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Reemplaza lo siguiente:

PROJECT_ID: Es el ID del proyecto en el que deseas crear la solicitud.
ZONE: Es la zona en la que deseas reservar los recursos.
FUTURE_RESERVATION_NAME: Es el nombre de la solicitud.
RESERVATION_NAME: Es el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
SHARE_TYPE: Indica si otros proyectos de tu organización pueden consumir la capacidad reservada. Especifica uno de los siguientes valores:
- Para usar la capacidad solo dentro de tu proyecto, haz lo siguiente: LOCAL
- Para compartir capacidad con otros proyectos, haz lo siguiente: SPECIFIC_PROJECTS
Si especificas SPECIFIC_PROJECTS, en el campo shareSettings, debes incluir el campo projectMap para especificar los proyectos con los que se compartirá la capacidad. Puedes especificar hasta 100 proyectos en tu organización. No especifiques tu ID del proyecto. Puedes consumir la capacidad reservada de forma predeterminada.

Importante: Solo puedes especificar el tipo de uso compartido y los proyectos compartidos cuando creas una solicitud. No podrás modificar estos parámetros de configuración después de enviar la solicitud.

Por ejemplo, para compartir la capacidad solicitada con otros dos proyectos, incluye lo siguiente:
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
Reemplaza CONSUMER_PROJECT_ID_1 y CONSUMER_PROJECT_ID_2 por los IDs de dos proyectos que deseas permitir que consuman la capacidad solicitada.
NUMBER_OF_VMS: Es la cantidad de VMs con GPU o H4D que se reservarán.
- En el caso de las VMs con GPU, el valor debe estar entre 1 y 80.
- En el caso de las VMs H4D, el valor debe estar entre 1 y 256.
Especifica una cantidad de VMs que sea igual o inferior a la cantidad de VMs que confirmaste como disponibles.
MACHINE_TYPE: Es el tipo de máquina con GPU o H4D que se reservará.
NUMBER_OF_CHIPS: Es la cantidad de chips TPU que se reservarán. Especifica un valor igual o inferior a la cantidad de chips que confirmaste como disponibles. El valor debe ser uno de los siguientes: 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: Es la versión de TPU que se reservará. Si especificas una TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP), en el campo aggregateResources, debes incluir el campo workloadType para especificar el tipo de cargas de trabajo que se ejecutarán en las TPU.
START_TIME: Es la hora de inicio de la solicitud, que debes formatear como una marca de tiempo RFC 3339.
END_TIME: La hora de finalización del período de reserva, que debe tener el formato de una marca de tiempo RFC 3339. Si deseas especificar una duración, en segundos, para tu período de reserva en lugar de una hora de finalización, reemplaza el campo endTime por el campo duration.

¿Qué sigue?

Para las VMs con GPU o H4D, consume una reserva creada automáticamente en Compute Engine:
Consume una reserva creada de forma automática para VMs con GPU o TPU en Vertex AI:
- Usa reservas con trabajos de inferencia en línea
- Usa reservas con trabajos de entrenamiento
Cómo consumir una reserva creada automáticamente para las TPU en Cloud TPU
Cómo ver reservas o solicitudes de reserva futuras

Crea una solicitud de reserva futura en el modo de calendario Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Antes de comenzar

Console

gcloud

REST

Roles obligatorios

Permisos necesarios

Crea una solicitud de reserva futura en el modo de calendario

Consulta la disponibilidad futura de los recursos

Console

gcloud

REST

Crea una solicitud para VMs de GPU, VMs de H4D o TPUs

Console

gcloud

REST

¿Qué sigue?

Crea una solicitud de reserva futura en el modo de calendario