Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Crear una solicitud de reserva futura en el modo Calendario

En este documento se explica cómo crear una solicitud de reserva futura en modo calendario para reservar recursos de GPU, H4D o TPU para tus instancias de máquina virtual. Usa estas solicitudes para obtener recursos de alta demanda para crear VMs que tengas previsto ejecutar durante un máximo de 90 días.

Puedes usar solicitudes de reserva futuras en el modo de calendario para reservar recursos y ejecutar las siguientes cargas de trabajo:

Tareas de pre-entrenamiento de modelos
Tareas de ajuste fino de modelos
Cargas de trabajo de simulación de computación de alto rendimiento (HPC)
Aumentos a corto plazo de las cargas de trabajo de inferencia

Una vez que Google Cloud apruebe tu solicitud, los recursos reservados estarán disponibles para que crees máquinas virtuales con GPU, H4D o TPU en la fecha y hora de entrega especificadas. Durante el periodo de tu reserva, solo tu proyecto y los proyectos que especifiques al crear la solicitud tendrán acceso a los recursos reservados. Puedes compartir los recursos reservados con hasta 100 proyectos que pertenezcan a la misma organización que tu proyecto. Para obtener más información sobre los requisitos y las limitaciones que se aplican al crear una solicitud en el modo Calendario, consulta el artículo sobre las solicitudes de reserva futuras en el modo Calendario.

Antes de empezar

Si no puedes usar las solicitudes de reserva futuras en el modo Calendario, es posible que no cumplas los requisitos para acceder a esta función y usarla. En ese caso, ponte en contacto con el equipo de tu cuenta o con el equipo de Ventas.
Para compartir tu capacidad reservada con otros proyectos de tu organización, comprueba que el proyecto en el que quieras crear futuras solicitudes de reserva en modo Calendario pueda crear reservas compartidas. De lo contrario, se producirán errores.
Si aún no lo has hecho, configura la autenticación. La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
  gcloud init
  Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
  
  Nota: Si ya has instalado la CLI de gcloud, asegúrate de que tienes la versión más reciente ejecutando gcloud components update.
2. Set a default region and zone.
REST

Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.
Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre Google Cloud autenticación.

Roles obligatorios

Para obtener los permisos que necesitas para crear una solicitud de reserva futura en el modo de calendario, pide a tu administrador que te conceda el rol de gestión de identidades y accesos Usuario de reserva futura de Compute (roles/compute.futureReservationUser) en el proyecto. Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para crear una solicitud de reserva futura en el modo Calendario. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:

Permisos obligatorios

Para crear una solicitud de reserva futura en el modo Calendario, se necesitan los siguientes permisos:

Para crear una solicitud de reserva futura, sigue estos pasos: compute.futureReservations.create en el proyecto
Para permitir que Compute Engine cree reservas automáticamente, haz lo siguiente: compute.reservations.create en el proyecto
Para ver la disponibilidad de los recursos en una fecha futura, sigue estos pasos: compute.advice.calendarMode en el proyecto

También puedes obtener estos permisos con roles personalizados u otros roles predefinidos.

Crear una solicitud de reserva futura en el modo calendario

Para crear una solicitud de reserva futura en el modo Calendario, sigue estos pasos:

Consulta la disponibilidad futura de un recurso. Consulta la disponibilidad futura de las VMs con GPU, las VMs H4D o las TPUs que quieras reservar. Después, cuando crees una solicitud, especifica el número, el tipo y la duración de la reserva de los recursos que hayas confirmado que están disponibles. Google Cloud es más probable que apruebe tu solicitud si proporcionas esta información.

Nota: Si creas una solicitud mediante la consola Google Cloud , sáltate este paso. Puedes consultar la disponibilidad futura de las máquinas virtuales con GPU, las máquinas virtuales H4D o las TPU mientras creas la solicitud.

Para obtener instrucciones, consulta Ver la disponibilidad futura de un recurso.
Crear una solicitud de reserva. Crea y envía una solicitud de reserva futura en modo calendario para máquinas virtuales con GPU, máquinas virtuales H4D o TPUs. Si puedes crear una solicitud correctamente, Google Cloud la aprobará en un minuto.

Para obtener instrucciones, consulta el artículo Crear una solicitud de máquinas virtuales con GPU, máquinas virtuales H4D o TPUs.

Ver la disponibilidad futura de un recurso

Para ver la disponibilidad futura de las VMs con GPU, las VMs H4D o las TPUs en una región, sigue estos pasos:

En el caso de las máquinas virtuales con GPU o H4D, hasta 60 días antes
En el caso de las TPUs, hasta 120 días antes

Para ver la disponibilidad futura de las VMs con GPU, las VMs H4D o las TPUs en una región, selecciona una de las siguientes opciones:

Consola

Puedes ver la disponibilidad futura de las VMs con GPU, las VMs H4D o las TPUs en una región cuando creas una solicitud de reserva futura en el modo de calendario. Para obtener más información, consulta el artículo Crear una solicitud de VMs con GPU, VMs H4D o TPUs de este documento.

gcloud

Para ver la disponibilidad futura de las máquinas virtuales con GPU, las máquinas virtuales H4D o las TPU en una región, usa el comando gcloud compute advice calendar-mode. En función de los recursos que quieras ver, incluye las siguientes marcas:

Para ver la disponibilidad de las VMs con GPU o las VMs H4D, incluye las marcas --vm-count y --machine-type:

gcloud compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Para ver la disponibilidad de las TPU, incluye las marcas --chip-count y --tpu-version:

gcloud compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Haz los cambios siguientes:

NUMBER_OF_VMS: número de máquinas virtuales que se van a reservar. El valor debe ser al menos 1 y no superior a 80 para las VMs con GPU o 256 para las VMs H4D.
MACHINE_TYPE: el tipo de máquina con GPU o H4D que se va a reservar. Se debe utilizar uno de los valores indicados a continuación.
- En el caso de los tipos de máquinas A4: a4-highgpu-8g
- En el caso de los tipos de máquinas A3 Ultra: a3-ultragpu-8g
- En el caso de los tipos de máquinas A3 Mega: a3-megagpu-8g
- En los tipos de máquinas A3 High con 8 GPUs: a3-highgpu-8g
- En el caso de los tipos de máquinas H4D para HPC, consulta Tipos de máquinas H4D.
NUMBER_OF_CHIPS: número de chips de TPU que se van a reservar. El valor debe ser 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: la versión de TPU que se va a reservar. Especifica uno de los siguientes valores:
- Para TPU v7: TPU7X
- En el caso de las TPU v6e: V6E
- En el caso de la TPU v5p: V5P
- En el caso de las TPU v5e: V5E
Si especificas una TPU v5e, debes incluir la --workload-typemarca. Define esta marca en el tipo de cargas de trabajo que quieras ejecutar en las TPUs:
- Para las cargas de trabajo que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático, especifica BATCH.
- En el caso de las cargas de trabajo que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, especifica SERVING.
  
  Nota: Si especificas SERVING, solo puedes reservar 1, 4 u 8 chips de TPU v5e.
REGION: la región en la que reservar las VMs con GPU, las VMs H4D o las TPUs. Para consultar qué regiones y zonas se admiten, consulta Limitaciones.
FROM_START_TIME y TO_START_TIME: las fechas más antiguas y más recientes en las que quieres reservar capacidad. Da a estas fechas el formato de marca de tiempo RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Haz los cambios siguientes:
- YYYY-MM-DD: una fecha con el formato de año de cuatro dígitos, mes de dos dígitos y día de dos dígitos, separados por guiones (-).
- HH:MM:SS: hora con el formato de hora de dos dígitos en formato de 24 horas, minutos de dos dígitos y segundos de dos dígitos, separados por dos puntos (:).
- OFFSET: la zona horaria con el formato de una diferencia con respecto al tiempo universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica -08:00. Para no usar ninguna variación, especifica Z.
MIN_DURATION y MAX_DURATION: la cantidad mínima y máxima de tiempo que quieres reservar recursos. Debes dar formato a estos valores como el número de días, horas, minutos o segundos seguido de d, h, m y s, respectivamente. Por ejemplo, especifica 24h para 24 horas o 1d2h3m4s para un día, dos horas, tres minutos y cuatro segundos.

El resultado debería ser similar al siguiente:

- recommendationsPerSpec:
    spec:
      endTime: '2026-02-10T00:00:00Z'
      location: zones/us-central1-a
      otherLocations:
        zones/us-central1-b:
          details: Recommendation in this zone is possible.
          status: RECOMMENDED
        zones/us-central1-c:
          details: Temporarily no free capacity in this zone in the
          requested time window.
          status: NO_CAPACITY
        zones/us-central1-f:
          details: This machine family is not supported in this zone.
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2026-02-07T00:00:00Z'

Si los recursos solicitados están disponibles, la respuesta contiene los campos startTime, endTime y location. En estos campos se especifican la hora de inicio más temprana, la hora de finalización más tardía y las zonas en las que los recursos están disponibles.

REST

Para ver la disponibilidad futura de las máquinas virtuales con GPU, las máquinas virtuales H4D o las TPUs en una región, envía una GET solicitud al método advice.calendarMode. En función de los recursos que quieras ver, incluye los siguientes campos en el cuerpo de la solicitud:

Para ver la disponibilidad de las VMs con GPU o las VMs H4D, incluye los campos instanceCount y machineType:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Para ver la disponibilidad de las TPU, incluye los campos acceleratorCount y vmFamily:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Haz los cambios siguientes:

PROJECT_ID: el ID del proyecto en el que quieres reservar recursos.
REGION: la región en la que quieres reservar VMs con GPU, VMs H4D o TPUs. Para consultar las regiones y zonas admitidas, consulta la sección Limitaciones.
NUMBER_OF_VMS: número de máquinas virtuales con GPU o H4D que se van a reservar. En el caso de las VMs con GPU, el valor debe estar entre 1 y 80. En las máquinas virtuales H4D, el valor debe estar entre 1 y 256.
MACHINE_TYPE: el tipo de máquina con GPU o H4D que se va a reservar. Se debe utilizar uno de los valores indicados a continuación.
- En el caso de los tipos de máquinas A4: a4-highgpu-8g
- En el caso de los tipos de máquinas A3 Ultra: a3-ultragpu-8g
- En el caso de los tipos de máquinas A3 Mega: a3-megagpu-8g
- En los tipos de máquinas A3 High con 8 GPUs: a3-highgpu-8g
- En el caso de los tipos de máquinas H4D para HPC, consulta Tipos de máquinas H4D.
NUMBER_OF_CHIPS: número de chips de TPU que se van a reservar. El valor debe ser 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: la versión de TPU que se va a reservar. Especifica uno de los siguientes valores:
- Para TPU v7: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
- En el caso de las TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- En el caso de la TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- En el caso de las TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si especificas una TPU v5e, en el campo aggregateResources debes incluir el campo workloadType. Define este campo con el tipo de cargas de trabajo que quieras ejecutar en las TPUs:
- Para las cargas de trabajo que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático, especifica BATCH.
- En el caso de las cargas de trabajo que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, especifica SERVING.
  
  Nota: Si especificas SERVING, solo puedes reservar 1, 4 u 8 chips de TPU v5e.
FROM_START_TIME y TO_START_TIME: las fechas más antiguas y más recientes en las que quieres reservar capacidad. Da a estas fechas el formato de marca de tiempo RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Haz los cambios siguientes:
- YYYY-MM-DD: fecha con el formato de año de 4 dígitos, mes de 2 dígitos y día de 2 dígitos, separados por guiones (-).
- HH:MM:SS: hora con formato de hora de 24 horas con dos dígitos, minutos con dos dígitos y segundos con dos dígitos, separados por dos puntos (:).
- OFFSET: la zona horaria con el formato de una diferencia con respecto al tiempo universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica -08:00. Para no usar ninguna variación, especifica Z.
MIN_DURATION y MAX_DURATION: la cantidad mínima y máxima de tiempo, en segundos, que quieres reservar recursos. Debes dar formato a estos valores como el número de segundos, seguido de s. Por ejemplo, especifica 86400s para 86.400 segundos (24 horas).

El resultado debería ser similar al siguiente:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2026-02-07T00:00:00Z",
          "endTime": "2026-02-10T00:00:00Z",
          "otherLocations": {
            "zones/us-central1-b": {
              "status": "RECOMMENDED",
              "details": "Recommendation in this zone is possible."
            },
            "zones/us-central1-c": {
              "status": "NO_CAPACITY",
              "details": "Temporarily no free capacity in this zone in the
                          requested time window."
            },
            "zones/us-central1-f": {
              "status": "NOT_SUPPORTED",
              "details": "This machine family is not supported in this zone."
            }
          },
          "location": "zones/us-central1-a"
        }
      }
    }
  ]
}

Si los recursos solicitados están disponibles, la respuesta contendrá los campos startTime, endTime y location. En estos campos se especifican la hora de inicio más temprana, la hora de finalización más tardía y las zonas en las que los recursos están disponibles.

Crear una solicitud de máquinas virtuales con GPU, máquinas virtuales H4D o TPUs

Cuando creas una solicitud de reserva futura en el modo de calendario, solo puedes especificar un periodo de reserva de la siguiente manera:

Hora de inicio: en función de los recursos que quiera reservar, debe especificar una hora de inicio que sea al menos uno de los siguientes valores a partir del momento en que cree y envíe una solicitud:
- En el caso de las VMs con GPU y H4D, 87 horas (3 días y 15 horas)
- En el caso de las TPUs, 6 horas
Duración: puedes reservar recursos durante un mínimo de 24 horas y un máximo de 90 días.

Para crear una solicitud usando como referencia una VM con GPU o H4D, utiliza laGoogle Cloud consola. De lo contrario, selecciona una de las siguientes opciones:

Consola

En la Google Cloud consola, ve a la página Reservas.

Ir a Reservas
Haz clic en la pestaña Reservas futuras.
Haz clic en Crear reserva futura. Aparecerá la página Crear una reserva futura y se seleccionará el panel Configuración de hardware.
En la sección Configuraciones, especifica las propiedades de las VMs con GPU, las VMs H4D o las TPUs que quieras reservar. Para ello, haz una de las siguientes acciones:
- Para especificar directamente las propiedades de la VM con GPU, la VM H4D o la TPU, sigue estos pasos:
  1. Selecciona Especificar tipo de máquina.
  2. Haz clic en la pestaña GPUs, TPUs o Optimizado para computación y, a continuación, selecciona un tipo de máquina con GPU compatible, un tipo de máquina H4D o una versión de TPU.
- Para especificar las propiedades de la GPU o de la VM H4D usando una VM como referencia, selecciona Usar una VM y, a continuación, selecciona la VM.
Si has especificado una TPU v5e (CT5LP) en el paso anterior, en la lista Tipo de carga de trabajo de TPU v5, selecciona una de las siguientes opciones:
- Para ejecutar cargas de trabajo en las TPUs que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático, selecciona Lote.
- Para ejecutar cargas de trabajo en las TPUs que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, selecciona Servicio.
  
  Nota: Si seleccionas Servicio, solo podrás reservar 1, 4 u 8 chips de TPU v5e.
En la sección Buscar capacidad, sigue estos pasos:
1. En las listas Región y Zona, selecciona la región y la zona en las que quieras reservar recursos.
2. En el campo Capacidad total necesaria (al reservar VMs con GPU o H4D) o en la lista Número de chips (al reservar TPUs), especifica el número de VMs con GPU, VMs H4D o chips de TPU que quieras reservar. Puede especificar los siguientes valores:
  - En el caso de las máquinas virtuales con GPU, un valor entre 1 y 80
  - En el caso de las máquinas virtuales H4D, un valor entre 1 y 256
  - En el caso de los chips de TPU, el valor debe ser 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
3. En la lista Hora de inicio, selecciona la hora de inicio de tu solicitud.
4. Opcional: En la lista Elige la flexibilidad de la fecha de inicio, selecciona el grado de exactitud que debe tener la fecha de inicio.
5. En el campo Duración de la reserva, especifica durante cuánto tiempo quieres reservar los recursos.
6. Haz clic en Buscar capacidad. A continuación, en la tabla Capacidad disponible, selecciona una de las opciones disponibles que contenga el tipo, el número y el periodo de reserva de las VMs con GPU, las VMs H4D o las TPUs que quieras reservar.
Haz clic en Siguiente.
En la sección Tipo de uso compartido, selecciona los proyectos con los que quieras compartir la capacidad solicitada:
- Para usar la capacidad reservada solo en tu proyecto, selecciona Local.
- Para compartir la capacidad reservada con otros proyectos, selecciona Compartido, haz clic en y, a continuación, en Añadir proyectos. Sigue las indicaciones para seleccionar los proyectos.
Importante: Solo puedes especificar el tipo de uso compartido y los proyectos compartidos cuando creas una solicitud. No podrás modificar estos ajustes después de enviar la solicitud.
Haz clic en Siguiente.
En el campo Nombre de la reserva futura, introduce un nombre para la solicitud.
En el campo Nombre de la reserva, introduce el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
Haz clic en Crear.

gcloud

Para crear una solicitud de reserva futura en el modo Calendario y enviarla para que se revise, usa el comando gcloud compute future-reservations create. En función de los recursos que quieras reservar, incluye las siguientes marcas:

Para reservar máquinas virtuales con GPU o H4D, incluye las marcas --total-count, --machine-type y --deployment-type=DENSE:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Para reservar TPUs, incluye las marcas --chip-count y --tpu-version:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Haz los cambios siguientes:

FUTURE_RESERVATION_NAME: el nombre de la solicitud.
NUMBER_OF_VMS: número de máquinas virtuales con GPU o H4D que se van a reservar:
- En el caso de las VMs con GPU, el valor debe estar entre 1 y 80.
- En las máquinas virtuales H4D, el valor debe estar entre 1 y 256.
Especifica un número de VMs que sea igual o inferior al número de VMs que has confirmado que están disponibles.
MACHINE_TYPE: el tipo de máquina con GPU o H4D que se va a reservar.
NUMBER_OF_CHIPS: número de chips de TPU que se van a reservar. Especifica un valor igual o inferior al número de chips que hayas confirmado como disponibles. El valor debe ser uno de los siguientes: 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: la versión de TPU que se va a reservar. Si especificas una TPU v5e (V5E), debes incluir la marca --workload-type para especificar el tipo de cargas de trabajo que se ejecutarán en las TPUs.
RESERVATION_NAME: el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
SHARE_TYPE: si otros proyectos de tu organización pueden consumir la capacidad reservada. Especifica uno de los siguientes valores:
- Para usar la capacidad solo en tu proyecto, haz lo siguiente: local
- Para compartir capacidad con otros proyectos, sigue estos pasos: projects
Si especifica projects, debe incluir la marca --share-with con una lista de IDs de proyecto separados por comas (por ejemplo, project-1,project-2). Puedes especificar hasta 100 proyectos en tu organización. No incluyas el ID de tu proyecto en esta lista. Puedes consumir la capacidad reservada de forma predeterminada.

Importante: Solo puedes especificar el tipo de uso compartido y los proyectos compartidos cuando creas una solicitud. No podrás modificar estos ajustes después de enviar la solicitud.
START_TIME: hora de inicio de la solicitud, que debe tener el formato de marca de tiempo RFC 3339.
END_TIME: la hora de finalización del periodo de reserva, que debe tener el formato de marca de tiempo RFC 3339. Si quieres especificar una duración en segundos para el periodo de reserva en lugar de una hora de finalización, sustituye la marca --end-time por la marca --duration.
ZONE: la zona en la que quieres reservar recursos.

REST

Para crear una solicitud de reserva futura en el modo de calendario y enviarla para que se revise, haz una solicitud al método futureReservations.insert.POST En función de los recursos que quieras reservar, incluye los siguientes campos en el cuerpo de la solicitud:

Para reservar máquinas virtuales con GPU o H4D, incluye los campos totalCount y machineType, así como el campo deploymentType con el valor DENSE:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Para reservar TPUs, incluye los campos acceleratorCount y vmFamily:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Haz los cambios siguientes:

PROJECT_ID: el ID del proyecto en el que quieres crear la solicitud.
ZONE: la zona en la que quieres reservar recursos.
FUTURE_RESERVATION_NAME: el nombre de la solicitud.
RESERVATION_NAME: el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
SHARE_TYPE: si otros proyectos de tu organización pueden consumir la capacidad reservada. Especifica uno de los siguientes valores:
- Para usar la capacidad solo en tu proyecto, haz lo siguiente: LOCAL
- Para compartir capacidad con otros proyectos, sigue estos pasos: SPECIFIC_PROJECTS
Si especifica SPECIFIC_PROJECTS, en el campo shareSettings, debe incluir el campo projectMap para especificar los proyectos con los que quiere compartir la capacidad. Puedes especificar hasta 100 proyectos de tu organización. No especifiques el ID del proyecto. Puedes consumir la capacidad reservada de forma predeterminada.

Importante: Solo puedes especificar el tipo de uso compartido y los proyectos compartidos cuando creas una solicitud. No podrás modificar estos ajustes después de enviar la solicitud.

Por ejemplo, para compartir la capacidad solicitada con otros dos proyectos, incluya lo siguiente:
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
Sustituye CONSUMER_PROJECT_ID_1 y CONSUMER_PROJECT_ID_2 por los IDs de dos proyectos a los que quieras permitir que consuman la capacidad solicitada.
NUMBER_OF_VMS: número de máquinas virtuales con GPU o H4D que se van a reservar:
- En el caso de las VMs con GPU, el valor debe estar entre 1 y 80.
- En las máquinas virtuales H4D, el valor debe estar entre 1 y 256.
Especifica un número de VMs que sea igual o inferior al número de VMs que has confirmado que están disponibles.
MACHINE_TYPE: el tipo de máquina con GPU o H4D que se va a reservar.
NUMBER_OF_CHIPS: número de chips de TPU que se van a reservar. Especifica un valor igual o inferior al número de chips que hayas confirmado como disponibles. El valor debe ser uno de los siguientes: 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: la versión de TPU que se va a reservar. Si especificas una TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP), en el campo aggregateResources debes incluir el campo workloadType para especificar el tipo de cargas de trabajo que se ejecutarán en las TPUs.
START_TIME: hora de inicio de la solicitud, que debe tener el formato de marca de tiempo RFC 3339.
END_TIME: la hora de finalización del periodo de reserva, que debe tener el formato de marca de tiempo RFC 3339. Si quieres especificar una duración en segundos para el periodo de reserva en lugar de una hora de finalización, sustituye el campo endTime por el campo duration.

Siguientes pasos

En el caso de las VMs con GPU o H4D, consume una reserva creada automáticamente en Compute Engine:
Usar una reserva creada automáticamente para VMs con GPU o TPUs en Vertex AI:
- Usar reservas con trabajos de inferencia online
- Usar reservas con tareas de entrenamiento
Consumir una reserva creada automáticamente para TPUs en TPU de Cloud
Ver reservas o solicitudes de reserva futuras

Crear una solicitud de reserva futura en el modo Calendario Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Antes de empezar

Console

gcloud

REST

Roles obligatorios

Permisos obligatorios

Crear una solicitud de reserva futura en el modo calendario

Ver la disponibilidad futura de un recurso

Consola

gcloud

REST

Crear una solicitud de máquinas virtuales con GPU, máquinas virtuales H4D o TPUs

Consola

gcloud

REST

Siguientes pasos

Crear una solicitud de reserva futura en el modo Calendario