Crear una instancia con el modelo vinculado a la reserva

En este documento se explica cómo crear una instancia de Compute Engine independiente mediante el modelo de aprovisionamiento vinculado a reservas. Este modelo de aprovisionamiento te permite crear instancias A4X Max, A4X, A4 o A3 Ultra consumiendo capacidad reservada previamente.

Para ver otros métodos para crear instancias mediante el modelo de aprovisionamiento vinculado a reservas, consulta la descripción general de las opciones de implementación en la documentación de AI Hypercomputer.

Antes de empezar

  • Si aún no lo has hecho, configura la autenticación. La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:

      gcloud init

      Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

    2. Set a default region and zone.

    REST

    Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.

      Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:

      gcloud init

      Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

    Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre Google Cloud autenticación.

Roles obligatorios

Para obtener los permisos que necesitas para crear instancias de computación mediante el modelo de aprovisionamiento vinculado a reservas, pide a tu administrador que te conceda el rol de gestión de identidades y accesos Administrador de instancias de Compute (v. 1) (roles/compute.instanceAdmin.v1) en el proyecto. Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para crear instancias de computación mediante el modelo de aprovisionamiento vinculado a reservas. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:

Permisos obligatorios

Para crear instancias de computación mediante el modelo de aprovisionamiento vinculado a reservas, se necesitan los siguientes permisos:

  • compute.instances.create del proyecto
  • Para usar una imagen personalizada para crear la VM, sigue estos pasos: compute.images.useReadOnly en la imagen
  • Para usar una captura para crear la VM, sigue estos pasos: compute.snapshots.useReadOnly en la captura
  • Para usar una plantilla de instancia para crear la VM, haz lo siguiente: compute.instanceTemplates.useReadOnly en la plantilla de instancia
  • Para especificar una subred para tu VM, haz lo siguiente: compute.subnetworks.use en el proyecto o en la subred elegida
  • Para especificar una dirección IP estática para la máquina virtual, haz lo siguiente: compute.addresses.use en el proyecto
  • Para asignar una dirección IP externa a la VM cuando se usa una red de VPC, haz lo siguiente: compute.subnetworks.useExternalIp en el proyecto o en la subred elegida
  • Para asignar una red antigua a la VM, sigue estos pasos: compute.networks.use en el proyecto
  • Para asignar una dirección IP externa a la VM cuando se usa una red antigua, haz lo siguiente: compute.networks.useExternalIp en el proyecto
  • Para definir los metadatos de la instancia de VM: compute.instances.setMetadata en el proyecto
  • Para definir etiquetas en la VM, haz lo siguiente: compute.instances.setTags en la VM
  • Para definir etiquetas en la VM, sigue estos pasos: compute.instances.setLabels en la VM
  • Para definir una cuenta de servicio que use la VM, sigue estos pasos: compute.instances.setServiceAccount en la VM
  • Para crear un disco para la VM, sigue estos pasos: compute.disks.create en el proyecto
  • Para adjuntar un disco en modo de solo lectura o de lectura y escritura, sigue estos pasos: compute.disks.use en el disco
  • Para adjuntar un disco en modo de solo lectura: compute.disks.useReadOnly en el disco

También puedes obtener estos permisos con roles personalizados u otros roles predefinidos.

Crear una instancia que use el modelo de aprovisionamiento vinculado a la reserva

Para crear una instancia de computación A4X Max, A4X, A4 o A3 Ultra mediante el modelo de aprovisionamiento vinculado a reservas, debes esperar a que la reserva creada automáticamente que quieras usar alcance su hora de inicio. Además, la instancia que quieras crear debe cumplir todos los requisitos siguientes:

En el siguiente ejemplo, se crea una solicitud de reserva futura en modo de calendario para cinco instancias A3 Ultra y, a continuación, se crea una instancia A3 Ultra consumiendo la reserva creada automáticamente para la solicitud.

Para crear una instancia de ejemplo mediante el modelo de aprovisionamiento vinculado a la reserva, selecciona una de las siguientes opciones:

Consola

  1. Crea una solicitud de ejemplo de cinco instancias A3 Ultra y envíala para que se revise:

    1. En la Google Cloud consola, ve a la página Reservas.

      Ir a Reservas

    2. Haz clic en la pestaña Reservas futuras.

    3. Haz clic en Crear reserva futura. Aparecerá la página Crear una reserva futura.

    4. En la sección Configuración de hardware, selecciona Especificar tipo de máquina y, a continuación, especifica una instancia A3 Ultra.

    5. En la sección Método de obtención, sigue estos pasos:

      1. Selecciona Buscar capacidad durante un máximo de 90 días.

      2. En las listas Región y Zona, especifica la región y la zona en las que quieres reservar recursos. En este ejemplo, selecciona us-central1 y us-central1-a respectivamente.

      3. En el campo Capacidad total necesaria, introduce 5.

      4. En la sección Periodo de reserva, especifica el periodo de reserva.

    6. Especifica los campos restantes y haz clic en Enviar.

  2. A la hora de inicio de la solicitud, para crear una instancia A3 Ultra que consuma la reserva creada automáticamente de ejemplo, haz lo siguiente:

    1. En la Google Cloud consola, ve a la página Crear una instancia.

      Ir a Crear una instancia

    2. En el campo Name (Nombre), introduce un nombre para la instancia. En este ejemplo, escribe example-instance.

    3. Especifica la región y la zona en las que quieras reservar recursos. En este ejemplo, selecciona us-central1 y us-central1-a respectivamente.

    4. Haz clic en la pestaña GPUs (GPUs) y, a continuación, en la lista GPU type (Tipo de GPU), selecciona NVIDIA H200 141GB (NVIDIA H200 de 141 GB). Esta acción especifica una instancia A3 Ultra y define el modelo de aprovisionamiento como vinculado a reserva.

    5. En el menú de navegación, haga clic en Opciones avanzadas.

    6. En la sección Reservas, selecciona Elegir una reserva y, a continuación, haz clic en Elegir una reserva.

    7. En el panel Elige una reserva, haz lo siguiente:

      1. Selecciona una reserva específica. Si quieres usar una reserva compartida que esté en otro proyecto, selecciona el proyecto en el que se encuentre la reserva en la lista Proyecto.

      2. Haz clic en Elegir.

    8. En la sección Modelo de aprovisionamiento, despliega la sección Configuración avanzada del modelo de aprovisionamiento de VMs.

    9. En la lista Al finalizar la VM, selecciona Detener (opción predeterminada) o Eliminar.

    10. Haz clic en Crear.

gcloud

  1. Para crear una solicitud de ejemplo de cinco instancias A3 Ultra y enviarla para que se revise, usa el comando gcloud beta compute future-reservations create:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Supongamos que Google Cloud aprueba la solicitud y que Compute Engine crea automáticamente una reserva vacía. En el momento de inicio de la solicitud, el 5 de octubre del 2025, Compute Engine aumenta el número de instancias de GPU reservadas en la reserva. Después, puedes consumir la reserva.

  2. A la hora de inicio de la solicitud, para crear una instancia A3 Ultra que consuma la reserva creada automáticamente de ejemplo, usa el comando gcloud compute instances create con las siguientes marcas:

    • La marca --instance-termination-action.

    • La marca --provisioning-model se ha definido como RESERVATION_BOUND.

    • La marca --reservation.

    • La marca --reservation-affinity se ha definido como specific.

    El comando es similar al siguiente. Para consultar todos los requisitos para crear una instancia de A3 Ultra, consulte Crear una instancia de A3 Ultra o A4.

    gcloud compute instance create example-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    El comando incluye los siguientes valores:

    • TERMINATION_ACTION: indica si Compute Engine detiene (STOP) o elimina (DELETE) la instancia al final del periodo de reserva.

    • RESERVATION_URL: la URL de la reserva, que tiene el siguiente formato:

      • Si la reserva creada automáticamente existe en tu proyecto, haz lo siguiente: example-reservation.

      • Si la reserva creada automáticamente está en otro proyecto: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Para crear una solicitud de ejemplo de cinco instancias A3 Ultra y enviarla a revisión, haz una solicitud POST al método beta futureReservations.insert:

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Supongamos que Google Cloud aprueba la solicitud y que Compute Engine crea automáticamente una reserva vacía. En el momento de inicio de la solicitud, el 5 de octubre del 2025, Compute Engine aumenta el número de instancias de GPU reservadas en la reserva. Después, puedes consumir la reserva.

  2. A la hora de inicio de la solicitud, para crear una instancia A3 Ultra que consuma la reserva creada automáticamente de ejemplo, haz una solicitud POST al método instances.insert. En el cuerpo de la solicitud, incluye los siguientes campos:

    • El campo reservationAffinity.consumeReservationType tiene el valor SPECIFIC_RESERVATION.

    • El campo reservationAffinity.key tiene el valor compute.googleapis.com/reservation-name.

    • El campo reservationAffinity.values se ha definido en la URL de la reserva.

    • El campo scheduling.instanceTerminationAction.

    • El campo scheduling.provisioningModel se ha definido como RESERVATION_BOUND.

    La solicitud es similar a la siguiente. Para consultar todos los requisitos para crear una instancia de A3 Ultra, consulte Crear una instancia de A3 Ultra o A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    El cuerpo de la solicitud incluye los siguientes valores:

    • RESERVATION_URL: la URL de la reserva, que tiene el siguiente formato:

      • Si la reserva creada automáticamente existe en tu proyecto, haz lo siguiente: example-reservation.

      • Si la reserva creada automáticamente está en otro proyecto: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: indica si Compute Engine detiene (STOP) o elimina (DELETE) la instancia al final del periodo de reserva.

Siguientes pasos

Pruébalo

Si es la primera vez que utilizas Google Cloud, crea una cuenta para evaluar el rendimiento de en situaciones reales. Los nuevos clientes también reciben 300 USD en crédito sin coste económico para ejecutar, probar y desplegar cargas de trabajo.

Probar Compute Engine sin coste económico