En este documento, se explica cómo crear una instancia independiente de Compute Engine con el modelo de aprovisionamiento vinculado a la reserva. Este modelo de aprovisionamiento te permite crear instancias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High con 8 GPUs, A3 Edge o H4D mediante el consumo de capacidad reservada previamente.
Para conocer otros métodos para crear instancias de procesamiento con el modelo de aprovisionamiento vinculado a la reserva, consulta Descripción general de las opciones de implementación en la documentación de AI Hypercomputer.
Antes de comenzar
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los Google Cloud servicios y las APIs. Para ejecutar
código o muestras desde un entorno de desarrollo local, puedes autenticarte en
Compute Engine seleccionando una de las siguientes opciones:
Selecciona la pestaña según cómo planeas usar las muestras en esta página:
Console
Cuando usas la Google Cloud consola para acceder a los Google Cloud servicios y las APIs, no necesitas configurar la autenticación.
gcloud
-
Instala la Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
gcloud initSi usas un proveedor de identidad (IdP) externo, primero debes acceder a gcloud CLI con tu identidad federada.
-
- Configura una región y una zona predeterminadas.
REST
Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.
Instala la Google Cloud CLI.
Si usas un proveedor de identidad (IdP) externo, primero debes acceder a gcloud CLI con tu identidad federada.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de. Google Cloud
Roles obligatorios
Para obtener los permisos que
necesitas para crear instancias de procesamiento con el modelo de aprovisionamiento vinculado a la reserva,
pídele al administrador que te otorgue el
rol de IAM Administrador de instancias de Compute (v1) (roles/compute.instanceAdmin.v1) en el proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene los permisos necesarios para crear instancias de procesamiento con el modelo de aprovisionamiento vinculado a la reserva. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para crear instancias de procesamiento con el modelo de aprovisionamiento vinculado a la reserva:
-
compute.instances.createen el proyecto -
Si deseas usar una imagen personalizada para crear la VM, sigue estos pasos:
compute.images.useReadOnlyen la imagen -
Para usar una instantánea a fin de crear la VM, haz lo siguiente:
compute.snapshots.useReadOnlyen la instantánea -
Si quieres usar una plantilla de instancias para crear la VM, sigue estos pasos:
compute.instanceTemplates.useReadOnlyen la plantilla de instancias -
A fin de especificar una subred para tu VM:
compute.subnetworks.useen el proyecto o en la subred elegida -
Si deseas especificar una dirección IP estática para la VM:
compute.addresses.useen el proyecto -
Para asignar una dirección IP externa a la VM cuando se usa una red de VPC:
compute.subnetworks.useExternalIpen el proyecto o en la subred elegida. -
Para asignar una red heredada a la VM:
compute.networks.useen el proyecto. -
Para asignar una dirección IP externa a la VM cuando se usa una red heredada:
compute.networks.useExternalIpen el proyecto -
Para configurar los metadatos de la instancia de VM para la VM:
compute.instances.setMetadataen el proyecto. -
Para configurar etiquetas en la VM, haz lo siguiente:
compute.instances.setTagsen la VM -
Para configurar etiquetas en la VM, haz lo siguiente:
compute.instances.setLabelsen la VM -
A fin de configurar una cuenta de servicio para que la VM use:
compute.instances.setServiceAccounten la VM -
Crear un disco nuevo para la VM:
compute.disks.createen el proyecto -
Para conectar un disco existente en modo de solo lectura o de lectura y escritura, usa
compute.disks.useen el disco. -
Para conectar un disco existente en modo de solo lectura, haz lo siguiente:
compute.disks.useReadOnlyen el disco
También puedes obtener estos permisos con roles personalizados o otros roles predefinidos.
Crea una instancia que use el modelo de aprovisionamiento vinculado a la reserva
Para crear una instancia A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High con 8 GPUs o H4D con el modelo de aprovisionamiento vinculado a la reserva, debes esperar hasta que la reserva creada de forma automática que deseas usar alcance su hora de inicio. Además, la instancia de procesamiento que deseas crear debe cumplir con todos los siguientes requisitos:
La instancia de procesamiento y la reserva deben tener propiedades coincidentes.
La instancia de procesamiento debe orientarse específicamente a la reserva para consumirla.
La instancia de procesamiento debe detenerse o borrarse a la hora de finalización de la reserva.
En el siguiente ejemplo, se crea una solicitud de reserva futura en el modo de calendario para cinco instancias A3 Ultra y, luego, se crea una instancia A3 Ultra mediante el consumo de la reserva creada de forma automática para la solicitud.
Para crear una instancia de procesamiento de ejemplo con el modelo de aprovisionamiento vinculado a la reserva, selecciona una de las siguientes opciones:
Console
Crea una solicitud de ejemplo para cinco instancias A3 Ultra y envíala para su revisión:
En la Google Cloud consola de, ve a la página Reservas.
Haz clic en la pestaña Reservas futuras.
Haz clic en Crear reserva futura. Aparecerá la página Crear una reserva futura.
Haz clic en la pestaña GPUs y, luego, en la lista Tipo de GPU, selecciona NVIDIA H200 141GB. Esta acción especifica una instancia A3 Ultra.
En el campo Capacidad total necesaria, ingresa
5.En la sección Período de reserva, especifica la hora de inicio y la duración del período de reserva.
Haz clic en Buscar capacidad y, luego, en la sección Capacidad disponible, selecciona una de las máquinas disponibles.
Haz clic en Crear.
A la hora de inicio de la solicitud, para crear una instancia A3 Ultra que consuma la reserva creada de forma automática de ejemplo, haz lo siguiente:
En la Google Cloud consola, ve a la página Crear una instancia.
En el campo Nombre, ingresa un nombre para la instancia de procesamiento. Para este ejemplo, ingresa
example-instance.Especifica la región y la zona en las que existe la reserva creada de forma automática. Para este ejemplo, selecciona us-central1 y us-central1-b , respectivamente.
Haz clic en la pestaña GPUs y, luego, en la lista Tipo de GPU, selecciona NVIDIA H200 141GB. Esta acción especifica una instancia A3 Ultra y establece el modelo de aprovisionamiento en Vinculado a la reserva.
En el menú de navegación, haz clic en Opciones avanzadas.
En la sección Reservas, selecciona Elegir una reserva, y, luego, haz clic en Elegir una reserva.
En el panel Elegir una reserva, haz lo siguiente:
Selecciona la reserva creada de forma automática de ejemplo.
Haz clic en Elegir.
En la sección Modelo de aprovisionamiento, expande la sección Configuración avanzada del modelo de aprovisionamiento de VM.
En la lista Finalización de VM, selecciona Detener (predeterminado) o Borrar.
Haz clic en Crear.
gcloud
Para crear una solicitud de ejemplo para cinco instancias A3 Ultra y enviarla para su revisión, usa el
gcloud beta compute future-reservations createcomando:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bSupongamos que Google Cloud aprueba la solicitud y Compute Engine crea automáticamente una reserva vacía. A la hora de inicio de la solicitud, el 5 de marzo de 2026, Compute Engine aumenta la cantidad de instancias de GPU reservadas en la reserva. Luego, puedes consumir la reserva.
A la hora de inicio de la solicitud, para crear una instancia A3 Ultra que consuma la reserva creada de forma automática de ejemplo, usa el
gcloud compute instances createcomando con las siguientes marcas:La marca
--instance-termination-actionLa marca
--provisioning-modelconfigurada comoRESERVATION_BOUNDLa marca
--reservationLa marca
--reservation-affinityconfigurada comospecific
El comando es similar al siguiente. Para conocer los requisitos completos para crear una instancia A3 Ultra, consulta en su lugar Crea una instancia A3 Ultra o A4.
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...El comando incluye los siguientes valores:
TERMINATION_ACTION: Indica si Compute Engine detiene (STOP) o borra (DELETE) la instancia de procesamiento al final del período de reserva.RESERVATION_URL: Es la URL de la reserva, que tiene el siguiente formato:Si la reserva creada de forma automática existe en tu proyecto:
example-reservation.Si la reserva creada de forma automática existe en un proyecto diferente:
projects/PROJECT_ID/reservations/example-reservation.
REST
Para crear una solicitud de ejemplo para cinco instancias A3 Ultra y enviarla para su revisión, realiza una
POSTsolicitud al métodofutureReservations.insertbeta:POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }Supongamos que Google Cloud aprueba la solicitud y Compute Engine crea automáticamente una reserva vacía. A la hora de inicio de la solicitud, el 5 de marzo de 2026, Compute Engine aumenta la cantidad de instancias de GPU reservadas en la reserva. Luego, puedes consumir la reserva.
A la hora de inicio de la solicitud, para crear una instancia A3 Ultra que consuma la reserva creada de forma automática de ejemplo, realiza una solicitud
POSTalinstances.insertmétodo. En el cuerpo de la solicitud, incluye los siguientes campos:El campo
reservationAffinity.consumeReservationTypeconfigurado comoSPECIFIC_RESERVATIONEl campo
reservationAffinity.keyconfigurado comocompute.googleapis.com/reservation-nameEl campo
reservationAffinity.valuesconfigurado como la URL de la reservaEl campo
scheduling.instanceTerminationActionEl campo
scheduling.provisioningModelconfigurado comoRESERVATION_BOUND
La solicitud es similar a la siguiente. Para conocer los requisitos completos para crear una instancia A3 Ultra, consulta en su lugar Crea una instancia A3 Ultra o A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }El cuerpo de la solicitud incluye los siguientes valores:
RESERVATION_URL: Es la URL de la reserva, que tiene el siguiente formato:Si la reserva creada de forma automática existe en tu proyecto:
example-reservation.Si la reserva creada de forma automática existe en un proyecto diferente:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: Indica si Compute Engine detiene (STOP) o borra (DELETE) la instancia de procesamiento al final del período de reserva.
¿Qué sigue?
Pruébalo tú mismo
Si es la primera vez que usas Google Cloud, crea una cuenta para evaluar el rendimiento de Compute Engine en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar e implementar cargas de trabajo.
Probar Compute Engine gratis