En este documento, se describen las instancias de Compute Engine que usan el modelo de aprovisionamiento vinculado a la reserva, incluidos sus beneficios y requisitos de creación.
Cuando creas una instancia de procesamiento, debes especificar el modelo de aprovisionamiento subyacente, que define la disponibilidad, el precio y la vida útil de los recursos que usa tu instancia de procesamiento. El modelo de aprovisionamiento vinculado a la reserva te permite crear instancias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High con 8 GPUs, A3 Edge y H4D con capacidad reservada de una reserva futura en modo de calendario o una reserva futura en AI Hypercomputer.
El modelo de aprovisionamiento vinculado a la reserva ofrece los siguientes beneficios:
Control de costos: No incurres en cargos adicionales cuando creas instancias de procesamiento con capacidad reservada. Solo se te cobran los recursos que no forman parte de tu reserva, como los discos o las direcciones IP.
Administración del ciclo de vida: Según la acción de finalización que especifiques cuando crees instancias de procesamiento, Compute Engine detendrá o borrará las instancias de procesamiento al final del período de reserva.
Información sobre las instancias que usan el modelo de aprovisionamiento vinculado a la reserva
En las siguientes secciones, se describen los requisitos que debes aplicar cuando creas instancias de procesamiento con el modelo de aprovisionamiento vinculado a la reserva.
Requisitos previos para la creación de instancias de procesamiento
Para usar el modelo de aprovisionamiento vinculado a la reserva y crear instancias de procesamiento, primero debes reservar recursos. Puedes reservar recursos de la siguiente manera:
Para reservar hasta 80 instancias A4, A3 Ultra, A3 Mega, A3 High con 8 GPUs o H4D, y por hasta 90 días, usa las solicitudes de reserva futuras en el modo de calendario.
Para reservar más de 80 instancias de A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High con 8 GPUs, A3 Edge o H4D por más de 90 días, usa las solicitudes de reserva futuras en AI Hypercomputer.
Si Google Cloud aprueba tu solicitud de reserva futura, Compute Engine creará automáticamente (creación automática) una reserva al inicio del período de reserva. Luego, puedes usar la reserva para crear instancias de procesamiento.
Requisitos para la creación de instancias de Compute
Para crear una instancia de procesamiento con el modelo de aprovisionamiento vinculado a la reserva, debes especificar las siguientes configuraciones:
La instancia de procesamiento y la reserva deben tener propiedades coincidentes. Solo puedes usar la capacidad reservada para crear instancias si las propiedades de la instancia y de la reserva creada automáticamente coinciden exactamente. Para obtener más información, consulta los requisitos para consumir reservas.
La instancia de procesamiento debe orientarse específicamente a la reserva para consumirla. Cuando creas una instancia de procesamiento, debes especificar el nombre de la reserva creada automáticamente a la que se destinará el consumo, así como establecer el campo
reservationAffinityenSPECIFIC_RESERVATION. Para obtener más información, consulta Consume una reserva segmentada de forma específica.La instancia de procesamiento debe usar el modelo de aprovisionamiento vinculado a la reserva. Cuando creas una instancia de procesamiento, debes especificar el modelo de aprovisionamiento vinculado a la reserva de la siguiente manera:
Si usas la consola de Google Cloud , en la lista Modelo de aprovisionamiento, selecciona Vinculado a la reserva.
Si usas Google Cloud CLI, incluye la marca
--provisioning-model=RESERVATION_BOUNDen el comando.Si usas la API de Compute Engine, incluye el campo
"provisioningModel": "RESERVATION_BOUND"en el cuerpo de la solicitud.
La instancia de procesamiento debe detenerse o borrarse a la hora de finalización de la reserva. Cuando creas una instancia de procesamiento, debes especificar si se detendrá o borrará al finalizar la hora de reserva con el campo
instanceTerminationAction. Para obtener más información, consulta cómo limitar el tiempo de ejecución de una instancia de procesamiento.
Después de crear una instancia de procesamiento con el modelo de aprovisionamiento vinculado a la reserva, la instancia de procesamiento comienza a ejecutarse y sigue en ejecución hasta que la detienes o la borras, o hasta que Compute Engine detiene o borra la instancia de procesamiento en la hora de finalización de la reserva.
Cuota
Cuando creas una instancia de procesamiento con el modelo de aprovisionamiento vinculado a la reserva, no necesitas cuota para los recursos reservados que usas para crear la instancia de procesamiento. Solo necesitas cuota para los recursos que no forman parte de tu capacidad reservada, como los discos y las direcciones IP. Para obtener más información sobre los diferentes tipos de cuotas, consulta Cuotas de asignación.
Precios
Cuando creas una instancia de procesamiento con el modelo de aprovisionamiento vinculado a la reserva, se te aplican cargos de la siguiente manera:
Los cargos comienzan cuando creas la instancia de procesamiento. No se generan cargos adicionales por los recursos reservados que usas para crear tu instancia de procesamiento. Solo se te cobrarán los recursos que no formen parte de la reserva, como los discos o las direcciones IP. Para obtener más información, consulta la facturación de reservas.
Los cargos se detienen a la hora de finalización de la reserva. En ese momento, Compute Engine borra la reserva y detiene o borra la instancia de procesamiento según la acción de finalización especificada en la instancia de procesamiento.
Limitaciones
Para crear instancias de procesamiento con el modelo de aprovisionamiento vinculado a la reserva, debes usar una de las siguientes series de máquinas:
A4X Max
A4X
A4
A3 Ultra
A3 Mega
A3 High con 8 GPUs
H4D
Si deseas consultar sobre el uso de otras series de máquinas optimizadas para aceleradores con el modelo de aprovisionamiento vinculado a reservas, comunícate con tu equipo de cuentas o el equipo de ventas.
¿Qué sigue?
Pruébalo tú mismo
Si es la primera vez que usas Google Cloud, crea una cuenta para evaluar el rendimiento de Compute Engine en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar e implementar cargas de trabajo.
Probar Compute Engine gratis