Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelos de aprovisionamiento de instancias de Compute Engine

Linux Windows

Cuando creas una instancia de Compute Engine, debes definir el método, llamado modelo de aprovisionamiento, que deseas usar para obtener los recursos solicitados. Cada modelo de aprovisionamiento determina la disponibilidad, la vida útil y el precio de tus instancias de procesamiento.

En este documento, se explican los diferentes modelos de aprovisionamiento que puedes especificar cuando creas instancias de procesamiento. Si comprendes estos modelos, puedes elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de procesamiento, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especificas un modelo de aprovisionamiento, Compute Engine usará el modelo de aprovisionamiento estándar de forma predeterminada.

Estándar
Spot
Inicio flexible
Con reserva

En la siguiente tabla, se comparan los casos de uso y los precios de cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Resumen	Según la disponibilidad de recursos, puedes crear instancias de procesamiento de inmediato. Puedes controlar cuándo detener o borrar instancias de procesamiento.	Según la disponibilidad de recursos, puedes crear instancias de procesamiento de inmediato. Puedes controlar cuándo detener o borrar instancias de procesamiento. Sin embargo, también permites que Compute Engine detenga o borre instancias de procesamiento en cualquier momento para recuperar capacidad.	Según la disponibilidad de recursos, puedes crear instancias de procesamiento dentro de un tiempo de espera especificado. En el caso de una VM de inicio flexible independiente, puedes especificar un tiempo de espera de hasta dos horas. En el caso de un MIG, Compute Engine sigue intentando crear instancias de procesamiento hasta que los recursos estén disponibles o hasta que canceles la solicitud de creación. Puedes controlar cuándo detener o borrar instancias de procesamiento. Sin embargo, no puedes suspenderlas ni volver a crearlas. Las instancias de procesamiento se ejecutan durante un mínimo de 10 minutos y un máximo de siete días. Cuando las instancias de procesamiento alcanzan el final de su duración de ejecución, Compute Engine las detiene o borra según su acción de finalización.	Puedes solicitar reservar capacidad en una fecha futura para crear instancias de procesamiento. Si Google Cloud aprueba tu solicitud, Compute Engine creará una reserva. Al inicio del período de reserva, puedes consumirla creando instancias de procesamiento que coincidan con la reserva. Durante el período de reserva aprobado, puedes detener, reiniciar, eliminar y volver a crear instancias de procesamiento para consumir la reserva según sea necesario. Cuando finaliza el período de reserva, Compute Engine borra la reserva y detiene o borra cualquier instancia de procesamiento que consuma la reserva según su acción de finalización.
Casos de uso	Son ideales para cargas de trabajo que requieren estabilidad y funcionamiento continuo, como las siguientes: Servidores web Bases de datos Aplicaciones empresariales Desarrollo y pruebas	Ideal para cargas de trabajo que pueden tolerar interrupciones, como las siguientes: Procesamiento por lotes Computación de alto rendimiento (HPC) Integración continua e implementación continua (CI/CD) Análisis de datos Codificación de medios Inferencia en línea	Cargas de trabajo que requieren estabilidad y deben ejecutarse durante no más de siete días, como las siguientes: Preentrenamiento de modelos pequeños Ajuste del modelo Simulación de HPC Inferencia por lotes	Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes: Para cargas de trabajo que duran hasta 90 días: Trabajos de preentrenamiento de modelos Trabajos de ajuste de modelos Cargas de trabajo de simulación de HPC Aumentos esperados a corto plazo en las cargas de trabajo de inferencia Para cargas de trabajo de más de 90 días: Cargas de trabajo de entrenamiento Cargas de trabajo de inferencia
Asignación de recursos	Mejor esfuerzo. Compute Engine coloca físicamente los recursos cerca unos de otros en función del mejor esfuerzo. Para controlar la colocación, puedes usar de forma opcional políticas de colocación.	Mejor esfuerzo. Compute Engine coloca físicamente los recursos cerca unos de otros en función del mejor esfuerzo. Para controlar la colocación, puedes usar de forma opcional políticas de colocación.	Se realiza de forma densa en la medida de lo posible. Compute Engine hace su mejor esfuerzo para colocar los recursos de forma densa y cerca unos de otros. Para controlar la posición de tus VMs de inicio flexible, puedes usar de forma opcional una de las siguientes opciones: Para VMs independientes de inicio flexible: políticas de posición compacta Para las VMs de inicio flexible en un MIG: Políticas de cargas de trabajo	Dense. Compute Engine coloca físicamente los recursos en hosts con acoplamiento alto conectados por una estructura de red de alta velocidad para minimizar la latencia de la red.
Precios	Se te cobrarán los precios estándar de las instancias de procesamiento. Consulta los precios de las instancias de VM. Se te cobrarán cargos según el método que uses para crear instancias de procesamiento: Si creas instancias de procesamiento de inmediato, pagarás según el modelo prepago (PAYG). Si creas instancias de procesamiento con una reserva según demanda o una reserva creada automáticamente para una reserva futura, se te cobrará mientras exista la reserva. Para obtener más información, consulta la facturación de reservas.	Obtienes descuentos de hasta el 60% en las series de máquinas C3, M3 y A3. Para obtener más información, consulta la página de precios. Usas PAYG.	Según la serie de máquinas que usan tus instancias de procesamiento, obtienes un descuento de la siguiente manera: En las series de máquinas A4, A3 y A2, obtienes un descuento del 53% en las CPU virtuales, la memoria y las GPU. En el caso de la serie de máquinas H4D, obtienes un 25% de descuento en las CPU virtuales y la memoria. Otras series de máquinas compatibles no son aptas para descuentos. Para obtener más información, consulta los precios del Programador dinámico de cargas de trabajo (DWS). Usas PAYG.	Se te cobran cargos según la forma en que reservas capacidad para crear instancias de procesamiento, de la siguiente manera: Si reservas capacidad en AI Hypercomputer, se te cobrarán cargos según los precios de las VMs optimizadas para aceleradores. Si reservas recursos por un año o más, debes comprar y adjuntar un compromiso basado en recursos a los recursos reservados. Si reservas capacidad con reservas futuras en modo de calendario, se te cobrarán cargos según los precios del programador dinámico de cargas de trabajo (DWS). Se te cobra por el período de reserva. Para obtener más información, consulta facturación de reservas.
Cuota	Cuando creas una instancia de procesamiento, se consume la cuota estándar.	Cuando creas una VM Spot, se consume la cuota estándar.	Cuando creas una VM de inicio flexible, se consume la cuota de VM interrumpible . Si tu proyecto no tiene una cuota de recursos interrumpibles, se consumirá la cuota estándar.	El consumo de cuota varía según el método que uses para reservar recursos: Reservas futuras con clústeres de AI Hypercomputer o HPC: Google administra la cuota de los recursos reservados. No es necesario que solicites la cuota de forma manual. En la hora de inicio de tu reserva futura aprobada, Google aumenta automáticamente la cuota si tu proyecto no tiene suficiente. Reservas futuras en modo de calendario: Para reservar tipos de máquinas H4D, se consume la cuota de CPU. No se requiere cuota para reservar tipos de máquinas con GPU o TPU.

Disponibilidad y vida útil de la instancia de procesamiento

En la siguiente tabla, se muestran la disponibilidad y la vida útil de las instancias de procesamiento para cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Requisitos previos para la creación	No hay requisitos previos para la creación.	No hay requisitos previos para la creación.	No hay requisitos previos para la creación.	Para crear instancias de procesamiento, primero debes reservar capacidad con uno de los siguientes métodos: Para reservar capacidad para cargas de trabajo de larga duración, usa las reservas futuras con AI Hypercomputer o las reservas futuras con clústeres de HPC. Para reservar capacidad para cargas de trabajo que se ejecutan durante un máximo de 90 días, usa las reservas futuras en el modo de calendario. En la fecha y hora de entrega que elijas, Compute Engine aprovisionará la capacidad solicitada. Luego, puedes consumir la capacidad creando instancias de procesamiento.
Serie de máquinas compatible	Puedes usar cualquier serie de máquinas, excepto A4X Max, A4X, A4 y A3 Ultra.	Puedes usar todas las series de máquinas (C3, M3 y A3). El acceso a Spot para TPU7x está restringido por una lista de entidades permitidas. Consulta esta nota.	Solo puedes usar las siguientes series de máquinas: Series de máquinas A4, A3, A2, G4 y G2 TPU7x¹, TPU v6e y TPU v5p Instancias de máquina virtual (VM) N1 con GPUs conectadas Serie de máquinas H4D	Según cómo reserves capacidad para crear VMs, solo puedes usar las siguientes series de máquinas: Si reservas capacidad en AI Hypercomputer, solo puedes usar A4X Max, A4X, A4, A3 Ultra, A3 Mega con 8 GPUs, A3 High con 8 GPUs y A3 Edge. Si crea una reserva futura en el modo de calendario, solo podrá usar las siguientes series: GPUs: A4, A3 Ultra, A3 Mega con 8 GPUs, A3 High con 8 GPUs y serie de máquinas H4D. TPUs: TPU7x^*, v6e y v5p
Disponibilidad de la instancia de procesamiento	Puedes crear instancias de procesamiento en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles. Para reducir las probabilidades de que te encuentres con errores de disponibilidad de recursos, puedes consultar la disponibilidad de las VMs Spot antes de crearlas.	Puedes crear instancias de procesamiento en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles.	Puedes crear instancias de procesamiento de la siguiente manera: Crea una instancia de procesamiento independiente. Crea un MIG que cree instancias de procesamiento de forma individual según la disponibilidad. Crea un MIG que cree instancias de procesamiento de una sola vez. Compute Engine usa DWS para programar el aprovisionamiento de la capacidad solicitada según la disponibilidad de recursos. DWS te ayuda a obtener recursos de alta demanda, como las GPUs.	Solo puedes crear instancias de procesamiento después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine entrega la capacidad solicitada, que luego puedes usar para crear instancias de procesamiento. Si reservas recursos con reservas futuras en el modo de calendario, Compute Engine usa DWS para aprovisionar la capacidad solicitada. DWS te ayuda a obtener recursos de alta demanda, como las GPUs.
Garantía de capacidad	Según el método de creación La garantía de capacidad varía según el método que uses para crear instancias de procesamiento de la siguiente manera: Si creas instancias de procesamiento de inmediato, Compute Engine hará su mejor esfuerzo para aprovisionar la capacidad solicitada. Si creas instancias de procesamiento consumiendo una reserva según demanda o una reserva creada automáticamente para una reserva futura, tendrás una gran certeza de que Compute Engine aprovisionará la capacidad solicitada si la reserva tiene capacidad reservada disponible.	Mejor esfuerzo. Cuando creas VMs Spot, Compute Engine hace todo lo posible para aprovisionar la capacidad que solicitaste.	Mejor esfuerzo. Cuando creas una solicitud de cambio de tamaño de MIG, Compute Engine hace todo lo posible para programar el aprovisionamiento de la capacidad solicitada.	Muy alta Si Google Cloud aprueba tu solicitud de reserva, tendrás una certeza muy alta de que Compute Engine aprovisionará tu capacidad reservada en la fecha y hora de entrega que elijas. Tienes acceso exclusivo a la capacidad reservada durante el período de reserva.
Vida útil de la instancia de procesamiento	Puedes controlar cuándo detener o borrar una instancia de procesamiento. Sin embargo, si el tipo de máquina que usa la instancia de procesamiento no admite la migración en vivo, Compute Engine detiene la instancia de procesamiento durante los eventos de mantenimiento del host.	Puedes controlar cuándo detener o borrar una instancia de procesamiento, excepto en los siguientes casos: Compute Engine detiene o borra la instancia de procesamiento para recuperar capacidad. Este proceso se denomina preemption. Si el tipo de máquina que usa la instancia de procesamiento no admite la migración en vivo, Compute Engine detiene la instancia de procesamiento durante los eventos de mantenimiento del host.	Antes de que una instancia de procesamiento llegue al final de su duración de ejecución, puedes hacer lo siguiente: Detén la instancia de procesamiento: Si creaste tu VM de inicio flexible como una instancia de procesamiento independiente o de forma individual en un MIG a medida que la capacidad esté disponible, puedes detener las instancias de procesamiento en cualquier momento. No puedes detener las VM de inicio flexible que se crearon en una solicitud de cambio de tamaño de un MIG. Borra la instancia de procesamiento: Puedes borrar la instancia de procesamiento en cualquier momento. Cuando una instancia de procesamiento alcanza el final de su duración de ejecución, Compute Engine la detiene o borra según su acción de finalización.	Puedes controlar cuándo detener o borrar una instancia de procesamiento, excepto en los siguientes casos: Compute Engine detiene la instancia de procesamiento durante los eventos de mantenimiento del host. La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su período de reserva comprometido. En ese momento, Compute Engine borra la reserva y detiene o borra cualquier instancia de procesamiento que consuma la reserva según la acción de finalización que se especifique en su configuración.

¹ Las reservas de Spot, con inicio flexible y futuras en el modo de calendario para TPU7x están restringidas por una lista de entidades permitidas. Para solicitar acceso, comunícate con tu equipo de cuentas o con el equipo de ventas.

¿Qué sigue?

Lee una descripción general sobre cómo crear instancias de Compute Engine.
Obtén más información sobre las VMs Spot.
Obtén más información sobre las VMs de inicio flexible.
Obtén más información sobre las instancias de procesamiento que usan el modelo de aprovisionamiento vinculado a la reserva.

Modelos de aprovisionamiento de instancias de Compute Engine Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Modelos de aprovisionamiento disponibles

Disponibilidad y vida útil de la instancia de procesamiento

¿Qué sigue?

Modelos de aprovisionamiento de instancias de Compute Engine