Modelos de aprovisionamiento de instancias de Compute Engine

Cuando creas una instancia de Compute Engine, debes definir el método, llamado modelo de aprovisionamiento, que deseas usar para obtener los recursos solicitados. Cada modelo de aprovisionamiento determina la disponibilidad, la vida útil y el precio de tus instancias de procesamiento.

En este documento, se explican los diferentes modelos de aprovisionamiento que puedes especificar cuando creas instancias de procesamiento. Si comprendes estos modelos, puedes elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de procesamiento, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especificas un modelo de aprovisionamiento, Compute Engine usa el modelo de aprovisionamiento estándar de forma predeterminada.

  • Estándar

  • Spot

  • Inicio flexible

  • Con reserva

En la siguiente tabla, se comparan los casos de uso y los precios de cada modelo de aprovisionamiento:

Estándar Spot Inicio flexible Con reserva
Resumen
  • Según la disponibilidad de recursos, puedes crear instancias de procesamiento de inmediato.
  • Puedes controlar cuándo detener o borrar instancias de procesamiento.
  • Según la disponibilidad de recursos, puedes crear instancias de procesamiento de inmediato.
  • Puedes controlar cuándo detener o borrar instancias de procesamiento. Sin embargo, también permites que Compute Engine detenga o borre instancias de procesamiento en cualquier momento para recuperar capacidad.
  • Según la disponibilidad de recursos, puedes crear instancias de procesamiento dentro de un tiempo de espera especificado. En el caso de una VM de inicio flexible independiente, puedes especificar un tiempo de espera de hasta dos horas. En el caso de una solicitud de cambio de tamaño de un MIG, el tiempo de espera es indefinido.
  • Puedes controlar cuándo detener o borrar instancias de procesamiento. Sin embargo, no puedes suspenderlas ni volver a crearlas. Las instancias de procesamiento se ejecutan durante un mínimo de 10 minutos y un máximo de siete días. Cuando las instancias de procesamiento alcanzan el final de su duración de ejecución, Compute Engine las detiene o borra según su acción de finalización.
  • Puedes solicitar reservar capacidad en una fecha futura para crear instancias de procesamiento. Si Google Cloud aprueba tu solicitud, entonces Compute Engine crea una reserva. Al inicio del período de reserva, puedes consumir la reserva creando instancias de procesamiento que coincidan con la reserva.
  • Durante el período de reserva aprobado, puedes detener, reiniciar, eliminar y volver a crear instancias de procesamiento para consumir la reserva según sea necesario. Cuando finaliza el período de reserva, Compute Engine borra la reserva y detiene o borra cualquier instancia de procesamiento que consuma la reserva según su acción de finalización.
Casos de uso

Es ideal para cargas de trabajo que requieren estabilidad y funcionamiento continuo, como las siguientes:

  • Servidores web
  • Bases de datos
  • Aplicaciones empresariales
  • Desarrollo y pruebas

Son ideales para cargas de trabajo que pueden tolerar interrupciones, como las siguientes:

  • Procesamiento por lotes
  • Computación de alto rendimiento (HPC)
  • Integración continua e implementación continua (CI/CD)
  • Análisis de datos
  • Codificación de medios
  • Inferencia en línea

Cargas de trabajo que requieren estabilidad y deben ejecutarse durante no más de siete días, como las siguientes:

  • Entrenamiento previo de modelos pequeños
  • Ajuste del modelo
  • Simulación con HPC
  • Inferencia por lotes

Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes:

  • Para cargas de trabajo que duran hasta 90 días:

    • Trabajos de entrenamiento previo del modelo
    • Trabajos de ajuste de modelos
    • Cargas de trabajo de simulación de HPC
    • Aumentos esperados a corto plazo en las cargas de trabajo de inferencia
  • Para cargas de trabajo de más de 90 días:

    • Cargas de trabajo de entrenamiento
    • Cargas de trabajo de inferencia
Asignación de recursos Mejor esfuerzo. Compute Engine coloca físicamente los recursos cerca unos de otros en función del mejor esfuerzo. Para controlar la colocación, puedes usar de forma opcional políticas de colocación. Mejor esfuerzo. Compute Engine coloca físicamente los recursos cerca unos de otros en función del mejor esfuerzo. Para controlar la colocación, puedes usar de forma opcional políticas de colocación.

La asignación de recursos varía según la forma en que creas instancias de procesamiento:

  • Mejor esfuerzo. Si creas VMs independientes con Flex-start, Compute Engine colocará físicamente los recursos cerca unos de otros según el mejor esfuerzo. Para controlar la posición, puedes usar de forma opcional políticas de posición.
  • Dense. Si creas VMs de inicio flexible a través de solicitudes de cambio de tamaño de MIG, Compute Engine coloca físicamente los recursos en hosts estrechamente vinculados y conectados por una estructura de red de alta velocidad para minimizar la latencia de red.
Dense. Compute Engine coloca físicamente los recursos en hosts con acoplamiento alto conectados por una estructura de red de alta velocidad para minimizar la latencia de la red.
Precios
  • Se te cobrarán los precios estándar de las instancias de procesamiento. Consulta los precios de las instancias de VM.
  • Se te cobrarán cargos según el método que uses para crear instancias de procesamiento:

    • Si creas instancias de procesamiento de inmediato, pagarás según el modelo prepago (PAYG).
    • Si creas instancias de procesamiento con una reserva según demanda o una reserva creada automáticamente para una reserva futura, se te cobrará hasta que exista la reserva. Para obtener más información, consulta la facturación de reservas.
  • Obtienes descuentos de hasta el 91% para muchos tipos de máquinas, GPU, TPU y discos SSD locales. Para obtener más información, consulta los precios de las VMs Spot.
  • Usas PAYG.
  • Según la serie de máquinas que usan tus instancias de procesamiento, obtienes un descuento de la siguiente manera:

    • En las series de máquinas A4, A3 y A2, obtienes un descuento del 53% en las CPU virtuales, la memoria y las GPU.
    • En el caso de la serie de máquinas H4D, obtienes un 25% de descuento en las CPU virtuales y la memoria.
    Otras series de máquinas compatibles no son aptas para descuentos. Para obtener más información, consulta los precios del Programador dinámico de cargas de trabajo (DWS).
  • Usas PAYG.
Cuota Cuando creas una instancia de procesamiento, se consume la cuota estándar. Cuando creas una instancia de procesamiento, se consume la cuota de instancias interrumpibles . Si tu proyecto no tiene una cuota de recursos interrumpibles, se consumirá la cuota estándar. Los créditos del nivel gratuitoGoogle Cloud no se aplican a las VMs Spot. Cuando el MIG agrega instancias de procesamiento al grupo, se consume la cuota de instancias interrumpibles. Si tu proyecto no tiene una cuota de recursos interrumpibles, se consumirá la cuota estándar. La cuota no se aplica al modelo de aprovisionamiento vinculado a la reserva. Sin embargo, aún necesitas cuota para los recursos que no forman parte de tu capacidad reservada, como los discos y las direcciones IP.

Disponibilidad y vida útil de la instancia de procesamiento

En la siguiente tabla, se muestran la disponibilidad y la vida útil de las instancias de procesamiento para cada modelo de aprovisionamiento:

Estándar Spot Inicio flexible Con reserva
Requisitos previos para la creación No hay requisitos previos para la creación. No hay requisitos previos para la creación. No hay requisitos previos para la creación.

Para crear instancias de procesamiento, primero debes reservar capacidad con uno de los siguientes métodos:

En la fecha y hora de entrega que elijas, Compute Engine aprovisionará la capacidad solicitada. Luego, puedes consumir la capacidad creando instancias de procesamiento.

Serie de máquinas compatible Puedes usar cualquier serie de máquinas, excepto A4X Max, A4X, A4 y A3 Ultra. Puedes usar cualquier serie de máquinas, excepto las instancias A4X y las instancias de metal desnudo (A4X Max, C4D, C4, C3, X4 y Z3).

Solo puedes usar las siguientes series de máquinas:

Según cómo reserves capacidad para crear VMs, solo puedes usar las siguientes series de máquinas:

Disponibilidad de la instancia de procesamiento Puedes crear instancias de procesamiento en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles. Puedes crear instancias de procesamiento en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles.

Puedes crear instancias de procesamiento de la siguiente manera:

Compute Engine usa el DWS para programar el aprovisionamiento de la capacidad solicitada según la disponibilidad de recursos. El DWS te ayuda a obtener recursos de alta demanda, como las GPUs.

Solo puedes crear instancias de procesamiento después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine entrega la capacidad solicitada, que luego puedes usar para crear instancias de procesamiento. Si reservas recursos con reservas futuras en modo de calendario, Compute Engine usa DWS para aprovisionar la capacidad solicitada. El DWS te ayuda a obtener recursos de alta demanda, como las GPUs.
Garantía de capacidad Según el método de creación La garantía de capacidad varía según el método que uses para crear instancias de procesamiento de la siguiente manera:
  • Si creas instancias de procesamiento de inmediato, Compute Engine hará todo lo posible para aprovisionar la capacidad solicitada.
  • Si creas instancias de procesamiento consumiendo una reserva según demanda o una reserva creada automáticamente para una reserva futura, tendrás una gran certeza de que Compute Engine aprovisionará la capacidad solicitada si la reserva tiene capacidad reservada disponible.
Mejor esfuerzo. Cuando creas VMs Spot, Compute Engine hace todo lo posible para aprovisionar la capacidad que solicitaste. Mejor esfuerzo. Cuando creas una solicitud de cambio de tamaño de MIG, Compute Engine hace todo lo posible para programar el aprovisionamiento de la capacidad solicitada. Muy alta Si Google Cloud aprueba tu solicitud de reserva, tendrás una certeza muy alta de que Compute Engine aprovisionará tu capacidad reservada en la fecha y hora de entrega que elijas. Tienes acceso exclusivo a la capacidad reservada durante el período de reserva.
Vida útil de la instancia de procesamiento Puedes controlar cuándo detener o borrar una instancia de procesamiento. Sin embargo, si el tipo de máquina que usa la instancia de procesamiento no admite la migración en vivo, Compute Engine detiene la instancia de procesamiento durante los eventos de mantenimiento del host.

Puedes controlar cuándo detener o borrar una instancia de procesamiento, excepto en los siguientes casos:

  • Compute Engine detiene o borra la instancia de procesamiento para recuperar capacidad. Este proceso se denomina preemption.
  • Si el tipo de máquina que usa la instancia de procesamiento no admite la migración en vivo, Compute Engine detiene la instancia de procesamiento durante los eventos de mantenimiento del host.

Antes de que una instancia de procesamiento llegue al final de su duración de ejecución, puedes hacer lo siguiente:

  • Detén la instancia de procesamiento: Puedes detener la instancia de procesamiento en cualquier momento solo si se creó como una instancia de procesamiento independiente.
  • Borra la instancia de procesamiento: Puedes borrar la instancia de procesamiento en cualquier momento.

Cuando una instancia de procesamiento alcanza el final de su duración de ejecución, Compute Engine la borra.

Puedes controlar cuándo detener o borrar una instancia de procesamiento, excepto en los siguientes casos:

  • Compute Engine detiene la instancia de procesamiento durante los eventos de mantenimiento del host.
  • La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su período de reserva confirmado. En ese momento, Compute Engine borra la reserva y detiene o borra cualquier instancia de procesamiento que consuma la reserva según la acción de finalización que se especifica en su configuración.

¿Qué sigue?