Modelos de aprovisionamiento de instancias de Compute Engine

En este documento se describen los modelos de aprovisionamiento de las instancias de Compute Engine.

Cuando creas una instancia, debes definir el método, llamado modelo de aprovisionamiento, que quieres usar para obtener los recursos solicitados. Cada modelo de aprovisionamiento determina la disponibilidad, la duración y los precios de tus instancias. Si conoces estos modelos, podrás elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de computación, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especifica ningún modelo de aprovisionamiento, Compute Engine usará el modelo de aprovisionamiento estándar de forma predeterminada.

  • Estándar

  • Spot

  • Inicio flexible

  • Con reserva

En la siguiente tabla se comparan los casos prácticos y los precios de cada modelo de aprovisionamiento:

Estándar Spot Inicio flexible Con reserva
Resumen
  • En función de la disponibilidad de recursos, puedes crear instancias inmediatamente.
  • Puedes controlar cuándo detener o eliminar instancias.
  • En función de la disponibilidad de recursos, puedes crear instancias inmediatamente.
  • Puedes controlar cuándo detener o eliminar instancias. Sin embargo, también puedes permitir que Compute Engine detenga o elimine instancias en cualquier momento para recuperar capacidad.
  • En función de la disponibilidad de los recursos, puedes crear instancias en un tiempo de espera especificado. En el caso de una instancia independiente, puedes especificar un tiempo de espera de hasta dos horas. En el caso de una solicitud de cambio de tamaño de un MIG, el tiempo de espera es indefinido.
  • Puedes controlar cuándo detener o eliminar instancias. Sin embargo, no puedes suspenderlos ni volver a crearlos. Las instancias se ejecutan durante un mínimo de 10 minutos y un máximo de siete días. Cuando las instancias alcanzan el final de su duración, Compute Engine las detiene o elimina en función de su acción de finalización.
  • Puedes solicitar reservar capacidad para crear instancias con GPUs asociadas en una fecha futura. Si Google Cloud aprueba tu solicitud, Compute Engine creará una reserva. Al inicio del periodo de reserva, puedes consumir la reserva creando instancias de GPU que coincidan con ella.
  • Durante el periodo de reserva aprobado, puedes detener, reiniciar, eliminar y volver a crear instancias para consumir la reserva según sea necesario. Cuando finaliza el periodo de reserva, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen en función de su acción de finalización.
Casos prácticos

Es ideal para cargas de trabajo que requieren estabilidad y un funcionamiento continuo, como las siguientes:

  • Servidores web
  • Bases de datos
  • Aplicaciones empresariales
  • Desarrollo y pruebas

Ideal para cargas de trabajo que pueden tolerar interrupciones, como las siguientes:

  • Procesamiento por lotes
  • Computación de alto rendimiento (HPC)
  • Integración y despliegue continuos (CI/CD)
  • Analíticas de datos
  • Codificación de contenido multimedia
  • Inferencia online

Cargas de trabajo que requieran estabilidad y que no deban ejecutarse durante más de siete días, como las siguientes:

  • Pre-entrenamiento de modelos pequeños
  • Ajuste fino del modelo
  • Simulación de HPC
  • Inferencia por lotes

Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes:

  • Para cargas de trabajo que duren hasta 90 días:

    • Tareas de pre-entrenamiento de modelos
    • Tareas de ajuste fino de modelos
    • Cargas de trabajo de simulación de HPC
    • Aumentos previstos a corto plazo en las cargas de trabajo de inferencia
  • Para cargas de trabajo de más de 90 días:

    • Cargas de trabajo de entrenamiento
    • Cargas de trabajo de inferencia
Precios
  • Se te aplican las tarifas estándar de las instancias. Consulta los precios de las instancias de máquinas virtuales.
  • Se te aplican cargos en función del método que utilices para crear instancias:

    • Si creas instancias inmediatamente, pagarás por uso.
    • Si creas instancias mediante una reserva bajo demanda o una reserva creada automáticamente para una reserva futura, se te cobrará hasta que la reserva deje de estar activa. Para obtener más información, consulta el artículo sobre la facturación de reservas.
  • Obtienes descuentos de hasta el 91% en muchos tipos de máquina, GPUs, TPUs y discos SSD locales. Para obtener más información, consulta los precios de las VMs de acceso puntual.
  • Tú pagas según tus ingresos.
  • En función de la serie de máquinas que usen tus instancias, obtendrás un descuento de la siguiente manera:

    • En el caso de las series de máquinas A4, A3 y A2, obtienes un descuento del 53% en las vCPUs, la memoria y las GPUs.
    • En el caso de la serie de máquinas H4D, obtienes un descuento del 25% en las vCPUs y la memoria.
    Otras series de máquinas compatibles no cumplen los requisitos para recibir descuentos. Para obtener más información, consulta los precios de Dynamic Workload Scheduler (DWS).
  • Tú pagas según tus ingresos.
Cuota Cuando creas una instancia, se consume la cuota estándar. Cuando creas una instancia, se consume la cuota de instancias no garantizadas . Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar. Los Google Cloud créditos del nivel gratuito no se aplican a las máquinas virtuales de Spot. Cuando el MIG añade instancias al grupo, se consume la cuota de instancias no garantizadas. Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar. La cuota no se aplica al modelo de aprovisionamiento vinculado a reservas.

Disponibilidad y tiempo de vida de las instancias

En la siguiente tabla se muestra la disponibilidad y la duración de las instancias de proceso de cada modelo de aprovisionamiento:

Estándar Spot Inicio flexible Con reserva
Requisitos previos para la creación No hay requisitos previos para crear una. No hay requisitos previos para crear una. No hay requisitos previos para crear una.

Para crear instancias, primero debes reservar capacidad mediante uno de los siguientes métodos:

En la fecha y hora de entrega que hayas elegido, Compute Engine proporcionará la capacidad que hayas solicitado. Después, puedes consumir la capacidad creando instancias.

Series de máquinas admitidas Puedes usar cualquier serie de máquinas, excepto A4X, A4 y A3 Ultra. Puedes usar cualquier serie de máquinas, excepto A4X, X4 y las instancias de hardware desnudo.

Solo puedes usar las siguientes series de máquinas:

En función de cómo reserves capacidad para crear VMs, solo podrás usar las siguientes series de máquinas:

Disponibilidad de la instancia Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles. Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles.

Puedes crear instancias de la siguiente manera:

Compute Engine usa DWS para programar el aprovisionamiento de la capacidad solicitada en función de la disponibilidad de los recursos. DWS te ayuda a obtener recursos de alta demanda, como GPUs.

Solo puedes crear instancias después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine te proporciona la capacidad que has pedido, que puedes usar para crear instancias. Si reservas recursos mediante reservas futuras en modo Calendario, Compute Engine usará DWS para aprovisionar la capacidad solicitada. DWS te ayuda a obtener recursos de alta demanda, como GPUs.
Garantía de capacidad Según el método de creación. La garantía de capacidad varía en función del método que utilices para crear instancias, como se indica a continuación:
  • Si creas instancias inmediatamente, Compute Engine hará todo lo posible para aprovisionar la capacidad que hayas solicitado.
  • Si creas instancias consumiendo una reserva bajo demanda o una reserva creada automáticamente para una reserva futura, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad solicitada si la reserva tiene capacidad reservada disponible.
El mejor esfuerzo: Cuando creas máquinas virtuales de acceso puntual, Compute Engine hace todo lo posible para aprovisionar la capacidad que has solicitado. El mejor esfuerzo: Cuando creas una solicitud para cambiar el tamaño de un MIG, Compute Engine hace todo lo posible para programar el aprovisionamiento de la capacidad solicitada. Muy alto. Si Google Cloud aprueba tu solicitud de reserva, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad reservada en la fecha y hora de entrega que hayas elegido. Tienes acceso exclusivo a la capacidad que has reservado durante el periodo de reserva.
Tiempo de vida de la instancia Puedes controlar cuándo detener o eliminar una instancia. Sin embargo, si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detiene la instancia durante los eventos de mantenimiento del host.

Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos:

  • Compute Engine detiene o elimina la instancia para recuperar capacidad. Este proceso se denomina prelación.
  • Si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detiene la instancia durante los eventos de mantenimiento del host.

Antes de que una instancia llegue al final de su duración, puedes hacer lo siguiente:

  • Detener la instancia: puedes detener la instancia en cualquier momento solo si se creó como una instancia independiente.
  • Eliminar la instancia: puedes eliminar la instancia en cualquier momento.

Cuando una instancia llega al final de su duración, Compute Engine la elimina.

Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos:

  • Compute Engine detiene la instancia durante los eventos de mantenimiento del host.
  • La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su periodo de reserva comprometida. En ese momento, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen en función de la acción de finalización especificada en su configuración.

Modelos de aprovisionamiento para implementaciones densas

Para desplegar cargas de trabajo de computación de alto rendimiento (HPC), inteligencia artificial (IA) y aprendizaje automático (ML) en Google Cloud, los recursos de computación deben estar físicamente cerca unos de otros para minimizar los saltos de red y optimizar la latencia más baja. Compute Engine ofrece métodos de aprovisionamiento que te permiten reservar grupos de hosts estrechamente acoplados e interconectados mediante una estructura de red de alta velocidad en un único centro de datos.

Para obtener más información sobre los métodos de aprovisionamiento para implementaciones densas, consulta los siguientes artículos:

Siguientes pasos