Acerca de las VMs de inicio flexible

En este documento, se proporciona una descripción general de las VMs de inicio flexible, en la que se detallan sus características clave, así como los requisitos y las limitaciones que se aplican cuando las creas.

Las VMs de inicio flexible son instancias de máquina virtual (VM) que se crean con el modelo de aprovisionamiento de inicio flexible. Este modelo usa el Programador dinámico de cargas de trabajo (DWS) para aprovisionar recursos de procesamiento con descuento de un grupo seguro de capacidad, lo que mejora tus posibilidades de obtener recursos con alta demanda, como las GPUs. Después de crear VMs de inicio flexible, Compute Engine intenta asignar los recursos solicitados dentro de un período específico. Si tiene éxito, las VMs de inicio flexible comienzan a ejecutarse y continúan haciéndolo durante un máximo de siete días.

Para las cargas de trabajo que requieren recursos durante más de siete días o con una mayor garantía de capacidad, puedes crear una solicitud de reserva futura en el modo de calendario para seguir beneficiándote de los descuentos de DWS.

Casos de uso de VMs de inicio flexible

Las VMs de inicio flexible son ideales para ejecutar cargas de trabajo que pueden comenzar en cualquier momento, como las siguientes:

  • Preentrenamiento de modelos pequeños

  • Ajuste de modelos

  • Simulación de computación de alto rendimiento (HPC)

  • Inferencia por lotes

Características clave de las VMs de inicio flexible

En comparación con otros tipos de instancias de Compute Engine, las VMs de inicio flexible tienen las siguientes características:

  • Tiempo de espera para asignar recursos: Puedes crear VMs de inicio flexible antes de que Compute Engine pueda asignar los recursos solicitados. Sin embargo, las VMs solo se inician si los recursos están disponibles dentro del período especificado. Si los recursos no están disponibles, falla la solicitud de creación de la VM.

    Para obtener más información, consulta Tiempo de espera de la VM de inicio flexible en este documento.

  • Duración de ejecución limitada: Las VMs de inicio flexible pueden ejecutarse hasta siete días. Después de ese tiempo, Compute Engine detiene o borra automáticamente las VMs según la acción de finalización que se especifica en las propiedades de la VM.

    Para obtener más información, consulta Duración de ejecución limitada de la VM de inicio flexible en este documento.

  • Cómo Compute Engine asigna VMs: Compute Engine hace todo lo posible para crear VMs de inicio flexible en las proximidades para minimizar la latencia de la red. Para controlar la posición de tus VMs de inicio flexible, puedes usar de forma opcional políticas de posición compacta o políticas de carga de trabajo.

    Para obtener más información, consulta Asignación de VM de inicio flexible en este documento.

  • El modelo de aprovisionamiento de inicio flexible: Creas VMs de inicio flexible con el modelo de aprovisionamiento de inicio flexible. Este modelo de aprovisionamiento proporciona una disponibilidad de recursos mejorada y precios con descuento en comparación con las VMs que creas con el modelo de aprovisionamiento estándar.

    Para obtener más información sobre cada modelo de aprovisionamiento, consulta Modelos de aprovisionamiento de instancias de Compute Engine.

Tiempo de espera de la VM de inicio flexible

Cuando creas una VM de inicio flexible, la VM no se inicia de inmediato. Compute Engine intenta asignar los recursos solicitados y, luego, iniciar la VM dentro de un período específico. Si tienes suficiente cuota para los recursos solicitados y Compute Engine los asigna al final del tiempo de espera, la VM de inicio flexible se inicia en un plazo de dos minutos después de que la capacidad esté disponible. De lo contrario, falla la solicitud de creación de la VM.

El tiempo de espera varía según el método que uses para crear VMs:

Tiempo de espera de las VMs de inicio flexible independientes

Para crear una VM de inicio flexible independiente, debes especificar un tiempo de espera con el campo requestValidForDuration. Puedes establecer un tiempo de espera de cero segundos o entre 90 y 7,200 segundos (dos horas).

Según los requisitos zonales de tu carga de trabajo, te recomendamos los siguientes tiempos de espera para aumentar las posibilidades de que se realice correctamente la solicitud de creación de la VM de inicio flexible:

  • Requisitos zonales estrictos: Si tu carga de trabajo requiere que crees una VM de inicio flexible en una zona específica, te recomendamos que establezcas el campo requestValidForDuration en 90 segundos o más, hasta dos horas. Los tiempos de espera más largos ayudan a aumentar tus posibilidades de obtener recursos. La VM permanece en el PENDING estado durante este tiempo.

  • Sin requisitos zonales: Si la VM de inicio flexible puede ejecutarse en cualquier zona de la región, te recomendamos que establezcas el requestValidForDuration campo en cero segundos. Este valor especifica que Compute Engine solo asigna recursos si están disponibles de inmediato. Si tu solicitud falla porque los recursos no están disponibles, intenta crear la VM de inicio flexible en una zona diferente.

Para detener una solicitud de creación de VM mientras Compute Engine intenta asignar recursos, borra la VM de inicio flexible.

Tiempo de espera de las solicitudes de cambio de tamaño del MIG

Si agregas VMs de inicio flexible de una sola vez a un grupo de instancias administrado (MIG) con solicitudes de cambio de tamaño, el tiempo de espera para aprovisionar todos los recursos solicitados es indefinido. Después de crear una solicitud de cambio de tamaño del MIG, la solicitud permanece en el estado ACCEPTED hasta que los recursos estén disponibles. Si los recursos solicitados están disponibles, el estado de la solicitud de cambio de tamaño del MIG cambia a SUCCEEDED y Compute Engine crea las VMs de inicio flexible.

Para detener una solicitud de creación de VM mientras Compute Engine intenta asignar recursos, cancela la solicitud de cambio de tamaño del MIG. Para obtener más información, consulta Acerca de las solicitudes de cambio de tamaño del MIG.

Duración de ejecución limitada de la VM de inicio flexible

Cuando creas una VM de inicio flexible, debes especificar lo siguiente:

  • La duración de ejecución de la VM: Debes especificar cuánto tiempo pueden ejecutarse las VMs. La duración de ejecución puede ser de hasta siete días. Si tu carga de trabajo se completa antes de que finalice la duración de ejecución de las VMs, puedes detener o borrar las VMs independientes, o borrar las VMs creadas a través de una solicitud de cambio de tamaño del MIG para evitar cargos innecesarios.

  • La acción de finalización de la VM: Debes elegir si Compute Engine detiene o borra automáticamente las VMs al final de su duración de ejecución.

Asignación de VM de inicio flexible

Compute Engine hace todo lo posible para crear tus VMs de inicio flexible de forma densa según la disponibilidad. Esta posición densa minimiza los saltos de red y optimiza la latencia baja, lo que es ideal para cargas de trabajo que requieren una comunicación constante de la VM, como las cargas de trabajo de IA o AA. Si deseas controlar la posición de tus VMs de inicio flexible para evitar que se creen de forma inesperada muy lejos, haz lo siguiente:

Quota

Para crear o reiniciar una VM de inicio flexible, debes tener suficiente cuota interrumpible para las CPUs virtuales solicitadas, la memoria y las GPUs o los discos SSD locales conectados.

Si intentas crear o reiniciar una VM de inicio flexible sin cuota suficiente, sucede una de las siguientes situaciones:

  • Solicitudes de creación de VM: Tu solicitud permanece pendiente hasta que adquieras la cuota suficiente. Si no adquieres la cuota requerida antes de que finalice el tiempo de espera, falla la solicitud.

  • Solicitudes de reinicio de VM: Tu solicitud falla de inmediato.

Precios

En el caso de las VMs de inicio flexible, se generan cargos de la siguiente manera:

  • Pagas por uso (PAYG). Para obtener más información sobre los precios de una VM durante su ciclo de vida, consulta Precios.

  • Para los tipos de máquinas A4, A3, A2, G4 y H4D, obtienes CPUs virtuales, memoria y cualquier GPU conectada a un precio con descuento. Otros tipos de máquinas optimizadas para aceleradores compatibles no son aptos para descuentos. Para obtener más información, consulta Precios de DWS.

Limitaciones

Las VMs de inicio flexible tienen las siguientes limitaciones:

  • Las VMs de inicio flexible solo pueden usar los siguientes tipos de máquinas:

    • Cualquier tipo de máquina optimizada para aceleradores, excepto A4X Max y A4X

    • Tipos de máquinas H4D

  • Debes crear VMs de inicio flexible con el modelo de aprovisionamiento de inicio flexible.

  • Debes especificar si quieres detener o borrar las VMs de inicio flexible al final de su duración de ejecución con los instanceTerminationAction y maxRunDuration campos.

  • Debes detener las VMs de inicio flexible durante los eventos de mantenimiento del host.

  • No puedes aplicar políticas de posición compacta a las VMs de inicio flexible que Compute Engine crea a través de una solicitud de cambio de tamaño del MIG.

  • No puedes aplicar políticas de posición dispersa a las VMs de inicio flexible.

  • No puedes usar reservas.

¿Qué sigue?

Pruébalo tú mismo

Si es la primera vez que usas Google Cloud, crea una cuenta para evaluar el rendimiento de Compute Engine en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar e implementar cargas de trabajo.

Probar Compute Engine gratis