Google usa tecnología de IA para traducir contenido al idioma que prefieras. Las traducciones generadas por IA pueden contener errores.

Modelos de aprovisionamiento de instancias de Compute Engine

Linux Windows

En este documento se describen los modelos de aprovisionamiento de las instancias de Compute Engine.

Cuando creas una instancia, debes definir el método, llamado modelo de aprovisionamiento, que quieres usar para obtener los recursos solicitados. Cada modelo de aprovisionamiento determina la disponibilidad, la duración y los precios de tus instancias. Si conoces estos modelos, podrás elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de computación, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especifica ningún modelo de aprovisionamiento, Compute Engine usará el modelo de aprovisionamiento estándar de forma predeterminada.

Estándar
Spot
Inicio flexible
Con reserva

En la siguiente tabla se comparan los casos prácticos y los precios de cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Resumen	En función de la disponibilidad de recursos, puedes crear instancias inmediatamente. Puedes controlar cuándo detener o eliminar instancias.	En función de la disponibilidad de recursos, puedes crear instancias inmediatamente. Puedes controlar cuándo detener o eliminar instancias. Sin embargo, también puedes permitir que Compute Engine detenga o elimine instancias en cualquier momento para recuperar capacidad.	En función de la disponibilidad de los recursos, puedes crear instancias en un tiempo de espera especificado. En el caso de una instancia independiente, puedes especificar un tiempo de espera de hasta dos horas. En el caso de las solicitudes de cambio de tamaño de MIG, el tiempo de espera es indefinido. Puedes controlar cuándo detener o eliminar instancias. Sin embargo, no puedes suspenderlos ni volver a crearlos. Las instancias se ejecutan durante un mínimo de 10 minutos y un máximo de siete días. Cuando las instancias alcanzan el final de su duración, Compute Engine las detiene o elimina en función de su acción de finalización.	Puedes solicitar reservar capacidad en una fecha futura para crear instancias con GPUs conectadas. Si Google Cloud aprueba tu solicitud, Compute Engine creará una reserva. Al inicio del periodo de reserva, puedes consumir la reserva creando instancias de GPU que coincidan con ella. Durante el periodo de reserva aprobado, puedes detener, reiniciar, eliminar y volver a crear instancias para consumir la reserva según sea necesario. Cuando finaliza el periodo de reserva, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen en función de su acción de finalización.
Casos prácticos	Es ideal para cargas de trabajo que requieren estabilidad y un funcionamiento continuo, como las siguientes: Servidores web Bases de datos Aplicaciones empresariales Desarrollo y pruebas	Ideal para cargas de trabajo que pueden tolerar interrupciones, como las siguientes: Procesamiento por lotes Computación de alto rendimiento (HPC) Integración y despliegue continuos (CI/CD) Analíticas de datos Codificación de contenido multimedia Inferencia online	Cargas de trabajo que requieran estabilidad y que deban ejecutarse durante un máximo de siete días, como las siguientes: Pre-entrenamiento de modelos pequeños Ajuste fino del modelo Simulación de HPC Inferencia por lotes	Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes: Para cargas de trabajo que duren hasta 90 días: Tareas de pre-entrenamiento de modelos Tareas de ajuste fino de modelos Cargas de trabajo de simulación de HPC Aumentos previstos a corto plazo en las cargas de trabajo de inferencia Para cargas de trabajo de más de 90 días: Cargas de trabajo de entrenamiento Cargas de trabajo de inferencia
Precios	Se te aplicarán las tarifas estándar de las instancias. Consulta los precios de las instancias de máquinas virtuales. Se te aplican cargos en función del método que utilices para crear instancias: Si creas instancias inmediatamente, pagarás por uso. Si creas instancias mediante una reserva bajo demanda o una reserva creada automáticamente para una reserva futura, se te cobrará hasta que la reserva deje de estar activa. Para obtener más información, consulta el artículo sobre la facturación de reservas.	Obtienes descuentos de hasta el 91% en muchos tipos de máquina, GPUs, TPUs y discos SSD locales. Para obtener más información, consulta los precios de las VMs de acceso puntual. Tú pagas según tus ingresos.	En función de la serie de máquinas que usen tus instancias, obtendrás un descuento de la siguiente manera: En el caso de las series de máquinas A4, A3 y A2, obtienes un descuento del 53% en las vCPUs, la memoria y las GPUs. En el caso de la serie de máquinas H4D, obtienes un descuento del 25% en las vCPUs y la memoria. Otras series de máquinas compatibles no cumplen los requisitos para recibir descuentos. Para obtener más información, consulta los precios de Dynamic Workload Scheduler (DWS). Tú pagas según tus ingresos.	Los cargos se aplican en función de cómo reserves capacidad para crear instancias, de la siguiente manera: Si reservas capacidad en AI Hypercomputer, se te cobrará según los precios de las máquinas virtuales optimizadas para aceleradores. Si reservas recursos durante un año o más, debes comprar y adjuntar un compromiso basado en recursos a los recursos reservados. Si reservas capacidad mediante reservas futuras en el modo de calendario, se te aplican cargos según los precios de Dynamic Workload Scheduler (DWS). Se te cobra por el periodo de reserva. Para obtener más información, consulta el artículo sobre la facturación de reservas.
Cuota	Cuando creas una instancia, se consume la cuota estándar.	Cuando creas una instancia, se consume la cuota de instancias no garantizadas . Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar. Los Google Cloud créditos del nivel sin coste económico no se aplican a las máquinas virtuales de Spot.	Cuando el MIG añade instancias al grupo, se consume la cuota de instancias no garantizadas. Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar.	La cuota no se aplica al modelo de aprovisionamiento vinculado a reservas.

Disponibilidad y tiempo de vida de las instancias

En la siguiente tabla se muestra la disponibilidad y la duración de las instancias de proceso de cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Requisitos previos para la creación	No hay requisitos previos para crearla.	No hay requisitos previos para crearla.	No hay requisitos previos para crearla.	Para crear instancias, primero debes reservar capacidad mediante uno de los siguientes métodos: Para reservar capacidad para cargas de trabajo de larga duración, usa reservas futuras en AI Hypercomputer. Para reservar capacidad para cargas de trabajo que se ejecuten durante un máximo de 90 días, usa las reservas futuras en el modo Calendario. En la fecha y hora de entrega que hayas elegido, Compute Engine proporcionará la capacidad que hayas solicitado. Después, puedes consumir la capacidad creando instancias.
Series de máquinas admitidas	Puedes usar cualquier serie de máquinas, excepto A4X Max, A4X, A4 y A3 Ultra.	Puedes usar cualquier serie de máquinas, excepto las instancias A4X y bare metal (A4X Max, C4D, C4, C3, X4 y Z3).	Solo puedes usar las siguientes series de máquinas: Series de máquinas A4, A3, A2 y G2 Instancias de máquina virtual (VM) N1 con GPUs conectadas Serie de máquinas H4D	En función de cómo reserves capacidad para crear VMs, solo podrás usar las siguientes series de máquinas: Si reservas capacidad en Hiperordenador con IA, solo podrás usar las series de máquinas A4X Max, A4X, A4 o A3 Ultra. Si crea una reserva futura en el modo Calendario, solo podrá usar las series de máquinas A4, A3 Ultra, A3 Mega o A3 High con 8 GPUs.
Disponibilidad de la instancia	Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles.	Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles.	Puedes crear instancias de la siguiente manera: Crea una instancia independiente. Crea una solicitud de cambio de tamaño de MIG. Compute Engine usa DWS para programar el aprovisionamiento de la capacidad solicitada en función de la disponibilidad de los recursos. DWS te ayuda a obtener recursos de alta demanda, como GPUs.	Solo puedes crear instancias después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine te proporciona la capacidad que has pedido, que puedes usar para crear instancias. Si reservas recursos mediante reservas futuras en modo de calendario, Compute Engine usará DWS para aprovisionar la capacidad solicitada. DWS te ayuda a obtener recursos de alta demanda, como GPUs.
Garantía de capacidad	Según el método de creación. La garantía de capacidad varía en función del método que utilices para crear instancias, como se indica a continuación: Si creas instancias inmediatamente, Compute Engine hará todo lo posible para aprovisionar la capacidad solicitada. Si creas instancias consumiendo una reserva bajo demanda o una reserva creada automáticamente para una reserva futura, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad solicitada si la reserva tiene capacidad reservada disponible.	El mejor esfuerzo: Cuando creas máquinas virtuales de acceso puntual, Compute Engine hace todo lo posible para aprovisionar la capacidad que has solicitado.	El mejor esfuerzo: Cuando creas una solicitud para cambiar el tamaño de un MIG, Compute Engine hace todo lo posible para programar el aprovisionamiento de la capacidad solicitada.	Muy alto. Si Google Cloud aprueba tu solicitud de reserva, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad reservada en la fecha y hora de entrega que hayas elegido. Tienes acceso exclusivo a la capacidad reservada durante el periodo de reserva.
Tiempo de vida de la instancia	Puedes controlar cuándo detener o eliminar una instancia. Sin embargo, si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detendrá la instancia durante los eventos de mantenimiento del host.	Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos: Compute Engine detiene o elimina la instancia para recuperar capacidad. Este proceso se denomina prelación. Si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detiene la instancia durante los eventos de mantenimiento del host.	Antes de que una instancia llegue al final de su duración, puedes hacer lo siguiente: Detener la instancia: puedes detener la instancia en cualquier momento solo si se creó como una instancia independiente. Eliminar la instancia: puedes eliminar la instancia en cualquier momento. Cuando una instancia llega al final de su duración, Compute Engine la elimina.	Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos: Compute Engine detiene la instancia durante los eventos de mantenimiento del host. La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su periodo de reserva comprometida. En ese momento, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen en función de la acción de finalización especificada en su configuración.

Modelos de aprovisionamiento para implementaciones densas

Para desplegar cargas de trabajo de computación de alto rendimiento (HPC), inteligencia artificial (IA) y aprendizaje automático (ML) en Google Cloud, los recursos de computación deben estar cerca físicamente entre sí para minimizar los saltos de red y optimizar la latencia más baja. Compute Engine proporciona métodos de aprovisionamiento que te permiten reservar grupos de hosts estrechamente acoplados e interconectados mediante una estructura de red de alta velocidad en un único centro de datos.

Para obtener más información sobre los métodos de aprovisionamiento para implementaciones densas, consulta lo siguiente:

Instancias H4D: Descripción general de la creación de clústeres de HPC
Instancias de GPU: Descripción general de la capacidad en la documentación de AI Hypercomputer.

Siguientes pasos

Consulta una descripción general sobre cómo crear instancias de Compute Engine.
Consulta más información sobre las VMs de acceso puntual.
Más información sobre las máquinas virtuales de inicio flexible
Más información sobre las VMs que usan el modelo de aprovisionamiento vinculado a la reserva

Modelos de aprovisionamiento de instancias de Compute Engine Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Modelos de aprovisionamiento disponibles

Disponibilidad y tiempo de vida de las instancias

Modelos de aprovisionamiento para implementaciones densas

Siguientes pasos

Modelos de aprovisionamiento de instancias de Compute Engine