Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Elige una opción de consumo

En este documento, se explican las diferentes formas, llamadas opciones de consumo, para obtener y usar recursos de procesamiento en AI Hypercomputer. Elige la opción que mejor se adapte a tu carga de trabajo, su duración y tus necesidades de costos.

Cada opción de consumo especifica lo siguiente:

Cómo accedes a la capacidad para crear VMs o clústeres
El modelo de aprovisionamiento subyacente, que determina la disponibilidad, la vida útil y el precio de tus VMs

Comparación de las opciones de consumo

En la siguiente tabla, se resumen las diferencias clave entre las opciones de consumo:

Opción de consumo	Reservas futuras en AI Hypercomputer	Reservas futuras de hasta 90 días (en modo de calendario)	Inicio flexible	Spot
Máquinas compatibles	A4X Max, A4X, A4, A3 Ultra, A3 Mega o A3 High	A4, A3 Ultra, A3 Mega o A3 High con 8 GPUs	Cualquier máquina con GPU, excepto A4X Max y A4X	Cualquier máquina con GPU excepto A4X Max y A4X
Vida útil	Ilimitado	Hasta 90 días	Hasta 7 días	Ilimitado (pero sujeto a prelanzamiento)
Interrumpible
Garantía de capacidad	Muy alta Si Google Cloud aprueba tu solicitud de reserva, tendrás una certeza muy alta de que Compute Engine aprovisionará la capacidad solicitada.	Muy alta Si Google Cloud aprueba tu solicitud de reserva, tendrás una certeza muy alta de que Compute Engine aprovisionará la capacidad solicitada.	Mejor esfuerzo. Compute Engine hace su mejor esfuerzo para programar el aprovisionamiento de la capacidad solicitada.	Mejor esfuerzo. Compute Engine hace el mejor esfuerzo posible para aprovisionar la capacidad solicitada.
Cuota	Google Cloud aumenta automáticamente la cuota antes de que se entregue la capacidad.	No se consume ninguna cuota.	Consume cuota interrumpible.	Consume cuota interrumpible.
Precios	Con descuento (hasta un 53%) Consulta los precios de las VMs optimizadas para aceleradores. Si reservas recursos por un año o más, debes comprar y adjuntar un compromiso basado en recursos a los recursos reservados. Se te cobra por el período de reserva. Consulta la facturación de reservas.	Con descuento (hasta un 53%) Consulta los precios del programador dinámico de cargas de trabajo. Se te cobra por el período de reserva. Consulta la facturación de reservas.	Con descuento (hasta un 53%) Consulta los precios del programador dinámico de cargas de trabajo. Pagas a medida que usas (PAYG).	Con grandes descuentos (hasta un 91%) Consulta los precios de las VMs Spot y los precios de las VMs optimizadas para aceleradores. Pagas a medida que usas (PAYG).
Asignación de recursos	Dense	Dense	Densa según el criterio del mejor esfuerzo ( políticas compactas o políticas de carga de trabajo opcionales)	Estándar (política de compactación opcional)
Modelo de aprovisionamiento	Con reserva	Con reserva	Inicio flexible	Spot
Método de creación	Para crear VMs, debes hacer lo siguiente: Comunícate con tu equipo de cuentas para reservar capacidad. En la fecha y hora que elijas, puedes usar la capacidad reservada para crear VMs y clústeres con cualquiera de los métodos que se describen en la Descripción general de las opciones de implementación.	Para crear VMs, debes hacer lo siguiente: Crea una reserva futura en modo de calendario. En la fecha y hora que elijas, puedes usar la capacidad reservada para crear VMs y clústeres con cualquiera de los métodos que se describen en la Descripción general de las opciones de implementación.	Cuando solicitas la creación de VMs de inicio flexible, Compute Engine programa la creación de las VM según la disponibilidad. Cuando la capacidad está disponible, Compute Engine aprovisiona las VMs de inicio flexible. Para crear VMs de Flex-start, usa cualquiera de los métodos que se describen en la Descripción general de las opciones de implementación.	Puedes crear VMs de inmediato con cualquiera de los métodos descritos en la Descripción general de las opciones de implementación.

Elige una opción de consumo

Usa el siguiente diagrama de flujo para elegir la opción de consumo que mejor se adapte a tu carga de trabajo:

Un diagrama de flujo con las opciones de consumo de AI Hypercomputer.

Las preguntas del diagrama anterior son las siguientes:

¿Necesitas capacidad para más de 90 días?
- Sí: Consulta Cómo usar reservas futuras en AI Hypercomputer.
- No: Ve a la pregunta 2.
¿Quieres capacidad reservada?
- Sí: Consulta Cómo usar las reservas futuras en modo de calendario.
- No: Ve a la pregunta 3.
¿Tu carga de trabajo es tolerante a errores?
- No: Consulta Usar inicio flexible.
- Sí: Consulta Usar Spot.

Usa reservas futuras en AI Hypercomputer

Para ejecutar cargas de trabajo distribuidas a gran escala y de larga duración que requieren recursos asignados de forma densa, puedes solicitar recursos de procesamiento para un momento específico en el futuro. Tienes acceso exclusivo a los recursos reservados durante ese período y puedes usarlos para crear VMs o clústeres. Al final del período de reserva, Compute Engine hace lo siguiente:

Compute Engine borra la reserva.
Según la acción de finalización que especifiques para las VMs, Compute Engine detiene o borra las VMs que usan la reserva.

Cargas de trabajo ideales para las reservas futuras en AI Hypercomputer

Las reservas futuras son ideales para las siguientes cargas de trabajo:

Preentrenar modelos de base
Inferencia de modelos de base con varios hosts

Características clave de las reservas futuras en AI Hypercomputer

Las reservas futuras tienen las siguientes características:

Puedes reservar tipos de máquinas A4X Max, A4X, A4, A3 Ultra, A3 Mega o A3 High (8 GPUs). Las máquinas se asignan de forma densa para minimizar la latencia de la red.
Puedes reservar cualquier cantidad de VMs por cualquier duración a partir de una fecha futura. Usar los recursos reservados para crear y ejecutar VMs hasta el final del período de reserva Si reservas recursos por un año o más, debes comprar y adjuntar un compromiso basado en recursos.
Después de que comience el período de reserva, puedes modificar las reservas creadas de forma automática de la siguiente manera:
- Habilita o inhabilita las notificaciones de mantenimiento de emergencia del hardware
- Habilita o inhabilita el uso de trabajos de Vertex AI
Usas el modelo de aprovisionamiento vinculado a la reserva, que tiene los siguientes beneficios:
- Tienes más probabilidades de obtener GPUs.
- Además del compromiso asociado a tus VMs, obtienes un descuento de hasta el 53% en las CPU virtuales y las GPU.

Cómo usar las reservas futuras en AI Hypercomputer

Para usar reservas futuras y crear VMs o clústeres, debes completar los siguientes pasos:

Solicita reservar capacidad. Comunícate con tu equipo de cuentas y especifica los recursos que deseas reservar. Según la disponibilidad, Google crea un borrador de solicitud de reserva para ti. Si se ve bien, puedes enviarla. Google Cloud aprueba de inmediato la solicitud de reserva.

Para obtener instrucciones, consulta Reserva capacidad.
Consume recursos reservados. Al comienzo del período de reserva que elegiste, puedes usar la reserva para crear VMs o clústeres.

Para conocer los diferentes métodos para crear VMs o clústeres, consulta la Descripción general de las opciones de implementación.

Cómo usar las reservas futuras en el modo de calendario

Para ejecutar cargas de trabajo distribuidas de corta duración que requieren recursos asignados de forma densa, puedes solicitar recursos de procesamiento por hasta 90 días. Tienes acceso exclusivo a los recursos reservados durante ese período y puedes usarlos para crear VMs o clústeres. Al final del período de reserva, Compute Engine hace lo siguiente:

Compute Engine borra la reserva.
Según la acción de finalización que especifiques para las VMs, Compute Engine detiene o borra las VMs que usan la reserva.

Cargas de trabajo ideales para las reservas futuras en modo de calendario

Las reservas futuras en modo de calendario son ideales para las siguientes cargas de trabajo:

Preentrenamiento del modelo
Ajuste del modelo
Simulaciones
Inferencia

Características clave de las reservas futuras en modo de calendario

Las reservas futuras en modo de calendario tienen las siguientes características:

Puedes reservar tipos de máquinas A4, A3 Ultra, A3 Mega o A3 High (8 GPUs). Estas máquinas se asignan de forma densa para minimizar la latencia de la red.
Puedes consultar la disponibilidad futura y reservar hasta 80 VMs por un máximo de 90 días. Luego, puedes usar los recursos reservados para crear VMs hasta el final del período de reserva.
Después de que comience el período de reserva, puedes modificar las reservas creadas de forma automática de la siguiente manera:
- Habilita o inhabilita las notificaciones de mantenimiento de emergencia del hardware
- Habilita o inhabilita el uso de trabajos de Vertex AI
Usas el modelo de aprovisionamiento vinculado a la reserva, que tiene los siguientes beneficios:
- Tienes más probabilidades de obtener GPUs.
- Obtienes un descuento de hasta el 53% en las CPU virtuales y las GPU.

Cómo usar las reservas futuras en modo de calendario

Para usar las reservaciones futuras en el modo de calendario para crear VMs o clústeres, debes completar los siguientes pasos:

Ver la disponibilidad de recursos Puedes ver la disponibilidad futura de los recursos que deseas reservar. Cuando creas una solicitud de reserva, puedes especificar la cantidad, el tipo y la duración de la reserva para los recursos que confirmaste como disponibles. Esta acción aumenta las probabilidades de que Google Cloud apruebe tu solicitud.

Para obtener instrucciones, consulta Cómo ver la disponibilidad futura de los recursos.
Reservar capacidad Creas una solicitud de reserva para una fecha y hora futuras. Google Cloud aprueba la solicitud de reserva en un plazo de dos minutos. Si se aprueba, Compute Engine reserva la capacidad. En la fecha de entrega que elijas, podrás usar los recursos reservados para crear VMs o clústeres.

Para obtener instrucciones, consulta Crea una solicitud de reserva para VMs de GPU o TPU.
Consume recursos reservados. Al comienzo del período de reserva que elegiste, puedes usar la reserva para crear VMs o clústeres.

Para conocer los diferentes métodos para crear VMs o clústeres, consulta lo siguiente:
- Para crear VMs A4, A3 Ultra, A3 Mega o A3 High (8 GPUs), consulta la Descripción general de las opciones de implementación.
- Para crear VMs A3 Mega o A3 High (8 GPUs) con GPUDirect-TCPX habilitado, consulta Crea una VM A3 con GPUDirect-TCPX habilitado.

Usar el inicio flexible

Para ejecutar cargas de trabajo de corta duración que requieren recursos asignados de forma densa, puedes solicitar recursos de procesamiento por hasta siete días con el inicio flexible. Siempre que haya recursos disponibles, Compute Engine creará la cantidad de VMs que solicitaste. Puedes detener las VMs de inicio flexible independientes, pero no las VMs de inicio flexible que crea un grupo de instancias administradas (MIG) a través de solicitudes de cambio de tamaño. Las VMs de inicio flexible existen hasta que las borras o hasta que Compute Engine las borra al final de su duración de ejecución.

Cargas de trabajo ideales para el inicio flexible

El inicio flexible es ideal para cargas de trabajo que pueden iniciarse en cualquier momento, como las siguientes:

Preentrenamiento de modelos pequeños
Ajuste del modelo
Simulaciones
Inferencia por lotes

Características clave del inicio flexible

El inicio flexible tiene las siguientes características:

Puedes solicitar cualquier tipo de máquina con GPU, excepto A4X Max y A4X. Compute Engine hace su mejor esfuerzo para asignar máquinas de forma densa, lo que puede hacer que las VMs de inicio flexible estén muy separadas dentro de la misma zona. Para controlar la ubicación de tus VMs y minimizar la latencia de la red, puedes hacer lo siguiente:
- En el caso de las VMs independientes de Flex-start, aplica una política de posición compacta a las VMs.
- Para los MIG que tienen un tamaño objetivo, aplica una política de carga de trabajo.
Usas el modelo de aprovisionamiento de inicio flexible, que tiene los siguientes beneficios:
- Tienes más probabilidades de obtener GPUs.
- Obtienes un descuento de hasta el 53% en CPU virtuales, memoria y GPU.

Cómo usar el inicio flexible

Para usar el inicio flexible y crear VMs o clústeres, debes completar los siguientes pasos:

Opcional: Crea una política de posición compacta o una política de cargas de trabajo. Puedes crear una política de posición compacta (para VMs independientes o VMs de forma masiva) o una política de carga de trabajo (para MIGs) para especificar la proximidad de las VM. La configuración que elijas afectará los tipos de máquinas y la cantidad de VMs que admite la política.
Crea VMs de inicio flexible. Después de que solicitas la creación de VMs, Compute Engine programa la creación de VM según la disponibilidad. Cuando la capacidad está disponible, Compute Engine aprovisiona las VMs de inicio flexible. Las VMs se ejecutan hasta que las detienes o las borras, o hasta que alcanzan el final de su duración de ejecución.

Para obtener instrucciones, consulta la Descripción general de las opciones de implementación.

Usar Spot

Para ejecutar cargas de trabajo tolerantes a errores, puedes obtener recursos de procesamiento de inmediato según la disponibilidad. Obtienes recursos al precio más bajo posible. Sin embargo, Compute Engine puede interrumpir las VMs en cualquier momento para recuperar capacidad.

Cargas de trabajo ideales para Spot

Las VMs Spot son ideales para cargas de trabajo en las que se aceptan interrupciones, como las siguientes:

Procesamiento por lotes
Computación de alto rendimiento (HPC)
Integración continua e implementación continua (CI/CD)
Análisis de datos
Codificación de medios
Inferencia en línea

Características clave de Spot

Spot tiene las siguientes características:

Puedes crear cualquier tipo de máquina con GPU, excepto A4X Max y A4X. La asignación densa depende de la disponibilidad de recursos. Para garantizar una asignación más cercana, puedes aplicar una política de posición compacta a las VMs.
Puedes crear VMs inmediatamente. Las VMs se ejecutan hasta que las detienes o las borras, o hasta que Compute Engine las interrumpe para recuperar capacidad.
Usas el modelo de aprovisionamiento spot, que tiene los siguientes beneficios:
- Tienes más probabilidades de obtener GPUs.
- Obtienes un descuento de hasta el 91% para muchos tipos de máquinas, GPU, TPU y discos SSD locales.

Cómo usar Spot

Para usar Spot y crear VMs o clústeres, debes completar los siguientes pasos:

Consulta la disponibilidad de recursos. Puedes ver la disponibilidad de recursos en la región o zona en la que deseas crear VMs Spot. Esta acción ayuda a reducir las posibilidades de que se produzcan errores de disponibilidad de recursos.

Para obtener instrucciones, consulta Cómo ver la disponibilidad de las VMs Spot.
Opcional: Consulta la tarifa y el precio de la prioridad. Puedes ver el precio y la tasa de preemptibilidad históricos y actuales en diferentes tipos de máquinas y zonas. Esta información te ayuda a elegir el tipo de máquina y la ubicación que mejor se adapten a tu carga de trabajo y presupuesto.

Para obtener instrucciones, consulta Cómo ver la tasa de interrupción y los precios de las VMs Spot.
Opcional: Crea una política de posición compacta o una política de cargas de trabajo. Puedes crear una política de posición compacta (para VMs independientes o VMs de forma masiva) o una política de carga de trabajo (para MIGs) para especificar la proximidad de las VM. La configuración que elijas afectará los tipos de máquinas y la cantidad de VMs que admite la política.

Si deseas obtener instrucciones, consulta Reduce la latencia con políticas de posición compactas o Crea políticas de cargas de trabajo para MIGs.
Crea VMs Spot. Puedes crear tantas VMs como quieras, según la disponibilidad. Las VMs se ejecutan hasta que las detienes o las borras, o hasta que Compute Engine las interrumpe para recuperar capacidad.

Para obtener instrucciones, consulta Descripción general de las opciones de implementación.

Elige una opción de consumo Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Comparación de las opciones de consumo

Elige una opción de consumo

Usa reservas futuras en AI Hypercomputer

Cargas de trabajo ideales para las reservas futuras en AI Hypercomputer

Características clave de las reservas futuras en AI Hypercomputer

Cómo usar las reservas futuras en AI Hypercomputer

Cómo usar las reservas futuras en el modo de calendario

Cargas de trabajo ideales para las reservas futuras en modo de calendario

Características clave de las reservas futuras en modo de calendario

Cómo usar las reservas futuras en modo de calendario

Usar el inicio flexible

Cargas de trabajo ideales para el inicio flexible

Características clave del inicio flexible

Cómo usar el inicio flexible

Usar Spot

Cargas de trabajo ideales para Spot

Características clave de Spot

Cómo usar Spot

Elige una opción de consumo