Para ejecutar cargas de trabajo de inteligencia artificial (IA), aprendizaje automático (AA) o computación de alto rendimiento (HPC), puedes implementar VMs optimizadas para IA y clústeres de máquinas A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs). Para obtener más información sobre las funciones de estas máquinas que te permiten ejecutar clústeres de IA/AA a gran escala, consulta la Descripción general de la administración de clústeres.
Puedes crear VMs A4X, A4, A3 Ultra, A3 Mega y A3 High (8 GPUs) directamente desde Compute Engine o a través de otros servicios que se ejecutan en instancias de Compute Engine, como Cluster Toolkit o Google Kubernetes Engine.
Para elegir la opción más adecuada para crear tus VMs o clústeres para tu caso de uso, elige una de las siguientes:
| Opción | Caso práctico |
|---|---|
| Cluster Director | Deseas un servicio completamente administrado que automatice la configuración de tus clústeres de Slurm. Cluster Director te ayuda a configurar recursos de procesamiento, redes y almacenamiento para tus clústeres, de modo que puedas maximizar el rendimiento y minimizar los tiempos de inactividad. Para obtener más información, consulta Crea un clúster optimizado para IA basado en una plantilla. |
| Cluster Toolkit | Quieres usar software de código abierto que simplifique el proceso para implementar clústeres de Slurm y GKE. Cluster Toolkit está diseñado para ser altamente personalizable y extensible. Para obtener más información, consulta lo siguiente: |
| GKE | Deseas tener la máxima flexibilidad para configurar tu clúster de Google Kubernetes Engine según las necesidades de tu carga de trabajo. Para obtener más información, consulta Cómo crear un clúster personalizado de Google Kubernetes Engine optimizado para IA. |
| Usa Compute Engine | Quieres tener el control total de la capa de infraestructura para poder configurar tu propio orquestador. Para obtener más información, consulta lo siguiente:
|