Para executar cargas de trabalho de inteligência artificial (IA), aprendizado de máquina (ML) ou computação de alta performance (HPC), implante instâncias e clusters do Compute Engine otimizados para IA que usam máquinas A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs). Para mais informações sobre os recursos dessas máquinas que permitem executar clusters de IA e ML em grande escala, consulte Visão geral do gerenciamento de clusters.
É possível criar instâncias A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs) diretamente no Compute Engine ou em outros serviços executados em instâncias do Compute Engine, como o Cluster Toolkit ou o Google Kubernetes Engine.
Para a opção mais adequada para criar instâncias ou clusters de computação para seu caso de uso, escolha uma das seguintes:
| Opção | Caso de uso |
|---|---|
| Cluster Director | Você quer um serviço totalmente gerenciado que automatize a configuração dos clusters do Slurm. O Cluster Director ajuda a configurar recursos de computação, rede e armazenamento para seus clusters, a fim de maximizar a performance e minimizar as inatividade. Para saber mais, consulte Criar um cluster do Slurm totalmente gerenciado para cargas de trabalho de IA. |
| Cluster Toolkit | Você quer usar um software de código aberto que simplifique o processo para você implantar clusters do Slurm e do GKE. O Cluster Toolkit foi projetado para ser altamente personalizável e extensível. Para saber mais, consulte: |
| GKE | Você quer flexibilidade máxima na configuração do cluster do Google Kubernetes Engine com base nas necessidades da sua carga de trabalho. Para saber mais, consulte Criar um cluster do Google Kubernetes Engine personalizado otimizado para IA. |
| Usar o Compute Engine | Você quer controle total da camada de infraestrutura para poder configurar seu próprio orquestrador. Para saber mais, consulte:
|