Visão geral das opções de implantação

Para executar cargas de trabalho de inteligência artificial (IA), machine learning (ML) ou computação de alto desempenho (HPC), implante VMs e clusters otimizados para IA de máquinas A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs). Para mais informações sobre os recursos dessas máquinas que permitem executar clusters de IA/ML em grande escala, consulte Visão geral do gerenciamento de clusters.

É possível criar VMs A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPUs) diretamente no Compute Engine ou em outros serviços executados em instâncias do Compute Engine, como o Cluster Toolkit ou o Google Kubernetes Engine.

Para a opção mais adequada de criar VMs ou clusters para seu caso de uso, escolha uma das seguintes opções:

Opção Caso de uso
Cluster Director Você quer um serviço totalmente gerenciado que automatize a configuração e configuração dos clusters do Slurm. O Cluster Director ajuda você a configurar recursos de computação, rede e armazenamento para seus clusters, a fim de maximizar o desempenho e minimizar os tempos de inatividade. Para saber mais, consulte Criar um cluster otimizado para IA com base em um modelo.
Cluster Toolkit

Você quer usar um software de código aberto que simplifique o processo de implantação de clusters do Slurm e do GKE. O Cluster Toolkit foi projetado para ser altamente personalizável e extensível. Para saber mais, consulte:

GKE Você quer ter a máxima flexibilidade na configuração do cluster do Google Kubernetes Engine com base nas necessidades da sua carga de trabalho. Para saber mais, consulte Criar um cluster personalizado do Google Kubernetes Engine otimizado para IA.
Usar o Compute Engine

Você quer ter controle total da camada de infraestrutura para configurar seu próprio orquestrador. Para saber mais, consulte: