Para ajudar você a executar suas cargas de trabalho, selecionamos um conjunto de receitas de comparativos reproduzíveis que usam alguns dos frameworks e modelos de machine learning (ML) mais comuns. Eles são armazenados em repositórios do GitHub. Para acessar esses repositórios, consulte Organização do GitHub do hipercomputador de IA. Essas receitas de comparativo de mercado foram testadas em clusters criados com o Cluster Toolkit.
Visão geral
Antes de começar a usar essas receitas, verifique se você concluiu as etapas a seguir:
- Escolha um acelerador que seja mais adequado para sua carga de trabalho. Consulte Escolher uma estratégia de implantação.
- Selecione um método de consumo com base no acelerador escolhido. Consulte Opções de consumo.
- Crie o cluster com base no tipo de acelerador selecionado. Consulte Guias de implantação de clusters.
Receitas
As seguintes receitas de comparativo reprodutíveis estão disponíveis para pré-treinamento e inferência em clusters do GKE.
Para pesquisar no catálogo, filtre por uma combinação de framework, modelo e acelerador.
| Nome da receita | Acelerador | Modelo | Framework | Tipo de carga de trabalho |
|---|---|---|---|---|
| Llama3.1 70B - A3 Ultra | A3 Ultra | Llama3.1 70B | MaxText | Pré-treinamento no GKE |
| Llama3.1 70B - A3 Ultra | A3 Ultra | Llama3.1 70B | NeMo | Pré-treinamento no GKE |
| Mixtral-8-7B - A3 Ultra | A3 Ultra | Mixtral 8x7B | NeMo | Pré-treinamento no GKE |
| GPT3-175B - A3 Mega | A3 Mega | GPT3-175B | NeMo | Pré-treinamento no GKE |
| Mixtral 8x7B - A3 Mega | A3 Mega | Mixtral 8x7B | NeMo | Pré-treinamento no GKE |
| Llama3 70B - A3 Mega | A3 Mega | Llama3 70B | NeMo | Pré-treinamento no GKE |
| Llama3.1 70B A3 Mega | A3 Mega | Llama3.1 70B | NeMo | Pré-treinamento no GKE |
| DeepSeek R1 671B | A3 Mega | DeepSeek R1 671B | SGLang | Inferência no GKE |
| DeepSeek R1 671B | A3 Mega | DeepSeek R1 671B | vLLM | Inferência no GKE |
| Llama-3.1-405B - A3 Ultra | A3 Ultra | Llama-3.1-405B | MaxText | Pré-treinamento no GKE |
| Llama-3.1-405B - A3 Ultra (resiliência) | A3 Ultra | Llama-3.1-405B | NeMo | Pré-treinamento no GKE |
| Llama-3.1-405B - A3 Ultra | A3 Ultra | Llama-3.1-405B | NeMo | Pré-treinamento no GKE |
| DeepSeek R1 671B | A3 Ultra | DeepSeek R1 671B | SGLang | Inferência no GKE |
| DeepSeek R1 671B | A3 Ultra | DeepSeek R1 671B | vLLM | Inferência no GKE |