Para ayudarte a ejecutar tus cargas de trabajo, seleccionamos un conjunto de recetas de comparativas reproducibles que usan algunos de los marcos de trabajo y modelos de aprendizaje automático (AA) más comunes. Estos se almacenan en repositorios de GitHub. Para acceder a estos repositorios, consulta Organización de GitHub de AI Hypercomputer. Estas recetas de comparativas se probaron en clústeres creados con Cluster Toolkit.
Descripción general
Antes de comenzar con estas recetas, asegúrate de haber completado los siguientes pasos:
- Elige un acelerador que se adapte mejor a tu carga de trabajo. Consulta Elige una estrategia de implementación.
- Selecciona un método de consumo según el acelerador que elijas. Consulta Opciones de consumo.
- Crea tu clúster según el tipo de acelerador seleccionado. Consulta las guías de implementación de clústeres.
Recetas
Las siguientes recetas de comparativas reproducibles están disponibles para el entrenamiento previo y la inferencia en clústeres de GKE.
Para buscar en el catálogo, puedes filtrar por una combinación de tu framework, modelo y acelerador.
| Nombre de la receta | Acelerador | Modelo | Framework | Tipo de carga de trabajo |
|---|---|---|---|---|
| Llama3.1 70B - A3 Ultra | A3 Ultra | Llama3.1 70B | MaxText | Entrenamiento previo en GKE |
| Llama3.1 70B - A3 Ultra | A3 Ultra | Llama3.1 70B | NeMo | Entrenamiento previo en GKE |
| Mixtral-8-7B - A3 Ultra | A3 Ultra | Mixtral-8-7B | NeMo | Entrenamiento previo en GKE |
| GPT3-175B - A3 Mega | A3 Mega | GPT3-175B | NeMo | Entrenamiento previo en GKE |
| Mixtral 8x7B - A3 Mega | A3 Mega | Mixtral 8x7B | NeMo | Entrenamiento previo en GKE |
| Llama3 70B - A3 Mega | A3 Mega | Llama3 70B | NeMo | Entrenamiento previo en GKE |
| Llama3.1 70B A3 Mega | A3 Mega | Llama3.1 70B | NeMo | Entrenamiento previo en GKE |
| DeepSeek R1 671B | A3 Mega | DeepSeek R1, 671B | SGLang | Inferencia en GKE |
| DeepSeek R1 671B | A3 Mega | DeepSeek R1, 671B | vLLM | Inferencia en GKE |
| Llama-3.1-405B - A3 Ultra | A3 Ultra | Llama-3.1-405B | MaxText | Entrenamiento previo en GKE |
| Llama-3.1-405B - A3 Ultra (Resiliency) | A3 Ultra | Llama-3.1-405B | NeMo | Entrenamiento previo en GKE |
| Llama-3.1-405B - A3 Ultra | A3 Ultra | Llama-3.1-405B | NeMo | Entrenamiento previo en GKE |
| DeepSeek R1 671B | A3 Ultra | DeepSeek R1, 671B | SGLang | Inferencia en GKE |
| DeepSeek R1 671B | A3 Ultra | DeepSeek R1, 671B | vLLM | Inferencia en GKE |