Pour exécuter des charges de travail d'intelligence artificielle (IA), de machine learning (ML) ou de calcul hautes performances (HPC), vous pouvez déployer des VM optimisées pour l'IA et des clusters de machines A4X, A4, A3 Ultra, A3 Mega et A3 High (8 GPU). Pour en savoir plus sur les fonctionnalités de ces machines qui vous permettent d'exécuter des clusters d'IA/de ML à grande échelle, consultez la présentation de la gestion des clusters.
Vous pouvez créer des VM A4X, A4, A3 Ultra, A3 Mega et A3 High (8 GPU) directement à partir de Compute Engine, ou via d'autres services qui s'exécutent sur des instances Compute Engine, comme Cluster Toolkit ou Google Kubernetes Engine.
Pour choisir l'option la plus appropriée pour créer vos VM ou clusters en fonction de votre cas d'utilisation, sélectionnez l'une des options suivantes :
| Option | Cas d'utilisation |
|---|---|
| Cluster Director | Vous souhaitez bénéficier d'un service entièrement géré qui automatise la configuration de vos clusters Slurm. Cluster Director vous aide à configurer les ressources de calcul, de réseau et de stockage de vos clusters pour maximiser les performances et minimiser les temps d'arrêt. Pour en savoir plus, consultez Créer un cluster optimisé pour l'IA à partir d'un modèle. |
| Cluster Toolkit | Vous souhaitez utiliser un logiciel Open Source qui simplifie le processus de déploiement des clusters Slurm et GKE. Cluster Toolkit est conçu pour être hautement personnalisable et extensible. Pour en savoir plus, consultez les ressources suivantes : |
| GKE | Vous souhaitez une flexibilité maximale pour configurer votre cluster Google Kubernetes Engine en fonction des besoins de votre charge de travail. Pour en savoir plus, consultez Créer un cluster Google Kubernetes Engine personnalisé et optimisé pour l'IA. |
| Utiliser Compute Engine | Vous souhaitez contrôler entièrement la couche d'infrastructure pour pouvoir configurer votre propre orchestrateur. Pour en savoir plus, consultez la ressource suivante :
|