Per eseguire workload di intelligenza artificiale (AI), machine learning (ML) o computing ad alte prestazioni (HPC), puoi eseguire il deployment di VM e cluster ottimizzati per l'AI di macchine A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU). Per saperne di più sulle funzionalità di queste macchine che ti consentono di eseguire cluster AI/ML su larga scala, consulta Panoramica della gestione dei cluster.
Puoi creare VM A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU) direttamente da Compute Engine o tramite altri servizi eseguiti su istanze Compute Engine come Cluster Toolkit o Google Kubernetes Engine.
Per l'opzione più appropriata per creare le VM o i cluster per il tuo caso d'uso, scegli una delle seguenti opzioni:
| Opzione | Caso d'uso |
|---|---|
| Cluster Director | Vuoi un servizio completamente gestito che automatizzi la configurazione dei cluster Slurm. Cluster Director ti aiuta a configurare le risorse di calcolo, networking e archiviazione per i tuoi cluster in modo da massimizzare le prestazioni e ridurre al minimo i tempi di inattività. Per saperne di più, vedi Crea un cluster ottimizzato per l'AI basato su un template. |
| Cluster Toolkit | Vuoi utilizzare un software open source che semplifichi la procedura per eseguire il deployment dei cluster Slurm e GKE. Cluster Toolkit è progettato per essere altamente personalizzabile ed estensibile. Per saperne di più, consulta le seguenti risorse: |
| GKE | Vuoi la massima flessibilità nella configurazione del cluster Google Kubernetes Engine in base alle esigenze del tuo workload. Per saperne di più, consulta Crea un cluster Google Kubernetes Engine personalizzato ottimizzato per l'AI. |
| Utilizzare Compute Engine | Vuoi il controllo completo del livello dell'infrastruttura per poter configurare il tuo orchestratore. Per saperne di più, consulta le seguenti risorse:
|