Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Panoramica delle opzioni di deployment

Per eseguire workload di intelligenza artificiale (AI), machine learning (ML) o computing ad alte prestazioni (HPC), puoi eseguire il deployment di istanze e cluster Compute Engine ottimizzati per l'AI che utilizzano macchine A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU). Per saperne di più sulle funzionalità di queste macchine che ti consentono di eseguire cluster di AI e ML su larga scala, consulta Panoramica della gestione dei cluster.

Puoi creare istanze A4X, A4, A3 Ultra, A3 Mega e A3 High (8 GPU) direttamente da Compute Engine o tramite altri servizi eseguiti su istanze Compute Engine come Cluster Toolkit o Google Kubernetes Engine.

Per l'opzione più appropriata per creare le istanze di computing o i cluster per il tuo caso d'uso, scegli una delle seguenti opzioni:

Opzione	Caso d'uso
Cluster Director	Vuoi un servizio completamente gestito che automatizzi la configurazione dei cluster Slurm. Cluster Director ti aiuta a configurare le risorse di calcolo, networking e archiviazione per i tuoi cluster in modo da massimizzare le prestazioni e ridurre al minimo i tempi di inattività. Per saperne di più, vedi Crea un cluster Slurm completamente gestito per i carichi di lavoro di AI.
Cluster Toolkit	Vuoi utilizzare un software open source che semplifichi la procedura per eseguire il deployment dei cluster Slurm e GKE. Cluster Toolkit è progettato per essere altamente personalizzabile ed estensibile. Puoi utilizzare i blueprint per eseguire il provisioning delle risorse di rete e di archiviazione. Per scoprire di più, consulta le seguenti risorse: Crea un cluster Slurm autogestito per i carichi di lavoro AI Crea un cluster Google Kubernetes Engine ottimizzato per l'AI con la configurazione predefinita
GKE	Vuoi la massima flessibilità nella configurazione del cluster Google Kubernetes Engine in base alle esigenze del tuo workload. Per saperne di più, consulta Crea un cluster Google Kubernetes Engine personalizzato ottimizzato per l'AI.
Utilizzare Compute Engine	Vuoi il controllo completo del livello dell'infrastruttura per poter configurare il tuo orchestratore. Per saperne di più, consulta le seguenti risorse: Crea un'istanza ottimizzata per l'AI Crea A4X Max Crea A4X Crea A4 o A3 Ultra Crea A3 Mega o A3 High Crea istanze ottimizzate per l'AI in blocco Crea A4X Max Crea A4X Crea A4 o A3 Ultra Crea A3 Mega o A3 High Crea un gruppo di istanze gestite (MIG) ottimizzato per l'AI Crea A4X Max Crea A4X Crea A4 o A3 Ultra Crea A3 Mega o A3 High

Passaggi successivi

Scopri di più sull'infrastruttura ottimizzata per le prestazioni di AI Hypercomputer:

Panoramica delle opzioni di deployment Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Passaggi successivi

Panoramica delle opzioni di deployment