Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Panoramica di AI Hypercomputer

AI Hypercomputer è un sistema di supercomputing ottimizzato per supportare i workload di intelligenza artificiale (AI) e machine learning (ML). Si tratta di un sistema integrato di hardware ottimizzato per le prestazioni, software open, framework ML e modelli di consumo flessibili.

Il sistema AI Hypercomputer incorpora best practice e progettazione a livello di sistema per aumentare l'efficienza e la produttività durante il pre-addestramento, l'ottimizzazione e la distribuzione dell'AI.

Architettura di sistema

AI Hypercomputer è composto dai seguenti livelli:

Infrastruttura ottimizzata per il rendimento: contiene risorse di accelerazione, networking e archiviazione che forniscono le funzionalità di computing per supportare i tuoi carichi di lavoro.
Software open source: versioni ottimizzate di framework di machine learning popolari come TensorFlow, PyTorch e JAX. Google fornisce sistemi operativi configurati con software essenziali per sfruttare le risorse di calcolo di cui è stato eseguito il provisioning nei cluster. Per eseguire il deployment e gestire un numero elevato di acceleratori come singola unità, puoi utilizzare Cluster Director, Google Kubernetes Engine o Slurm. In alternativa, puoi eseguire il deployment manuale delle risorse utilizzando le API Compute Engine.
Opzioni di consumo: diverse opzioni per il provisioning dei cluster che ottimizzano i costi e la disponibilità hardware in base alle tue esigenze specifiche e ai modelli di workload.

Vantaggi

AI Hypercomputer offre i seguenti vantaggi:

Rendimento e goodput elevati: le metriche di goodput misurano la produttività di ML. AI Hypercomputer ottimizza i livelli di pianificazione, runtime e orchestrazione.
Inizia a lavorare rapidamente: AI Hypercomputer fornisce strumenti come Cluster Director e blueprint che ti consentono di eseguire il deployment in modo affidabile e ripetuto di un numero elevato di risorse ottimizzate per l'acceleratore configurate per supportare i tuoi carichi di lavoro di AI e ML più impegnativi.
Livello di archiviazione ottimizzato per le prestazioni: utilizza servizi di archiviazione ad alte prestazioni, come Cloud Storage e Google Cloud Managed Lustre, per fornire spazio di archiviazione scalabile, con throughput elevato e a bassa latenza per i carichi di lavoro AI e ML.

Casi d'uso

AI Hypercomputer è stato progettato per soddisfare le esigenze dei seguenti casi d'uso:

Caso d'uso	Carichi di lavoro di esempio
Workload di AI e ML su larga scala	Addestramento distribuito dell'IA generativa Inferenza dell'AI generativa Rilevamento di frodi Modelli per i suggerimenti
Computing ad alte prestazioni (HPC)	Simulazioni complesse Scoperta di farmaci, folding delle proteine e analisi genomica Analisi del rischio e trading quantitativo

Caso d'uso

Carichi di lavoro di esempio

Workload di AI e ML su larga scala

Addestramento distribuito dell'IA generativa

Inferenza dell'AI generativa

Rilevamento di frodi

Modelli per i suggerimenti

Computing ad alte prestazioni (HPC)

Simulazioni complesse

Scoperta di farmaci, folding delle proteine e analisi genomica

Analisi del rischio e trading quantitativo

Passaggi successivi

Scopri di più sull'infrastruttura ottimizzata per le prestazioni di AI Hypercomputer:
Esamina i modelli di consumo.
Scopri di più sulla gestione dei cluster.

Panoramica di AI Hypercomputer Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.