Questo documento fornisce una panoramica dei passaggi necessari per creare un'istanza Compute Engine con unità di elaborazione grafica (GPU) collegate. Puoi utilizzare le GPU per accelerare carichi di lavoro specifici, come machine learning ed elaborazione di dati.
Puoi anche utilizzare alcuni tipi di macchine GPU su AI Hypercomputer. AI Hypercomputer è un sistema di supercomputing ottimizzato per supportare i workload di intelligenza artificiale (AI) e machine learning (ML). Questa opzione è consigliata per creare un'infrastruttura densamente allocata e ottimizzata per le prestazioni che dispone di integrazioni per Google Kubernetes Engine (GKE) e gli scheduler Slurm.
Per saperne di più sulle GPU su Compute Engine, consulta Informazioni sulle GPU.
Seleziona il modello di GPU
Per un elenco dei modelli di GPU disponibili, consulta Piattaforme GPU. Prendi nota anche del tipo di macchina supportato per il modello di GPU selezionato.
Per ogni modello, potrebbe essere utile esaminare anche quanto segue:
- Regioni e zone supportate.
- Prezzi delle GPU per conoscere il costo dell'utilizzo di ciascun modello di GPU sulle istanze. Per le istanze che utilizzano macchine ottimizzate per l'acceleratore, consulta anche i prezzi delle istanze VM.
Limitazioni
Oltre alle limitazioni per tutte le istanze con GPU, ogni serie di macchine con GPU collegate presenta le seguenti limitazioni:
Istanze A4X
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A4X.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A4X.
- Puoi utilizzare un tipo di macchina A4X solo in alcune regioni e zone.
- Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A4X.
- Il tipo di macchina A4X è disponibile solo sulla piattaforma NVIDIA Grace.
- Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A4X. Puoi creare solo nuove istanze A4X. Dopo aver creato un'istanza utilizzando un tipo di macchina A4X, non puoi modificare il tipo di macchina.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4X.
- Le istanze A4X non supportano:
Istanze A4
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A4.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A4.
- Puoi utilizzare un tipo di macchina A4 solo in alcune regioni e zone.
- Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A4.
- Il tipo di macchina A4 è disponibile solo sulla piattaforma CPU Emerald Rapids.
- Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A4. Puoi creare solo nuove istanze A4. Dopo aver creato un'istanza utilizzando un tipo di macchina A4, non puoi modificare il tipo di macchina.
- I tipi di macchine A4 non supportano la modalità single-tenancy.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4.
Istanze A3 Ultra
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 Ultra.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Ultra.
- Puoi utilizzare un tipo di macchina A3 Ultra solo in alcune regioni e zone.
- Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A3 Ultra.
- Il tipo di macchina A3 Ultra è disponibile solo sulla piattaforma CPU Emerald Rapids.
- Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 Ultra. Puoi creare solo nuove istanze A3-ultra. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 Ultra, non puoi modificare il tipo di macchina.
- I tipi di macchine A3 Ultra non supportano la modalità single-tenancy.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Ultra.
Istanze A3 Mega
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 Mega.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Mega.
- Puoi utilizzare un tipo di macchina A3 Mega solo in alcune regioni e zone.
- Non puoi utilizzare i Persistent Disk a livello di regione su un'istanza che utilizza un tipo di macchina A3 Mega.
- Il tipo di macchina A3 Mega è disponibile solo sulla piattaforma CPU Sapphire Rapids.
- Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 Mega. Puoi creare solo nuove istanze A3-mega. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 Mega, non puoi modificare il tipo di macchina.
- I tipi di macchine A3 Mega non supportano la modalità single-tenancy.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Mega.
Istanze A3 High
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 High.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 High.
- Puoi utilizzare un tipo di macchina A3 High solo in alcune regioni e zone.
- Non puoi utilizzare i Persistent Disk a livello di regione su un'istanza che utilizza un tipo di macchina A3 High.
- Il tipo di macchina A3 High è disponibile solo sulla piattaforma CPU Sapphire Rapids.
- Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 High. Puoi creare solo nuove istanze A3. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 High, non puoi modificare il tipo di macchina.
- I tipi di macchine A3 High non supportano la modalità single-tenancy.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 High.
- Per i tipi di macchine
a3-highgpu-1g
,a3-highgpu-2g
ea3-highgpu-4g
, devi creare istanze utilizzando VM spot o VM flessibili. Per istruzioni dettagliate su queste opzioni, consulta quanto segue:- Per creare VM spot, imposta il modello di provisioning su
SPOT
quando crei una VM ottimizzata per l'acceleratore. - Per creare VM con avvio flessibile, puoi utilizzare uno dei seguenti metodi:
- Crea una VM autonoma e imposta il modello di provisioning su
FLEX_START
quando crei una VM ottimizzata per l'acceleratore. - Crea una richiesta di ridimensionamento in un gruppo di istanze gestite (MIG). Per istruzioni, vedi Crea un MIG con VM GPU.
- Crea una VM autonoma e imposta il modello di provisioning su
- Per creare VM spot, imposta il modello di provisioning su
- Puoi utilizzare una
Confidential VM
con un tipo di macchina
a3-highgpu-1g
in regioni e zone limitate e si applicano tutte le limitazioni per Confidential VM in esecuzione sul tipo di macchina A3 High.
Istanze A3 Edge
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 Edge.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Edge.
- Puoi utilizzare un tipo di macchina A3 Edge solo in alcune regioni e zone.
- Non puoi utilizzare i Persistent Disk a livello di regione su un'istanza che utilizza un tipo di macchina A3 Edge.
- Il tipo di macchina A3 Edge è disponibile solo sulla piattaforma CPU Sapphire Rapids.
- Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 Edge. Puoi creare solo nuove istanze A3-edge. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 Edge, non puoi modificare il tipo di macchina.
- I tipi di macchine A3 Edge non supportano la modalità single-tenancy.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Edge.
Istanze A2 Standard
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A2 Standard.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A2 Standard.
- Puoi utilizzare un tipo di macchina A2 Standard solo in alcune regioni e zone.
- Il tipo di macchina A2 Standard è disponibile solo sulla piattaforma Cascade Lake.
- Se la tua istanza utilizza un tipo di macchina A2 Standard, puoi passare solo da un tipo di macchina A2 Standard a un altro tipo di macchina A2 Standard. Non puoi passare a un altro tipo di macchina. Per ulteriori informazioni, consulta Modifica le istanze ottimizzate per l'acceleratore.
- Non puoi utilizzare il sistema operativo Windows con i tipi di macchine A2 Standard
a2-megagpu-16g
. Quando utilizzi sistemi operativi Windows, scegli un tipo di macchina A2 Standard diverso. - Non puoi formattare rapidamente le unità SSD locali collegate sulle istanze Windows che utilizzano i tipi di macchine A2 Standard.
Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità
diskpart e specificando
format fs=ntfs label=tmpfs
. - I tipi di macchine A2 Standard non supportano la modalità single-tenancy.
Istanze A2 Ultra
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A2 Ultra.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A2 Ultra.
- Puoi utilizzare un tipo di macchina A2 Ultra solo in alcune regioni e zone.
- Il tipo di macchina A2 Ultra è disponibile solo sulla piattaforma Cascade Lake.
- Se la tua istanza utilizza un tipo di macchina A2 Ultra, non puoi modificarlo. Se devi utilizzare un altro tipo di macchina A2 Ultra o qualsiasi altro tipo di macchina, devi creare una nuova istanza.
- Non puoi modificare un altro tipo di macchina in un tipo A2 Ultra. Se hai bisogno di un'istanza che utilizzi un tipo di macchina A2 Ultra, devi crearne una nuova.
- Non puoi formattare rapidamente le unità SSD locali collegate sulle istanze Windows che utilizzano i tipi di macchine
A2 Ultra. Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità
diskpart e specificando
format fs=ntfs label=tmpfs
.
Istanze G4
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina G4.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina G4.
- Puoi utilizzare un tipo di macchina G4 solo in alcune regioni e zone.
- Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina G4.
- Il tipo di macchina G4 è disponibile solo sulla piattaforma AMD EPYC Turin di quinta generazione.
- Puoi creare solo istanze on demand. Le prenotazioni, le VM con avvio flessibile o le VM spot non sono supportate. Per iniziare a utilizzare le istanze G4, contatta il tuo team dell'account Google.
- Puoi creare istanze G4 solo in
us-central1-b
. - Puoi utilizzare solo i tipi di disco Hyperdisk Balanced e Hyperdisk Extreme su un'istanza che utilizza un tipo di macchina G4.
- Non puoi applicare sconti per impegno di utilizzo alle istanze che utilizzano un tipo di macchina G4.
- Non puoi creare istanze Confidential VM che utilizzano un tipo di macchina G4.
- Non puoi creare istanze G4 su nodi single-tenant.
- Non puoi creare istanze G4 che utilizzano la workstation virtuale (vWS) NVIDIA RTX.
Istanze G2
- Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina G2.
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina G2.
- Puoi utilizzare un tipo di macchina G2 solo in alcune regioni e zone.
- Il tipo di macchina G2 è disponibile solo sulla piattaforma Cascade Lake.
- Il disco permanente standard (
pd-standard
) non è supportato nelle istanze che utilizzano il tipo di macchina G2. Per i tipi di dischi supportati, consulta Tipi di dischi supportati per G2. - Non puoi creare GPU multi-istanza su un'istanza che utilizza un tipo di macchina G2.
- Se devi modificare il tipo di macchina di un'istanza G2, consulta Modifica le istanze ottimizzate per l'acceleratore.
- Non puoi utilizzare Deep Learning VM Images come dischi di avvio per le istanze che utilizzano il tipo di macchina G2.
- L'attuale driver predefinito per Container-Optimized OS non supporta le GPU L4 in esecuzione su
tipi di macchine G2. Inoltre, Container-Optimized OS supporta solo un insieme selezionato di driver.
Se vuoi utilizzare Container-Optimized OS sui tipi di macchine G2, consulta le seguenti note:
- Utilizza una versione di Container-Optimized OS che supporti la versione minima consigliata
del driver NVIDIA
525.60.13
o successive. Per ulteriori informazioni, consulta le note di rilascio di Container-Optimized OS. - Quando installi il driver,
specifica la versione più recente disponibile adatta alle GPU L4.
Ad esempio,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Utilizza una versione di Container-Optimized OS che supporti la versione minima consigliata
del driver NVIDIA
- Devi utilizzare Google Cloud CLI o REST per
creare istanze G2
per i seguenti scenari:
- Specifica i valori di memoria personalizzati.
- Personalizza il numero di core della CPU visibili.
Istanze N1+GPU
Per saperne di più sulle limitazioni delle istanze N1 con GPU, consulta le funzionalità per la serie di macchine N1 e le GPU per la serie di macchine N1.
Scegli un sistema operativo
Se utilizzi GPU per il machine learning, utilizza uno dei seguenti sistemi operativi:
Immagini ottimizzate per i workload di AI. Puoi utilizzare le immagini Ubuntu e Rocky, disponibili in versioni ottimizzate per l'acceleratore con i driver NVIDIA e il toolkit CUDA preinstallati. Consulta la sezione Immagini sistema operativo nella documentazione di AI Hypercomputer.
Deep Learning VM Image. Ogni VM di deep learning dispone di uno strumento di installazione del driver GPU e include pacchetti come TensorFlow e PyTorch. Puoi anche utilizzare una VM di deep learning per workload GPU generici. Per saperne di più sulle immagini e sui pacchetti disponibili installati su queste immagini, consulta Scegliere un'immagine nella documentazione di Deep Learning VM.
In alternativa, puoi utilizzare un'immagine pubblica o personalizzata. Per la maggior parte delle immagini pubbliche o immagini personalizzate, devi installare i driver NVIDIA e il toolkit CUDA. Per identificare i driver appropriati per il tuo modello di GPU, consulta la sezione sull'installazione dei driver GPU.
Controlla la quota di GPU
Per proteggere gli utenti e i sistemi Compute Engine, i nuovi progetti hanno una quota di GPU globale che limita il numero totale di GPU che puoi creare in qualsiasi zona supportata. Per esaminare la quota di GPU, consulta Quota di GPU.
Se hai bisogno di una quota di GPU aggiuntiva, richiedi un aumento della quota. Quando richiedi una quota di GPU, devi richiederne una per i tipi di GPU che vuoi creare in ciascuna regione e una globale aggiuntiva per il numero totale di GPU di tutti i tipi in tutte le zone.
Se il tuo progetto ha una cronologia della fatturazione stabilita, riceverà la quota automaticamente dopo l'invio della richiesta.
Istanze GPU e quote di allocazione preemptible
Le istanze che utilizzano il modello di provisioning standard in genere non possono utilizzare le quote di allocazione prerilasciabili. Le quote prerilasciabili sono per carichi di lavoro temporanei e sono generalmente più disponibili. Se il tuo progetto non dispone di una quota prerilasciabile e non l'hai mai richiesta, tutte le istanze del tuo progetto utilizzano le quote di allocazione standard.
Se richiedi una quota di allocazione preemptive, le istanze che utilizzano il modello di provisioning standard devono soddisfare tutti i seguenti criteri per utilizzare la quota di allocazione preemptive:
- Le istanze hanno GPU collegate.
- Le istanze sono configurate per essere eliminate automaticamente dopo un tempo di esecuzione predefinito
tramite il campo
maxRunDuration
oterminationTime
. Per ulteriori informazioni, consulta quanto segue: - L'istanza non è autorizzata a utilizzare le prenotazioni. Per saperne di più, vedi Previeni il consumo delle prenotazioni da parte delle istanze di computing.
Quando utilizzi l'allocazione prerilasciabile per i carichi di lavoro GPU con limiti di tempo, puoi beneficiare sia del tempo di esecuzione ininterrotto sia dell'elevata ottenibilità della quota di allocazione prerilasciabile. Per ulteriori informazioni, consulta Quote prerilasciabili.
Crea un'istanza con GPU collegate
Per creare un'istanza con GPU collegate, completa i seguenti passaggi:
Crea l'istanza. Il metodo utilizzato per creare un'istanza dipende dal modello di GPU selezionato.
- Per creare un'istanza con Superchip NVIDIA GB200 Grace Blackwell collegati, consulta Panoramica delle opzioni di deployment nella documentazione di AI Hypercomputer.
- Per creare un'istanza con GPU NVIDIA B200 o H200 collegate, consulta Crea un'istanza A3 Ultra o A4.
- Per creare un'istanza con GPU NVIDIA H100, A100 o L4 collegate, consulta Crea un'istanza A3, A2 o G2.
- Per informazioni su come iniziare a utilizzare le istanze G4 con GPU NVIDIA RTX PRO 6000 collegate, contatta il team del tuo Account Google.
- Per creare un'istanza con GPU NVIDIA T4, P4, P100 o V100 collegate, consulta Crea un'istanza N1 con GPU collegate.
Affinché l'istanza utilizzi la GPU, devi installare il driver della GPU sull'istanza. Se hai attivato una workstation virtuale NVIDIA RTX (precedentemente nota come NVIDIA GRID), installa un driver per la workstation virtuale.
Passaggi successivi
Scopri di più sulle piattaforme GPU.
Scopri di più sulle funzionalità e limitazioni dell'utilizzo delle GPU.