GPU disponibili

Le GPU vengono utilizzate per accelerare i workload e Cloud Workstations supporta l'allegato di GPU alle workstation. Cloud Workstations supporta molti dei vari modelli di GPU che possono essere collegati alle VM di Compute Engine. Il modello e la quantità di GPU da collegare a ogni workstation sono specificati nella configurazione della workstation. Cloud Workstations gestisce il collegamento delle GPU e l'installazione dei relativi driver di dispositivo.

Il collegamento di GPU alle workstation influirà sui costi, come descritto nella panoramica dei prezzi di Cloud Workstations.

Limitazioni

Una configurazione della workstation può specificare le GPU, nel rispetto delle seguenti limitazioni:

  • Cloud Workstations supporta le GPU solo per le configurazioni che specificano i tipi di macchine nelle serie di macchine N1, nelle serie di macchine A2 o nelle serie di macchine A3. Per maggiori dettagli, consulta i modelli di GPU supportati.
  • La configurazione deve specificare le zone di replica in cui è disponibile il modello di GPU scelto.
  • Non è possibile configurare le workstation in modo che abbiano più di un modello di GPU collegato contemporaneamente.
  • Le configurazioni che specificano i tipi di macchine A2 Ultra non devono specificare l'archiviazione permanente. Se è necessario uno spazio di archiviazione file permanente, valuta la possibilità di utilizzare una soluzione basata su NFS come Filestore o Cloud Storage FUSE. Tieni presente che i tipi di macchine A2 Standard supportano l'archiviazione permanente. Per creare configurazioni senza spazio di archiviazione permanente, utilizza questo comando Google Cloud CLI:

      gcloud workstations configs create CONFIG_NAME \
        --project=PROJECT_ID \
        --cluster=CLUSTER_NAME \
        --region=LOCATION \
        --machine-type=A2_MACHINE_TYPE \
        --no-persistent-storage
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del progetto che contiene la configurazione della workstation.
    • LOCATION: la regione del cluster di workstation.
    • CLUSTER_NAME: il nome del cluster di workstation che contiene la configurazione della workstation.
    • CONFIG_NAME: il nome della configurazione della workstation.
    • A2_MACHINE_TYPE: il tipo di macchina A2.
  • Le configurazioni che specificano i tipi di macchine A3 supportano solo i volumi permanenti Hyperdisk.

  • L'utilizzo dei tipi di disco Google Cloud Hyperdisk è supportato solo nelle seguenti serie di macchine:

    • A3
    • C3
    • C4
    • G4
    • M3
    • N4
    • N4D
    • Z3

Modelli di GPU supportati

Cloud Workstations supporta molti dei modelli di GPU resi disponibili da Compute Engine. I modelli supportati dipendono dalla serie di macchine scelta per la configurazione della workstation, come riassunto nella tabella seguente.

Serie di macchine N1

La serie di macchine per uso generico N1 supporta diversi modelli di GPU e le configurazioni delle workstation che specificano uno qualsiasi dei tipi di macchine N1 possono specificare anche uno dei seguenti modelli di GPU. Per il modello di GPU scelto, la configurazione può specificare un conteggio di quante schede GPU collegare a ogni workstation.

Modello di GPU Conteggi GPU
NVIDIA T4 (nvidia-tesla-t4) 1, 2 o 4 GPU
NVIDIA P4 (nvidia-tesla-p4) 1, 2 o 4 GPU
NVIDIA V100 (nvidia-tesla-v100) 1, 2, 4 o 8 GPU
NVIDIA P100 (nvidia-tesla-p100) 1, 2 o 4 GPU

Serie di macchine A2

La serie di macchine A2 standard ottimizzate per l'acceleratore ha un numero fisso di GPU NVIDIA A100 collegate, in base esclusivamente al tipo di macchina scelto.

La tabella seguente mostra il mapping dal tipo di macchina al numero di schede che verranno collegate.

Modello di GPU Tipo di macchina Conteggio GPU
NVIDIA A100 40GB (nvidia-tesla-a100) a2-highgpu-1g 1 GPU
a2-highgpu-2g 2 GPU
a2-highgpu-4g 4 GPU
a2-highgpu-8g 8 GPU
a2-megagpu-16g 16 GPU

Cloud Workstations non supporta i tipi di macchine A2 ultra.

Serie di macchine A3

La serie di macchine A3 Mega e A3 High ottimizzate per l'acceleratore ha un numero fisso di GPU NVIDIA H100 collegate, in base esclusivamente al tipo di macchina scelto.

La tabella seguente mostra il mapping dal tipo di macchina al numero di schede che verranno collegate.

Modello di GPU Tipo di macchina Conteggio GPU
NVIDIA H100 da 80 GB (nvidia-tesla-h100) a3-highgpu-1g 1 GPU
a3-highgpu-2g 2 GPU
a3-highgpu-4g 4 GPU
a3-highgpu-8g 8 GPU
a3-megagpu-8g 8 GPU

Supporto di Google Cloud Hyperdisk

Alcuni workload della GPU richiedono una velocità effettiva del disco molto elevata. Per soddisfare questo caso d'uso, Cloud Workstations consente l'utilizzo di dischi Google Cloud Hyperdisk bilanciati ad alta affidabilità come directory permanenti per i tipi di macchine elencati in precedenza.

L'archiviazione Hyperdisk può essere configurata sia tramite la console che con la CLI gcloud. Non è possibile modificare il tipo di disco dopo aver creato una configurazione della workstation.

Il collegamento di un disco Hyperdisk a una workstation influirà sui costi come descritto in Prezzi di Google Cloud Hyperdisk.

Aggiungere GPU a una configurazione di workstation esistente

Per aggiungere GPU a una configurazione della workstation, completa i passaggi in una delle seguenti schede.

Prima di iniziare

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:

gcloud init

Se utilizzi un provider di identità (IdP) esterno, devi prima accedere alla CLI gcloud con la tua identità federata.

Consulta la panoramica dei prezzi di Cloud Workstations per capire come la configurazione delle GPU influirà sui costi. Tieni presente che le GPU sono collegate alle macchine virtuali (VM) preavviate specificate dalle dimensioni del pool di avvio rapido di una configurazione.

Aggiornamento della configurazione esistente

Console

Configura le GPU in una configurazione di workstation esistente dalla consoleGoogle Cloud nel seguente modo:

  1. Nella console Google Cloud , vai alla pagina Configurazioni workstation.

    Vai a Configurazioni di workstation

  2. Nell'elenco Configurazioni workstation, fai clic sul Nome della configurazione a cui aggiungere le GPU.

  3. Nella pagina Dettagli configurazione workstation, fai clic su Modifica Modifica.

  4. Nella pagina Modifica configurazione workstation, fai clic su Impostazioni macchina nel menu di navigazione.

  5. Fai clic sul pulsante di attivazione/disattivazione per selezionare GPU anziché la famiglia di macchine Per uso generico.

    Nel campo Tipo di GPU, seleziona il modello di GPU che vuoi utilizzare.

    Nel campo Numero di GPU, seleziona il numero di schede GPU che vuoi collegare a ogni workstation.

    Nel campo Tipo di macchina, seleziona il tipo di macchina che vuoi utilizzare.

  6. Fai clic su Salva per aggiornare la configurazione.

gcloud

Configura le GPU in una configurazione della workstation esistente eseguendo il comando gcloud workstations configs update.

Prima di tutto, raccogli alcune informazioni per vedere quali modelli di GPU sono disponibili e sceglierne uno per la tua configurazione:

  1. Controlla quali zone di replica sono specificate nella configurazione eseguendo il seguente comando della CLI gcloud:

    gcloud workstations configs describe \
      --format="table(name.scope(workstationConfigs),replicaZones.list())" \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del progetto che contiene la configurazione della workstation.
    • LOCATION: la posizione del cluster di workstation.
    • CLUSTER_NAME: il nome del cluster di workstation che contiene la configurazione della workstation.
    • CONFIG_NAME: il nome della configurazione della workstation.
  2. Scegli un modello di GPU supportato disponibile in entrambe le zone di replica della configurazione eseguendo il comando gcloud compute accelerator-types list:

    gcloud compute accelerator-types list \
      --format="table(name:sort=1,zone,description,maximumCardsPerInstance)" \
      --filter='zone.basename()=(ZONES) AND name~"nvidia-tesla-(a100|p100|p4|t4|v100)$"' \
      --project=PROJECT_ID
    

    Sostituisci ZONES con un elenco separato da virgole delle zone di replica determinate nel passaggio precedente (ad esempio, us-central1-a,us-central1-c).

    Scegli un modello di GPU elencato due volte nella tabella, a indicare che è disponibile in entrambe le zone di replica.

    Prendi nota del numero massimo di schede che puoi collegare per il modello di GPU scelto.

  3. Determina quali dei tipi di macchina supportati sono disponibili in entrambe le zone di replica della configurazione utilizzando il comando gcloud compute machine-types list.

    1. Se nel passaggio precedente hai scelto il modello di GPU NVIDIA A100 da 40 GB, la configurazione deve utilizzare la serie di macchine A2:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:a2-highgpu- OR name:a2-megagpu-" \
        --zones=ZONES \
        --project=PROJECT_ID
      
    2. Se nel passaggio precedente hai scelto un altro modello di GPU, la tua configurazione deve utilizzare la serie di macchine N1:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:n1-standard-" \
        --zones=ZONES \
        --project=PROJECT_ID
      

    Scegli un tipo di macchina elencato due volte nella tabella, a indicare che è disponibile in entrambe le zone di replica.

  4. Ora che hai selezionato un modello di GPU e un tipo di macchina compatibile, aggiorna la configurazione:

    1. Per le GPU NVIDIA A100 da 40 GB, esegui questo comando per aggiornare la configurazione:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=A2_MACHINE_TYPE
      

      Sostituisci A2_MACHINE_TYPE con il tipo di macchina A2 scelto determinato nel passaggio precedente (ad esempio, a2-highgpu-1g).

    2. Per tutti gli altri modelli di GPU, esegui questo comando:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=N1_MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT
      

      Sostituisci quanto segue:

      • N1_MACHINE_TYPE: il tipo di macchina scelto della serie N1 (ad esempio n1-standard-2).
      • ACCELERATOR_TYPE: il nome del modello di GPU scelto (ad esempio, nvidia-tesla-t4).
      • ACCELERATOR_COUNT: il numero di GPU da collegare a ogni workstation (ad esempio, 1, 2, 4). Deve essere una potenza di due inferiore al massimo per il modello di GPU.

AVVISO: non è possibile passare a Hyperdisk dopo la creazione della configurazione della workstation.


Crea una nuova configurazione della workstation con GPU

Per creare una nuova configurazione della workstation che colleghi le GPU alle workstation basate su di essa, completa i passaggi in una delle seguenti schede.

Prima di iniziare

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:

gcloud init

Se utilizzi un provider di identità (IdP) esterno, devi prima accedere alla CLI gcloud con la tua identità federata.

REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

    Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:

    gcloud init

    Se utilizzi un provider di identità (IdP) esterno, devi prima accedere alla CLI gcloud con la tua identità federata.

Per saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Google Cloud .

Scegli un modello di GPU e consulta la tabella di disponibilità delle GPU per selezionare una regione in cui il modello di GPU scelto è disponibile in almeno due zone.

Se non hai ancora un cluster nella regione scelta in cui puoi creare una nuova configurazione, segui i passaggi per creare un cluster di workstation nella regione.

Consulta la panoramica dei prezzi di Cloud Workstations per capire come la configurazione delle GPU influirà sui costi. Tieni presente che le GPU sono collegate alle macchine virtuali (VM) preavviate specificate dalle dimensioni del pool di avvio rapido di una configurazione.

Creazione di una nuova configurazione

Console

Crea una nuova configurazione di workstation con GPU dalla console Google Cloud , procedendo nel seguente modo:

  1. Nella console Google Cloud , vai alla pagina Configurazioni di workstation.

    Vai a Configurazioni di workstation

  2. Nella pagina Configurazioni delle workstation, fai clic su add_box Crea.

  3. Nel passaggio Informazioni di base della pagina Crea configurazione workstation, specifica un nome per la configurazione nel campo Nome.

    Nel campo Cluster workstation, seleziona un cluster nella regione scelta.

    Fai clic su Continua per passare al passaggio Impostazioni macchina.

  4. Nel passaggio Impostazioni macchina della pagina Crea configurazione workstation, inizia facendo clic sul pulsante di attivazione/disattivazione per selezionare GPU anziché la famiglia di macchine Per uso generico.

    1. Quindi, nel campo Zone, seleziona le caselle di controllo accanto a due zone in cui è disponibile il modello di GPU che hai scelto (consulta la tabella di disponibilità delle GPU).

    2. Nel campo Tipo di GPU, seleziona il modello di GPU che vuoi utilizzare.

    3. Nel campo Numero di GPU, seleziona il numero di schede GPU da collegare a ogni workstation.

    4. Nel campo Tipo di macchina, seleziona un tipo di macchina compatibile.

  5. (Facoltativo) Questa funzionalità non è ancora supportata nella UI. Consulta le istruzioni per gcloud per utilizzare la CLI per configurare questa funzionalità.

  6. Fai clic su Continua per configurare le impostazioni dell'ambiente e il criterio Identity and Access Management (IAM) prima di fare clic su Crea per eseguire il provisioning della nuova configurazione della workstation.

gcloud

Crea una nuova configurazione della workstation con GPU utilizzando la CLI gcloud eseguendo il comando gcloud workstations configs create.

  • Per le GPU NVIDIA A100 da 40 GB, esegui questo comando per creare la configurazione:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=A2_MACHINE_TYPE
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del progetto che conterrà la nuova configurazione della workstation.
    • LOCATION: la posizione del cluster di workstation in cui verrà contenuta la configurazione.
    • CLUSTER_NAME: il nome del cluster di workstation che conterrà la nuova configurazione della workstation.
    • CONFIG_NAME: il nome della nuova configurazione della workstation.
    • REPLICA_ZONES: esattamente due zone nella regione del cluster in cui è disponibile il modello di GPU scelto (ad esempio, us-central1-a,us-central1-c).
    • A2_MACHINE_TYPE: il tipo di macchina della serie A2 scelto (ad esempio, a2-highgpu-1g).
  • Per tutti gli altri modelli di GPU, esegui questo comando per creare la configurazione:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=N1_MACHINE_TYPE \
      --accelerator-type=ACCELERATOR_TYPE \
      --accelerator-count=ACCELERATOR_COUNT
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del progetto che conterrà la nuova configurazione della workstation.
    • LOCATION: la posizione del cluster di workstation in cui verrà contenuta la configurazione.
    • CLUSTER_NAME: il nome del cluster di workstation che conterrà la nuova configurazione della workstation.
    • CONFIG_NAME: il nome della nuova configurazione della workstation.
    • REPLICA_ZONES: esattamente due zone nella regione del cluster in cui è disponibile il modello di GPU scelto (ad esempio, us-central1-a,us-central1-c).
    • N1_MACHINE_TYPE: il tipo di macchina della serie N1 scelto (ad esempio n1-standard-2).
    • ACCELERATOR_TYPE: il nome del modello di GPU scelto (ad esempio, nvidia-tesla-t4).
    • ACCELERATOR_COUNT: il numero di GPU da collegare a ogni workstation (ad esempio 1, 2, 4).
  • (Facoltativo) Per utilizzare un Hyperdisk, aggiungi il flag --disk-type=hyperdisk-balanced-ha. Ad esempio:

    gcloud beta workstations configs create \
      ... \
      --disk-type=hyperdisk-balanced-ha \
      --disk-size=200
    

    Questo comando creerà un Hyperdisk di 200 GB. Il tipo di disco non può essere modificato dopo la creazione della configurazione della workstation.

Driver di dispositivo GPU NVIDIA

Cloud Workstations installa i driver di dispositivo NVIDIA sulle VM host delle workstation durante l'avvio della VM.

Per determinare quale versione del driver del dispositivo è stata installata su una workstation, esegui il seguente comando:

nvidia-smi --query-gpu=name,driver_version --format=csv

Disponibilità delle GPU per regione e zona

Puoi eseguire ricerche in base alla località o al modello di GPU oppure a una combinazione di entrambi.

Zone Località Piattaforme GPU
asia-east1-a Taiwan P100, T4
asia-east1-b Taiwan
asia-east1-c Taiwan H100, P100, T4, V100
asia-east2-a Hong Kong T4
asia-east2-b Hong Kong
asia-east2-c Hong Kong T4
asia-northeast1-a Tokyo A100 da 40 GB, T4
asia-northeast1-b Tokyo H100
asia-northeast1-c Tokyo A100 da 40 GB, T4
asia-northeast3-a Seul A100 da 40 GB, H100
asia-northeast3-b Seul A100 da 40 GB, T4
asia-northeast3-c Seul H100, T4
asia-south1-a
asia-south1-b
Mumbai T4
asia-south1-c Mumbai H100
asia-southeast1-a Singapore T4
asia-southeast1-b
asia-southeast1-c
Singapore A100 da 40 GB, H100, P4, T4
australia-southeast1-a Sydney P4, T4
australia-southeast1-b Sydney P100, P4
australia-southeast1-c Sydney H100, T4
australia-southeast2-a
australia-southeast2-b
australia-southeast2-c
Melbourne
europe-central2-a Varsavia
europe-central2-b
europe-central2-c
Varsavia T4
europe-north1-a
europe-north1-b
Finlandia
europe-north1-c Finlandia H100
europe-southwest1-a
europe-southwest1-b
europe-southwest1-c
Madrid
europe-west1-b Belgio H100, P100, T4
europe-west1-c Belgio H100, T4
europe-west1-d Belgio P100, T4
europe-west12-a
europe-west12-b
Torino
europe-west2-a Londra T4
europe-west2-b Londra H100, T4
europe-west2-c Londra
europe-west3-a Francoforte H100
europe-west3-b Francoforte T4
europe-west3-c Francoforte H100
europe-west4-a Paesi Bassi A100 40GB, P100, T4, V100
europe-west4-b Paesi Bassi A100 40GB, H100, P4, T4, V100
europe-west4-c Paesi Bassi H100, P4, T4, V100
europe-west6-a
europe-west6-b
europe-west6-c
Zurigo
europe-west8-a
europe-west8-b
Milano
europe-west8-c Milano H100
europe-west9-a
europe-west9-b
Parigi
europe-west9-c Parigi H100
me-central2-a
me-central2-b
me-central2-c
Dammam
me-west1-a Tel Aviv A100 da 40 GB
me-west1-b Tel Aviv T4
me-west1-c Tel Aviv A100 da 40 GB, T4
northamerica-northeast1-a
northamerica-northeast1-b
Montréal P4
northamerica-northeast1-c Montréal P4, T4
southamerica-east1-a San Paolo T4
southamerica-east1-b San Paolo
southamerica-east1-c San Paolo T4
southamerica-west1-a
southamerica-west1-b
southamerica-west1-c
Santiago
us-central1-a Iowa A100 40GB, H100, P4, T4, V100
us-central1-b Iowa A100 40GB, H100, T4, V100
us-central1-c Iowa A100 40GB, H100, P100, P4, T4, V100
us-central1-f Iowa A100 40GB, P100, T4, V100
us-east1-b Carolina del Sud A100 da 40 GB, P100
us-east1-c Carolina del Sud P100, T4, V100
us-east1-d Carolina del Sud T4
us-east4-a
us-east4-b
us-east4-c
Virginia del Nord H100, P4, T4
us-east5-a Columbus H100
us-east5-b
us-east5-c
Columbus
us-west1-a Oregon H100, P100, T4, V100
us-west1-b Oregon A100 40GB, H100, P100, T4, V100
us-west1-c Oregon
us-west4-a Las Vegas H100, T4
us-west4-b Las Vegas A100 da 40 GB, T4
us-west4-c Las Vegas

Passaggi successivi