GPU disponibles

Les GPU permettent d'accélérer les charges de travail. Cloud Workstations permet d'associer des GPU à des postes de travail. Cloud Workstations est compatible avec de nombreux modèles de GPU pouvant être associés à des VM Compute Engine. Le modèle et la quantité de GPU à associer à chaque station de travail sont spécifiés dans la configuration de la station de travail. Cloud Workstations gère l'association des GPU et l'installation de leurs pilotes de périphériques.

L'association de GPU à des postes de travail a une incidence sur les coûts, comme décrit dans la présentation des tarifs de Cloud Workstations.

Limites

Une configuration de poste de travail peut spécifier des GPU, sous réserve des limites suivantes :

  • Cloud Workstations n'est compatible avec les GPU que pour les configurations qui spécifient des types de machines dans la série de machines N1, la série de machines A2 ou la série de machines A3. Pour en savoir plus, consultez la page Modèles de GPU compatibles.
  • La configuration doit spécifier des zones de répliques où le modèle de GPU choisi est disponible.
  • Il n'est pas possible de configurer des postes de travail pour qu'ils disposent de plusieurs modèles de GPU à la fois.
  • Les configurations qui spécifient des types de machines A2 Ultra ne doivent pas spécifier de stockage persistant. Envisagez d'utiliser une solution basée sur NFS telle que Filestore ou Cloud Storage FUSE si un stockage de fichiers persistant est requis. Notez que les types de machines A2 Standard sont compatibles avec le stockage persistant. Pour créer des configurations sans stockage persistant, utilisez la commande Google Cloud CLI suivante :

      gcloud workstations configs create CONFIG_NAME \
        --project=PROJECT_ID \
        --cluster=CLUSTER_NAME \
        --region=LOCATION \
        --machine-type=A2_MACHINE_TYPE \
        --no-persistent-storage
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID du projet contenant la configuration de la station de travail.
    • LOCATION : région du cluster de postes de travail.
    • CLUSTER_NAME : nom du cluster de postes de travail contenant la configuration des postes de travail.
    • CONFIG_NAME : nom de la configuration de la station de travail.
    • A2_MACHINE_TYPE : type de machine A2.
  • Les configurations qui spécifient des types de machines A3 ne sont compatibles qu'avec les volumes persistants Hyperdisk.

  • L'utilisation des types de disques Google Cloud Hyperdisk n'est compatible qu'avec les séries de machines suivantes :

    • A3
    • C3
    • C4
    • G4
    • M3
    • N4
    • N4D
    • Z3

Modèles de GPU compatibles

Cloud Workstations est compatible avec de nombreux modèles de GPU disponibles dans Compute Engine. Les modèles compatibles dépendent de la série de machines choisie pour la configuration de la station de travail, comme indiqué dans le tableau suivant.

Série de machines N1

La série de machines à usage général N1 est compatible avec plusieurs modèles de GPU. Les configurations de postes de travail qui spécifient l'un des types de machines N1 peuvent également spécifier l'un des modèles de GPU suivants. Pour le modèle de GPU choisi, la configuration peut spécifier le nombre de cartes GPU à associer à chaque poste de travail.

Modèle GPU Nombre de GPU
NVIDIA T4 (nvidia-tesla-t4) 1, 2 ou 4 GPU
NVIDIA P4 (nvidia-tesla-p4) 1, 2 ou 4 GPU
NVIDIA V100 (nvidia-tesla-v100) 1, 2, 4 ou 8 GPU
NVIDIA P100 (nvidia-tesla-p100) 1, 2 ou 4 GPU

Série de machines A2

La série de machines optimisées pour l'accélérateur A2 Standard est associée à un nombre fixe de GPU NVIDIA A100, en fonction uniquement du type de machine choisi.

Le tableau suivant montre la correspondance entre le type de machine et le nombre de cartes qui seront associées.

Modèle GPU Type de machine Nombre de GPU
NVIDIA A100 40 Go (nvidia-tesla-a100) a2-highgpu-1g 1 GPU
a2-highgpu-2g 2 GPU
a2-highgpu-4g 4 GPU
a2-highgpu-8g 8 GPU
a2-megagpu-16g 16 GPU

Cloud Workstations n'est pas compatible avec les types de machines A2 ultra.

Série de machines A3

La série de machines optimisées pour les accélérateurs A3 Mega et A3 High est associée à un nombre fixe de GPU NVIDIA H100, en fonction uniquement du type de machine choisi.

Le tableau suivant montre la correspondance entre le type de machine et le nombre de cartes qui seront associées.

Modèle GPU Type de machine Nombre de GPU
NVIDIA H100 80 Go (nvidia-tesla-h100) a3-highgpu-1g 1 GPU
a3-highgpu-2g 2 GPU
a3-highgpu-4g 4 GPU
a3-highgpu-8g 8 GPU
a3-megagpu-8g 8 GPU

Assistance Google Cloud Hyperdisk

Certaines charges de travail GPU nécessitent un débit de disque très élevé. Pour répondre à ce cas d'utilisation, Cloud Workstations permet d'utiliser des disques Google Cloud Hyperdisk équilibrés à haute disponibilité comme répertoires persistants pour les types de machines énumérés précédemment.

Vous pouvez configurer le stockage Hyperdisk dans la console et avec la CLI gcloud. Il n'est pas possible de modifier le type de disque après avoir créé une configuration de station de travail.

L'association d'un volume Hyperdisk à une station de travail a une incidence sur les coûts, comme décrit dans Tarifs de Google Cloud Hyperdisk.

Ajouter des GPU à une configuration de poste de travail existante

Pour ajouter des GPU à une configuration de poste de travail, suivez la procédure décrite dans l'un des onglets ci-dessous.

Avant de commencer

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

gcloud init

Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la CLI gcloud avec votre identité fédérée.

Consultez la présentation de la tarification Cloud Workstations pour comprendre l'impact de la configuration des GPU sur vos coûts. Notez que les GPU sont associés aux machines virtuelles (VM) pré-démarrées spécifiées par la Taille du pool de démarrage rapide d'une configuration.

Mettre à jour votre configuration existante

Console

Configurez des GPU sur une configuration de station de travail existante à partir de la consoleGoogle Cloud en procédant comme suit :

  1. Dans la console Google Cloud , accédez à la page Configurations de stations de travail.

    Accéder aux configurations de stations de travail

  2. Dans la liste Configurations de la station de travail, cliquez sur le nom de la configuration à laquelle ajouter des GPU.

  3. Sur la page Détails de la configuration de la station de travail, cliquez sur Modifier > Modifier.

  4. Sur la page Modifier la configuration de la station de travail, cliquez sur Paramètres de la machine dans le menu de navigation.

  5. Cliquez sur le bouton bascule pour sélectionner GPU au lieu de la famille de machines À usage général.

    Dans le champ Type de GPU, sélectionnez le modèle de GPU que vous souhaitez utiliser.

    Dans le champ Nombre de GPU, sélectionnez le nombre de cartes GPU que vous souhaitez associer à chaque station de travail.

    Dans le champ Type de machine, sélectionnez le type de machine que vous souhaitez utiliser.

  6. Cliquez sur Enregistrer pour mettre à jour la configuration.

gcloud

Configurez les GPU sur une configuration de station de travail existante en exécutant la commande gcloud workstations configs update.

Commencez par collecter des informations pour identifier les modèles de GPU disponibles et en choisir un pour votre configuration :

  1. Vérifiez les zones de répliques spécifiées par la configuration en exécutant la commande gcloud CLI suivante :

    gcloud workstations configs describe \
      --format="table(name.scope(workstationConfigs),replicaZones.list())" \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID du projet contenant la configuration de la station de travail.
    • LOCATION : emplacement du cluster de postes de travail.
    • CLUSTER_NAME : nom du cluster de postes de travail contenant la configuration des postes de travail.
    • CONFIG_NAME : nom de la configuration de la station de travail.
  2. Choisissez un modèle de GPU compatible et disponible dans les deux zones de répliques de la configuration en exécutant la commande gcloud compute accelerator-types list :

    gcloud compute accelerator-types list \
      --format="table(name:sort=1,zone,description,maximumCardsPerInstance)" \
      --filter='zone.basename()=(ZONES) AND name~"nvidia-tesla-(a100|p100|p4|t4|v100)$"' \
      --project=PROJECT_ID
    

    Remplacez ZONES par une liste, séparée par une virgule, des zones de répliques déterminées à l'étape précédente (par exemple, us-central1-a,us-central1-c).

    Choisissez un modèle de GPU qui figure deux fois dans le tableau, ce qui indique qu'il est disponible dans les deux zones de répliques.

    Notez le nombre maximal de cartes que vous pouvez associer au modèle de GPU choisi.

  3. Déterminez quels types de machines compatibles sont disponibles dans les deux zones de répliques de la configuration à l'aide de la commande gcloud compute machine-types list.

    1. Si vous avez choisi le modèle de GPU NVIDIA A100 40 Go à l'étape précédente, votre configuration doit utiliser la série de machines A2 :

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:a2-highgpu- OR name:a2-megagpu-" \
        --zones=ZONES \
        --project=PROJECT_ID
      
    2. Si vous avez choisi un autre modèle de GPU à l'étape précédente, votre configuration doit utiliser la série de machines N1 :

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:n1-standard-" \
        --zones=ZONES \
        --project=PROJECT_ID
      

    Choisissez un type de machine qui figure deux fois dans le tableau, ce qui indique qu'il est disponible dans les deux zones de répliques.

  4. Maintenant que vous avez sélectionné un modèle de GPU et un type de machine compatible, mettez à jour la configuration :

    1. Pour les GPU NVIDIA A100 40 Go, exécutez cette commande pour mettre à jour votre configuration :

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=A2_MACHINE_TYPE
      

      Remplacez A2_MACHINE_TYPE par le type de machine A2 choisi à l'étape précédente (par exemple, a2-highgpu-1g).

    2. Pour tous les autres modèles de GPU, exécutez cette commande :

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=N1_MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT
      

      Remplacez les éléments suivants :

      • N1_MACHINE_TYPE : type de machine choisi dans la série N1 (par exemple, n1-standard-2).
      • ACCELERATOR_TYPE : nom du modèle de GPU choisi (par exemple, nvidia-tesla-t4).
      • ACCELERATOR_COUNT : nombre de GPU à associer à chaque station de travail (par exemple, 1, 2, 4). Doit être une puissance de deux inférieure au maximum pour le modèle de GPU.

AVERTISSEMENT : Il n'est pas possible de passer à Hyperdisk une fois la configuration de la station de travail créée.


Créer une configuration de station de travail avec des GPU

Pour créer une configuration de poste de travail qui associe des GPU aux postes de travail basés sur celle-ci, suivez la procédure décrite dans l'un des onglets ci-dessous.

Avant de commencer

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

gcloud init

Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la CLI gcloud avec votre identité fédérée.

REST

Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la CLI gcloud.

    Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

    gcloud init

    Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la CLI gcloud avec votre identité fédérée.

Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

Choisissez un modèle de GPU et consultez le tableau de disponibilité des GPU pour sélectionner une région dans laquelle le modèle de GPU choisi est disponible dans au moins deux zones.

Si vous n'avez pas encore de cluster dans la région choisie où vous pouvez créer une configuration, suivez les étapes pour créer un cluster de stations de travail dans la région.

Consultez la présentation de la tarification Cloud Workstations pour comprendre l'impact de la configuration des GPU sur vos coûts. Notez que les GPU sont associés aux machines virtuelles (VM) pré-démarrées spécifiées par la Taille du pool de démarrage rapide d'une configuration.

Créer une configuration

Console

Créez une configuration de station de travail avec des GPU à partir de la consoleGoogle Cloud  :

  1. Dans la console Google Cloud , accédez à la page Configurations de stations de travail.

    Accéder aux configurations de stations de travail

  2. Sur la page Configurations de stations de travail, cliquez sur add_box Créer.

  3. À l'étape Informations de base de la page Créer une configuration de poste de travail, spécifiez un nom pour votre configuration dans le champ Nom.

    Dans le champ Cluster de stations de travail, sélectionnez un cluster dans la région choisie.

    Cliquez sur Continuer pour passer à l'étape Paramètres de la machine.

  4. À l'étape Paramètres de la machine de la page Créer une configuration de station de travail, commencez par cliquer sur le bouton bascule pour sélectionner GPU au lieu de la famille de machines Usage général.

    1. Ensuite, dans le champ Zones, cochez deux zones dans lesquelles le modèle de GPU que vous avez choisi est disponible (consultez le tableau de disponibilité des GPU).

    2. Dans le champ Type de GPU, sélectionnez le modèle de GPU que vous souhaitez utiliser.

    3. Dans le champ Nombre de GPU, sélectionnez le nombre de cartes GPU que vous souhaitez associer à chaque station de travail.

    4. Dans le champ Type de machine, sélectionnez un type de machine compatible.

  5. Facultatif : Cette fonctionnalité n'est pas encore disponible dans l'interface utilisateur. Consultez les instructions gcloud pour utiliser la CLI et configurer cette fonctionnalité.

  6. Cliquez sur Continuer pour configurer les paramètres d'environnement et la stratégie Identity and Access Management (IAM), puis cliquez sur Créer pour provisionner la nouvelle configuration de la station de travail.

gcloud

Créez une configuration de poste de travail avec des GPU à l'aide de la CLI gcloud en exécutant la commande gcloud workstations configs create.

  • Pour les GPU NVIDIA A100 40 Go, exécutez cette commande pour créer votre configuration :

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=A2_MACHINE_TYPE
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID du projet qui contiendra la nouvelle configuration de poste de travail.
    • LOCATION : emplacement du cluster de postes de travail où la configuration sera contenue.
    • CLUSTER_NAME : nom du cluster de postes de travail qui contiendra la nouvelle configuration de poste de travail.
    • CONFIG_NAME : nom de la nouvelle configuration de poste de travail.
    • REPLICA_ZONES : exactement deux zones dans la région du cluster où le modèle de GPU choisi est disponible (par exemple, us-central1-a,us-central1-c).
    • A2_MACHINE_TYPE : type de machine de la série A2 choisi (par exemple, a2-highgpu-1g).
  • Pour tous les autres modèles de GPU, exécutez cette commande pour créer votre configuration :

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=N1_MACHINE_TYPE \
      --accelerator-type=ACCELERATOR_TYPE \
      --accelerator-count=ACCELERATOR_COUNT
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID du projet qui contiendra la nouvelle configuration de poste de travail.
    • LOCATION : emplacement du cluster de postes de travail où la configuration sera contenue.
    • CLUSTER_NAME : nom du cluster de postes de travail qui contiendra la nouvelle configuration de poste de travail.
    • CONFIG_NAME : nom de la nouvelle configuration de poste de travail.
    • REPLICA_ZONES : exactement deux zones dans la région du cluster où le modèle de GPU choisi est disponible (par exemple, us-central1-a,us-central1-c).
    • N1_MACHINE_TYPE : type de machine de la série N1 choisi (par exemple, n1-standard-2).
    • ACCELERATOR_TYPE : nom du modèle de GPU choisi (par exemple, nvidia-tesla-t4).
    • ACCELERATOR_COUNT : nombre de GPU à associer à chaque station de travail (par exemple, 1, 2, 4).
  • Facultatif : Pour utiliser un volume Hyperdisk, ajoutez le flag --disk-type=hyperdisk-balanced-ha. Exemple :

    gcloud beta workstations configs create \
      ... \
      --disk-type=hyperdisk-balanced-ha \
      --disk-size=200
    

    Cette commande crée un hyperdisque de 200 Go. Le type de disque ne peut pas être modifié après la création de la configuration de la station de travail.

Pilotes d'appareils GPU NVIDIA

Cloud Workstations installe les pilotes de périphérique NVIDIA sur les VM hôtes des postes de travail au démarrage des VM.

Pour déterminer la version du pilote de périphérique installée sur un poste de travail, exécutez la commande suivante :

nvidia-smi --query-gpu=name,driver_version --format=csv

Disponibilité des GPU par région et par zone

Vous pouvez effectuer une recherche par localisation ou par modèle de GPU, ou une combinaison des deux.

Zones Emplacement Plates-formes de GPU
asia-east1-a Taïwan P100, T4
asia-east1-b Taïwan
asia-east1-c Taïwan H100, P100, T4, V100
asia-east2-a Hong Kong T4
asia-east2-b Hong Kong
asia-east2-c Hong Kong T4
asia-northeast1-a Tokyo A100 40 Go, T4
asia-northeast1-b Tokyo H100
asia-northeast1-c Tokyo A100 40 Go, T4
asia-northeast3-a Séoul A100 40 Go, H100
asia-northeast3-b Séoul A100 40 Go, T4
asia-northeast3-c Séoul H100, T4
asia-south1-a
asia-south1-b
Mumbai T4
asia-south1-c Mumbai H100
asia-southeast1-a Singapour T4
asia-southeast1-b
asia-southeast1-c
Singapour A100 40 Go, H100, P4, T4
australia-southeast1-a Sydney P4, T4
australia-southeast1-b Sydney P100, P4
australia-southeast1-c Sydney H100, T4
australia-southeast2-a
australia-southeast2-b
australia-southeast2-c
Melbourne
europe-central2-a Varsovie
europe-central2-b
europe-central2-c
Varsovie T4
europe-north1-a
europe-north1-b
Finlande
europe-north1-c Finlande H100
europe-southwest1-a
europe-southwest1-b
europe-southwest1-c
Madrid
europe-west1-b Belgique H100, P100, T4
europe-west1-c Belgique H100, T4
europe-west1-d Belgique P100, T4
europe-west12-a
europe-west12-b
Turin
europe-west2-a Londres T4
europe-west2-b Londres H100, T4
europe-west2-c Londres
europe-west3-a Francfort H100
europe-west3-b Francfort T4
europe-west3-c Francfort H100
europe-west4-a Pays-Bas A100 40 Go, P100, T4, V100
europe-west4-b Pays-Bas A100 40 Go, H100, P4, T4, V100
europe-west4-c Pays-Bas H100, P4, T4, V100
europe-west6-a
europe-west6-b
europe-west6-c
Zurich
europe-west8-a
europe-west8-b
Milan
europe-west8-c Milan H100
europe-west9-a
europe-west9-b
Paris
europe-west9-c Paris H100
me-central2-a
me-central2-b
me-central2-c
Dammam
me-west1-a Tel Aviv A100 40 Go
me-west1-b Tel Aviv T4
me-west1-c Tel Aviv A100 40 Go, T4
northamerica-northeast1-a
northamerica-northeast1-b
Montréal P4
northamerica-northeast1-c Montréal P4, T4
southamerica-east1-a São Paulo T4
southamerica-east1-b São Paulo
southamerica-east1-c São Paulo T4
southamerica-west1-a
southamerica-west1-b
southamerica-west1-c
Santiago
us-central1-a Iowa A100 40 Go, H100, P4, T4, V100
us-central1-b Iowa A100 40 Go, H100, T4, V100
us-central1-c Iowa A100 40 Go, H100, P100, P4, T4, V100
us-central1-f Iowa A100 40 Go, P100, T4, V100
us-east1-b Caroline du Sud A100 40 Go, P100
us-east1-c Caroline du Sud P100, T4, V100
us-east1-d Caroline du Sud T4
us-east4-a
us-east4-b
us-east4-c
Virginie du Nord H100, P4, T4
us-east5-a Columbus H100
us-east5-b
us-east5-c
Columbus
us-west1-a Oregon H100, P100, T4, V100
us-west1-b Oregon A100 40 Go, H100, P100, T4, V100
us-west1-c Oregon
us-west4-a Las Vegas H100, T4
us-west4-b Las Vegas A100 40 Go, T4
us-west4-c Las Vegas

Étape suivante