GPUs disponibles

Las GPUs se usan para acelerar las cargas de trabajo, y Cloud Workstations admite la conexión de GPUs a las estaciones de trabajo. Cloud Workstations admite muchos de los diversos modelos de GPU que están disponibles para adjuntar a las VMs de Compute Engine. El modelo y la cantidad de GPUs que se adjuntarán a cada estación de trabajo se especifican en la configuración de la estación de trabajo. Cloud Workstations se encarga de conectar las GPUs y de instalar sus controladores de dispositivos.

Conectar GPUs a las estaciones de trabajo afectará los costos, como se describe en la descripción general de los precios de Cloud Workstations.

Limitaciones

La configuración de una estación de trabajo puede especificar GPUs, sujetas a las siguientes limitaciones:

  • Cloud Workstations solo admite GPUs para las configuraciones que especifican tipos de máquinas en la serie de máquinas N1, la serie de máquinas A2 o la serie de máquinas A3. Consulta los modelos de GPU compatibles para obtener más detalles.
  • La configuración debe especificar zonas de réplica en las que esté disponible el modelo de GPU elegido.
  • No es posible configurar estaciones de trabajo para que tengan más de un modelo de GPU conectado a la vez.
  • Las configuraciones que especifican tipos de máquinas A2 Ultra no deben especificar almacenamiento persistente. Considera usar una solución basada en NFS, como Filestore o Cloud Storage FUSE, si se requiere almacenamiento de archivos persistente. Ten en cuenta que los tipos de máquinas A2 estándar sí admiten el almacenamiento persistente. Para crear configuraciones sin almacenamiento persistente, usa el siguiente comando de Google Cloud CLI:

      gcloud workstations configs create CONFIG_NAME \
        --project=PROJECT_ID \
        --cluster=CLUSTER_NAME \
        --region=LOCATION \
        --machine-type=A2_MACHINE_TYPE \
        --no-persistent-storage
    

    Reemplaza lo siguiente:

    • PROJECT_ID: Es el ID del proyecto que contiene la configuración de la estación de trabajo.
    • LOCATION: Es la región del clúster de estaciones de trabajo.
    • CLUSTER_NAME: Es el nombre del clúster de estaciones de trabajo que contiene la configuración de la estación de trabajo.
    • CONFIG_NAME: Es el nombre de la configuración de la estación de trabajo.
    • A2_MACHINE_TYPE: Es el tipo de máquina A2.
  • Las configuraciones que especifican tipos de máquinas A3 solo admiten volúmenes persistentes de Hyperdisk.

  • El uso de tipos de discos de Google Cloud Hyperdisk solo se admite en las siguientes series de máquinas:

    • A3
    • C3
    • C4
    • G4
    • M3
    • N4
    • N4D
    • Z3

Modelos de GPU compatibles

Cloud Workstations admite muchos de los modelos de GPU que Compute Engine pone a disposición. Los modelos admitidos dependen de la serie de máquinas elegida para la configuración de la estación de trabajo, como se resume en la siguiente tabla.

Serie de máquinas N1

La serie de máquinas de uso general N1 admite varios modelos de GPU, y las configuraciones de estaciones de trabajo que especifican cualquiera de los tipos de máquinas N1 también pueden especificar uno de los siguientes modelos de GPU. Para el modelo de GPU elegido, la configuración puede especificar un recuento de cuántas tarjetas de GPU se deben conectar a cada estación de trabajo.

Modelo de GPU Recuentos de GPU
NVIDIA T4 (nvidia-tesla-t4) 1, 2 o 4 GPUs
NVIDIA P4 (nvidia-tesla-p4) 1, 2 o 4 GPUs
NVIDIA V100 (nvidia-tesla-v100) 1, 2, 4 u 8 GPUs
NVIDIA P100 (nvidia-tesla-p100) 1, 2 o 4 GPUs

Serie de máquinas A2

La serie de máquinas optimizadas para aceleradores A2 estándar tiene una cantidad fija de GPUs NVIDIA A100 conectadas, según el tipo de máquina elegido.

En la siguiente tabla, se muestra la asignación del tipo de máquina a la cantidad de tarjetas que se adjuntarán.

Modelo de GPU Tipo de máquina Recuento de GPU
NVIDIA A100 40 GB (nvidia-tesla-a100) a2-highgpu-1g 1 GPU
a2-highgpu-2g 2 GPU
a2-highgpu-4g 4 GPU
a2-highgpu-8g 8 GPU
a2-megagpu-16g 16 GPU

Cloud Workstations no admite los tipos de máquinas A2 ultra.

Serie de máquinas A3

La serie de máquinas optimizadas para aceleradores A3 Mega y A3 High tiene una cantidad fija de GPUs NVIDIA H100 conectadas, según el tipo de máquina elegido.

En la siguiente tabla, se muestra la asignación del tipo de máquina a la cantidad de tarjetas que se adjuntarán.

Modelo de GPU Tipo de máquina Recuento de GPU
NVIDIA H100 de 80 GB (nvidia-tesla-h100) a3-highgpu-1g 1 GPU
a3-highgpu-2g 2 GPU
a3-highgpu-4g 4 GPU
a3-highgpu-8g 8 GPU
a3-megagpu-8g 8 GPU

Compatibilidad con Google Cloud Hyperdisk

Algunas cargas de trabajo de GPU requieren una capacidad de procesamiento de disco muy alta. Para satisfacer este caso de uso, Cloud Workstations permite el uso de discos de Google Cloud Hyperdisk Balanced High Availability como directorios persistentes para los tipos de máquinas enumerados anteriormente.

El almacenamiento de Hyperdisk se puede configurar a través de la consola y la CLI de gcloud. No es posible cambiar el tipo de disco después de crear una configuración de estación de trabajo.

Conectar un Hyperdisk a una estación de trabajo afectará los costos como se describe en Precios de Google Cloud Hyperdisk.

Cómo agregar GPUs a una configuración de estación de trabajo existente

Para agregar GPUs a la configuración de una estación de trabajo, completa los pasos en una de las siguientes pestañas.

Antes de comenzar

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:

gcloud init

Si usas un proveedor de identidad externo (IdP), primero debes acceder a la CLI de gcloud con tu identidad federada.

Revisa el resumen de los precios de Cloud Workstations para comprender cómo se verán afectados tus costos por la configuración de las GPUs. Ten en cuenta que las GPUs se adjuntan a las máquinas virtuales (VM) iniciadas previamente que se especifican en el Tamaño del grupo de inicio rápido de una configuración.

Cómo actualizar tu configuración existente

Console

Para configurar GPUs en una configuración de estación de trabajo existente desde la consola deGoogle Cloud , haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Configuraciones de estaciones de trabajo.

    Ir a los parámetros de configuración de las estaciones de trabajo

  2. En la lista Configuraciones de estaciones de trabajo, haz clic en el Nombre de la configuración a la que deseas agregar GPUs.

  3. En la página Detalles de configuración de la estación de trabajo, haz clic en Editar Editar.

  4. En la página Editar configuración de estación de trabajo, haz clic en Configuración de máquina en el menú de navegación.

  5. Haz clic en el botón de activación para seleccionar GPUs en lugar de la familia de máquinas De uso general.

    En el campo Tipo de GPU, selecciona el modelo de GPU que deseas usar.

    En el campo Cantidad de GPU, selecciona la cantidad de tarjetas de GPU que deseas adjuntar a cada estación de trabajo.

    En el campo Tipo de máquina, selecciona el tipo de máquina que deseas usar.

  6. Haz clic en Guardar para actualizar la configuración.

gcloud

Ejecuta el comando gcloud workstations configs update para configurar las GPUs en una configuración de estación de trabajo existente.

Sin embargo, primero recopila información para ver qué modelos de GPU están disponibles y elegir uno para tu configuración:

  1. Para verificar qué zonas de réplica especifica la configuración, ejecuta el siguiente comando de la CLI de gcloud:

    gcloud workstations configs describe \
      --format="table(name.scope(workstationConfigs),replicaZones.list())" \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME
    

    Reemplaza lo siguiente:

    • PROJECT_ID: Es el ID del proyecto que contiene la configuración de la estación de trabajo.
    • LOCATION: Es la ubicación del clúster de estaciones de trabajo.
    • CLUSTER_NAME: Es el nombre del clúster de estaciones de trabajo que contiene la configuración de la estación de trabajo.
    • CONFIG_NAME: Es el nombre de la configuración de la estación de trabajo.
  2. Ejecuta el comando gcloud compute accelerator-types list para elegir un modelo de GPU compatible que esté disponible en ambas zonas de réplica de la configuración:

    gcloud compute accelerator-types list \
      --format="table(name:sort=1,zone,description,maximumCardsPerInstance)" \
      --filter='zone.basename()=(ZONES) AND name~"nvidia-tesla-(a100|p100|p4|t4|v100)$"' \
      --project=PROJECT_ID
    

    Reemplaza ZONES por una lista separada por comas de las zonas de réplica determinadas en el paso anterior (por ejemplo, us-central1-a,us-central1-c).

    Elige un modelo de GPU que aparezca dos veces en la tabla, lo que indica que está disponible en ambas zonas de réplica.

    Toma nota de la cantidad máxima de tarjetas que puedes conectar para el modelo de GPU elegido.

  3. Determina cuáles de los tipos de máquinas admitidos están disponibles en ambas zonas de réplica de la configuración con el comando gcloud compute machine-types list.

    1. Si elegiste el modelo de GPU NVIDIA A100 de 40 GB en el paso anterior, tu configuración debe usar la serie de máquinas A2:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:a2-highgpu- OR name:a2-megagpu-" \
        --zones=ZONES \
        --project=PROJECT_ID
      
    2. Si elegiste cualquier otro modelo de GPU en el paso anterior, tu configuración debe usar la serie de máquinas N1:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:n1-standard-" \
        --zones=ZONES \
        --project=PROJECT_ID
      

    Elige un tipo de máquina que aparezca dos veces en la tabla, lo que indica que está disponible en ambas zonas de réplica.

  4. Ahora que seleccionaste un modelo de GPU y un tipo de máquina compatible, actualiza la configuración:

    1. Para las GPU NVIDIA A100 de 40 GB, ejecuta este comando para actualizar tu configuración:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=A2_MACHINE_TYPE
      

      Reemplaza A2_MACHINE_TYPE por el tipo de máquina A2 elegido que se determinó en el paso anterior (por ejemplo, a2-highgpu-1g).

    2. Para todos los demás modelos de GPU, ejecuta este comando:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=N1_MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT
      

      Reemplaza lo siguiente:

      • N1_MACHINE_TYPE: Es el tipo de máquina elegido de la serie N1 (por ejemplo, n1-standard-2).
      • ACCELERATOR_TYPE: El nombre del modelo de GPU elegido (por ejemplo, nvidia-tesla-t4)
      • ACCELERATOR_COUNT: Es la cantidad de GPU que se conectarán a cada estación de trabajo (por ejemplo, 1, 2, 4). Debe ser una potencia de dos inferior al máximo para el modelo de GPU.

ADVERTENCIA: No es posible cambiar a Hyperdisk después de crear la configuración de la estación de trabajo.


Crea una nueva configuración de estación de trabajo con GPUs

Para crear una nueva configuración de estación de trabajo que conecte GPUs a las estaciones de trabajo basadas en ella, completa los pasos en una de las siguientes pestañas.

Antes de comenzar

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:

gcloud init

Si usas un proveedor de identidad externo (IdP), primero debes acceder a la CLI de gcloud con tu identidad federada.

REST

Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.

    Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:

    gcloud init

    Si usas un proveedor de identidad externo (IdP), primero debes acceder a la CLI de gcloud con tu identidad federada.

Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .

Elige un modelo de GPU y consulta la tabla de disponibilidad de GPU para seleccionar una región en la que el modelo de GPU elegido esté disponible en al menos dos zonas.

Si aún no tienes un clúster en la región elegida en el que puedas crear una configuración nueva, sigue los pasos para crear un clúster de estación de trabajo en la región.

Revisa el resumen de los precios de Cloud Workstations para comprender cómo se verán afectados tus costos por la configuración de las GPUs. Ten en cuenta que las GPUs se adjuntan a las máquinas virtuales (VM) iniciadas previamente que se especifican en el Tamaño del grupo de inicio rápido de una configuración.

Cómo crear una configuración nueva

Console

Crea una nueva configuración de estación de trabajo con GPUs desde la consola deGoogle Cloud . Para ello, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Configuraciones de estaciones de trabajo.

    Ir a los parámetros de configuración de las estaciones de trabajo

  2. En la página Configuraciones de la estación de trabajo, haz clic en add_box Crear.

  3. En el paso Información básica de la página Crear configuración de estación de trabajo, especifica un nombre para tu configuración en el campo Nombre.

    En el campo Clúster de estación de trabajo, selecciona un clúster en la región elegida.

    Haz clic en Continuar para avanzar al paso Configuración de la máquina.

  4. En el paso Configuración de la máquina de la página Crear configuración de estación de trabajo, haz clic en el botón de activación para seleccionar GPUs en lugar de la familia de máquinas Uso general.

    1. Luego, en el campo Zonas, selecciona las casillas de verificación junto a dos zonas en las que esté disponible el modelo de GPU que elegiste (consulta la tabla de disponibilidad de GPU).

    2. En el campo Tipo de GPU, selecciona el modelo de GPU que deseas usar.

    3. En el campo Cantidad de GPU, selecciona la cantidad de tarjetas de GPU que deseas adjuntar a cada estación de trabajo.

    4. En el campo Tipo de máquina, selecciona un tipo de máquina compatible.

  5. Opcional: Esta función aún no es compatible con la IU. Consulta las instrucciones de gcloud para usar la CLI y configurar esta función.

  6. Haz clic en Continuar para configurar los parámetros de configuración del entorno y la política de Identity and Access Management (IAM) antes de hacer clic en Crear para aprovisionar la nueva configuración de la estación de trabajo.

gcloud

Crea una nueva configuración de estación de trabajo con GPUs usando la CLI de gcloud ejecutando el comando gcloud workstations configs create.

  • Para las GPU NVIDIA A100 de 40 GB, ejecuta este comando para crear tu configuración:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=A2_MACHINE_TYPE
    

    Reemplaza lo siguiente:

    • PROJECT_ID: Es el ID del proyecto que contendrá la nueva configuración de la estación de trabajo.
    • LOCATION: Es la ubicación del clúster de la estación de trabajo en la que se contendrá la configuración.
    • CLUSTER_NAME: Es el nombre del clúster de estaciones de trabajo que contendrá la nueva configuración de la estación de trabajo.
    • CONFIG_NAME: Es el nombre de la nueva configuración de la estación de trabajo.
    • REPLICA_ZONES: Exactamente dos zonas en la región del clúster en las que está disponible el modelo de GPU elegido (por ejemplo, us-central1-a,us-central1-c)
    • A2_MACHINE_TYPE: Es el tipo de máquina de la serie A2 elegido (por ejemplo, a2-highgpu-1g).
  • Para todos los demás modelos de GPU, ejecuta este comando para crear tu configuración:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=N1_MACHINE_TYPE \
      --accelerator-type=ACCELERATOR_TYPE \
      --accelerator-count=ACCELERATOR_COUNT
    

    Reemplaza lo siguiente:

    • PROJECT_ID: Es el ID del proyecto que contendrá la nueva configuración de la estación de trabajo.
    • LOCATION: Es la ubicación del clúster de la estación de trabajo en la que se contendrá la configuración.
    • CLUSTER_NAME: Es el nombre del clúster de estaciones de trabajo que contendrá la nueva configuración de la estación de trabajo.
    • CONFIG_NAME: Es el nombre de la nueva configuración de la estación de trabajo.
    • REPLICA_ZONES: Exactamente dos zonas en la región del clúster en las que está disponible el modelo de GPU elegido (por ejemplo, us-central1-a,us-central1-c)
    • N1_MACHINE_TYPE: Es el tipo de máquina de la serie N1 elegida (por ejemplo, n1-standard-2).
    • ACCELERATOR_TYPE: El nombre del modelo de GPU elegido (por ejemplo, nvidia-tesla-t4)
    • ACCELERATOR_COUNT: Es la cantidad de GPUs que se conectarán a cada estación de trabajo (por ejemplo, 1, 2, 4).
  • Opcional: Para usar un Hyperdisk, agrega la marca --disk-type=hyperdisk-balanced-ha. Por ejemplo:

    gcloud beta workstations configs create \
      ... \
      --disk-type=hyperdisk-balanced-ha \
      --disk-size=200
    

    Con este comando, se creará un Hyperdisk de 200 GB. El tipo de disco no se puede cambiar después de crear la configuración de la estación de trabajo.

Controladores de dispositivos de GPU de NVIDIA

Cloud Workstations instala los controladores de dispositivos NVIDIA en las VMs host de las estaciones de trabajo durante el inicio de la VM.

Para determinar qué versión del controlador de dispositivo se instaló en una estación de trabajo, ejecuta el siguiente comando:

nvidia-smi --query-gpu=name,driver_version --format=csv

Disponibilidad de GPU por región y zona

Puedes buscar por ubicación o modelo de GPU, o por una combinación de ambos.

Zonas Ubicación Plataformas de GPU
asia-east1-a Taiwán P100, T4
asia-east1-b Taiwán
asia-east1-c Taiwán H100, P100, T4, V100
asia-east2-a Hong Kong T4
asia-east2-b Hong Kong
asia-east2-c Hong Kong T4
asia-northeast1-a Tokio A100 40 GB, T4
asia-northeast1-b Tokio H100
asia-northeast1-c Tokio A100 40 GB, T4
asia-northeast3-a Seúl A100 40 GB, H100
asia-northeast3-b Seúl A100 40 GB, T4
asia-northeast3-c Seúl H100, T4
asia-south1-a
asia-south1-b
Bombay T4
asia-south1-c Bombay H100
asia-southeast1-a Singapur T4
asia-southeast1-b
asia-southeast1-c
Singapur A100 40 GB, H100, P4, T4
australia-southeast1-a Sídney P4, T4
australia-southeast1-b Sídney P100, P4
australia-southeast1-c Sídney H100, T4
australia-southeast2-a
australia-southeast2-b
australia-southeast2-c
Melbourne
europe-central2-a Varsovia
europe-central2-b
europe-central2-c
Varsovia T4
europe-north1-a
europe-north1-b
Finlandia
europe-north1-c Finlandia H100
europe-southwest1-a
europe-southwest1-b
europe-southwest1-c
Madrid
europe-west1-b Bélgica H100, P100, T4
europe-west1-c Bélgica H100, T4
europe-west1-d Bélgica P100, T4
europe-west12-a
europe-west12-b
Turín
europe-west2-a Londres T4
europe-west2-b Londres H100, T4
europe-west2-c Londres
europe-west3-a Fráncfort H100
europe-west3-b Fráncfort T4
europe-west3-c Fráncfort H100
europe-west4-a Países Bajos A100 40 GB, P100, T4 y V100
europe-west4-b Países Bajos A100 40 GB, H100, P4, T4 y V100
europe-west4-c Países Bajos H100, P4, T4, V100
europe-west6-a
europe-west6-b
europe-west6-c
Zúrich
europe-west8-a
europe-west8-b
Milán
europe-west8-c Milán H100
europe-west9-a
europe-west9-b
París
europe-west9-c París H100
me-central2-a
me-central2-b
me-central2-c
Dammam
me-west1-a Tel Aviv A100 40 GB
me-west1-b Tel Aviv T4
me-west1-c Tel Aviv A100 40 GB, T4
northamerica-northeast1-a
northamerica-northeast1-b
Montreal P4
northamerica-northeast1-c Montreal P4, T4
southamerica-east1-a São Paulo T4
southamerica-east1-b São Paulo
southamerica-east1-c São Paulo T4
southamerica-west1-a
southamerica-west1-b
southamerica-west1-c
Santiago
us-central1-a Iowa A100 40 GB, H100, P4, T4 y V100
us-central1-b Iowa A100 40 GB, H100, T4 y V100
us-central1-c Iowa A100 40 GB, H100, P100, P4, T4 y V100
us-central1-f Iowa A100 40 GB, P100, T4 y V100
us-east1-b Carolina del Sur A100 40 GB, P100
us-east1-c Carolina del Sur P100, T4, V100
us-east1-d Carolina del Sur T4
us-east4-a
us-east4-b
us-east4-c
Virginia del Norte H100, P4, T4
us-east5-a Columbus H100
us-east5-b
us-east5-c
Columbus
us-west1-a Oregón H100, P100, T4, V100
us-west1-b Oregón A100 40 GB, H100, P100, T4 y V100
us-west1-c Oregón
us-west4-a Las Vegas H100, T4
us-west4-b Las Vegas A100 40 GB, T4
us-west4-c Las Vegas

¿Qué sigue?