Añadir o quitar GPUs

Compute Engine ofrece unidades de procesamiento gráfico (GPUs) que puedes añadir a tus instancias de máquina virtual. Puedes usar estas GPUs para acelerar cargas de trabajo específicas en tus VMs, como las de aprendizaje automático y procesamiento de datos.

Solo puedes usar dos familias de máquinas al ejecutar GPUs en Compute Engine:

  • La familia de máquinas optimizadas para aceleradores. Todos los tipos de máquinas optimizadas para aceleradores tienen GPUs conectadas.
  • La familia de máquinas de uso general N1. Puedes usar la mayoría de los tipos de máquinas N1, excepto los de núcleo compartido. Si no usas una máquina de uso general N1, puedes cambiar a una máquina de uso general N1 y, a continuación, añadir las GPUs.

Antes de empezar

  • Para consultar otros pasos previos, como seleccionar una imagen del SO y comprobar la cuota de GPU, consulta el documento de descripción general.
  • Si aún no lo has hecho, configura la autenticación. La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.

      Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:

      gcloud init

      Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

    Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .

Máquinas virtuales optimizadas para aceleradores

Cada tipo de máquina optimizada para aceleradores tiene un modelo específico de GPU NVIDIA conectada para admitir el tipo de carga de trabajo recomendado.

Cargas de trabajo de IA y aprendizaje automático Gráficos y visualización
Los tipos de máquinas de la serie A optimizados para aceleradores se han diseñado para cargas de trabajo de computación de alto rendimiento (HPC), inteligencia artificial (IA) y aprendizaje automático (ML).

En estos tipos de máquinas, el modelo de GPU se adjunta automáticamente a la instancia.

Los tipos de máquinas de la serie G optimizados para aceleradores se han diseñado para cargas de trabajo como las de simulación de NVIDIA Omniverse, las aplicaciones que requieren muchos gráficos, la transcodificación de vídeo y los escritorios virtuales. Estos tipos de máquinas admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX.

En estos tipos de máquinas, el modelo de GPU se adjunta automáticamente a la instancia.

  • A4X (Superchips NVIDIA GB200)
    (nvidia-gb200)
  • A4 (NVIDIA B200)
    (nvidia-b200)
  • A3 Ultra (NVIDIA H200)
    (nvidia-h200-141gb)
  • A3 Mega (NVIDIA H100)
    (nvidia-h100-mega-80gb)
  • A3 High (NVIDIA H100)
    (nvidia-h100-80gb)
  • A3 Edge (NVIDIA H100)
    (nvidia-h100-80gb)
  • A2 Ultra (NVIDIA A100 de 80 GB)
    (nvidia-a100-80gb)
  • A2 Standard (NVIDIA A100)
    (nvidia-a100-40gb)
  • G4 (NVIDIA RTX PRO 6000)
    (nvidia-rtx-pro-6000)
    (nvidia-rtx-pro-6000-vws)
  • G2 (NVIDIA L4)
    (nvidia-l4)
    (nvidia-l4-vws)

Puede modificar cada instancia optimizada para aceleradores de la siguiente manera:

  • En las instancias A4X, A4, A3 y A2 Ultra, no puedes modificar el tipo de máquina. Si utilizas alguno de estos tipos de máquina en tu instancia y necesitas cambiarlo, crea una instancia nueva.

  • En el caso de las instancias A2 estándar, puedes modificar el número de GPUs cambiando de un tipo de máquina A2 estándar a otro.

  • En las instancias G4, puedes modificar el número de GPUs cambiando de un tipo de máquina G4 a otro.

  • En las instancias G2, puedes hacer lo siguiente:

    • Puedes modificar el número de GPUs cambiando de un tipo de máquina G2 a otro.
    • Puedes cambiar de un tipo de máquina G2 a un tipo de máquina de otra familia, como de uso general o optimizada para la computación. Consulta Editar el tipo de máquina de una VM.
  • No puedes quitar GPUs de ninguno de los tipos de máquinas optimizadas para aceleradores.

Modificar el número de GPUs

Puedes modificar el número de GPUs de una instancia optimizada para aceleradores A2 estándar, G4 o G2 mediante la Google Cloud consola o la API REST.

Consola

Para modificar el número de GPUs de una instancia, debes detenerla y editar su configuración.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la instancia.

  2. En la Google Cloud consola, ve a la página Instancias de VM para ver tu lista de instancias.

    Ir a instancias de VM

  3. Haga clic en el nombre de la instancia para la que quiera modificar el número de GPUs. Se abrirá la página Detalles.

  4. Sigue estos pasos en la página Detalles.

    1. Si la instancia está en ejecución, haz clic en Detener para detenerla. Si no aparece la opción Detener, haz clic en Más acciones > Detener.

    2. Haz clic en Editar.

    3. En la sección Configuración de la máquina, selecciona la familia de máquinas GPUs y, a continuación, haz lo siguiente:

      1. En la lista Número de GPUs, aumenta o disminuye el número de GPUs.

    4. Para aplicar los cambios, haz clic en Guardar.

    5. Para reiniciar la instancia, haz clic en Iniciar/Reanudar.

REST

Puedes modificar el número de GPUs de tu instancia deteniéndola y cambiando el tipo de máquina. Cada tipo de máquina optimizada para aceleradores tiene un número específico de GPUs conectadas. Si cambias el tipo de máquina, se ajustará el número de GPUs conectadas a la instancia.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la instancia y, a continuación, crea un comando POST para detener la instancia de forma que pueda pasar a un sistema host en el que haya GPUs disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Cuando la instancia se detenga, crea una solicitud POST para modificar el tipo de máquina.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType
    
    {
       machineType: "zones/ZONE/machineTypes/MACHINE_TYPE"
    }
    
  3. Inicia la instancia.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

Haz los cambios siguientes:

  • PROJECT_ID: tu ID de proyecto.
  • VM_NAME: el nombre de la instancia a la que quieres añadir GPUs.
  • ZONE: la zona en la que se encuentra la instancia. Esta zona debe admitir GPUs.
  • MACHINE_TYPE: el tipo de máquina que quieras usar. Debe ser uno de los siguientes:

    • Si tu instancia usa una máquina estándar A2, selecciona otro tipo de máquina estándar A2.
    • Si tu instancia usa una máquina G4, selecciona otro tipo de máquina G4.
    • Si tu instancia usa un tipo de máquina G2, selecciona otro tipo de máquina G2. Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1024 MB y estar dentro del intervalo de memoria admitido. Por ejemplo, el nombre del tipo de máquina de una instancia con 4 vCPUs y 19 GB de memoria sería g2-custom-4-19456.

Limitaciones

Instancias A2

  • Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para el tipo de máquina A2 estándar.
  • No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible por las instancias que usen un tipo de máquina A2 estándar.
  • Solo puedes usar un tipo de máquina estándar A2 en determinadas regiones y zonas.
  • El tipo de máquina estándar A2 solo está disponible en la plataforma Cascade Lake.
  • Si tu instancia usa un tipo de máquina A2 estándar, solo puedes cambiar de un tipo de máquina A2 estándar a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Modificar instancias optimizadas para aceleradores.
  • No puedes usar el sistema operativo Windows con el tipo de máquina a2-megagpu-16g. Si usas un sistema operativo Windows, elige otro tipo de máquina estándar A2.
  • No puedes hacer un formato rápido de los SSD locales conectados en instancias de Windows que usen tipos de máquinas estándar A2. Para formatear estos SSD locales, debes realizar un formateo completo con la utilidad diskpart y especificar format fs=ntfs label=tmpfs.
  • Los tipos de máquinas estándar A2 no admiten el alquiler exclusivo.

Instancias G2

Instancias de G4

Instancias N1 de uso general

En esta sección se explica cómo añadir, modificar o quitar GPUs de una máquina de uso general N1.

En resumen, el proceso para añadir, modificar o quitar GPUs de una instancia ya creada es el siguiente:

  1. Comprueba que tu instancia tenga un tamaño de disco de arranque de al menos 40 GB.
  2. Detén la instancia.
  3. Añade, modifica o elimina las GPUs.

    Si tu instancia N1 no tiene ninguna GPU conectada, debes completar los siguientes pasos:

    1. Prepara tu instancia para la modificación.
    2. Modifica el ajuste de mantenimiento del host de la instancia. Las instancias con GPUs no se pueden migrar en caliente porque están asignadas a dispositivos de hardware específicos. Para obtener más información, consulta Restricciones de GPU.
    3. Cambia el tipo de máquina. Las GPUs solo se admiten en determinados tipos de máquinas N1.
    4. Instala un controlador de GPU en tu instancia para que tu sistema pueda usar el dispositivo de GPU.

Preparar la instancia

Cuando se añade una GPU a una instancia, el orden de la interfaz de red puede cambiar.

La mayoría de las imágenes públicas de Compute Engine no tienen nombres de interfaz de red persistentes y se adaptan al nuevo orden.

Sin embargo, si usas SLES o una imagen personalizada, debes actualizar la configuración del sistema para evitar que la interfaz de red persista. Para evitar que la interfaz de red persista, ejecuta el siguiente comando en tu instancia:

 rm /etc/udev/rules.d/70-persistent-net.rules 

Añadir GPUs o modificar el tipo de GPU en instancias

En esta sección se explica cómo añadir GPUs o modificar el tipo de GPU en una instancia de uso general N1. Este procedimiento es compatible con los siguientes tipos de GPU:

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):

  • Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws

    En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual (vWS) NVIDIA RTX a tu instancia.

Consola

Para añadir GPUs o modificar el tipo de GPU, sigue estos pasos.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la instancia.

  2. En la Google Cloud consola, ve a la página Instancias de VM para ver tu lista de instancias.

    Ir a instancias de VM

  3. Haga clic en el nombre de la instancia que quiera actualizar. Se abrirá la página Detalles.

  4. Sigue estos pasos en la página Detalles.

    1. Si la instancia está en ejecución, haz clic en Detener. Si no aparece la opción Detener, haz clic en Más acciones > Detener.

    2. Haz clic en Editar.

    3. En la sección Configuración de la máquina, selecciona la familia de máquinas GPUs y, a continuación, haz lo siguiente:

      1. En la lista Tipo de GPU, selecciona o cambia a cualquiera de los tipos de GPU compatibles con las VMs N1.

      2. En la lista Número de GPUs, selecciona el número de GPUs.

      3. Si tu modelo de GPU es compatible con estaciones de trabajo virtuales (vWS) NVIDIA RTX para cargas de trabajo de gráficos y tienes previsto ejecutar cargas de trabajo que utilizan un gran número de gráficos en esta instancia, selecciona Habilitar estación de trabajo virtual (NVIDIA GRID).

    4. Si tu instancia no tenía GPUs conectadas antes, haz lo siguiente:

      1. Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina. En la lista Tipo de máquina, selecciona uno de los tipos de máquina N1 predefinidos. También puedes especificar ajustes personalizados del tipo de máquina.

      2. En la sección Gestión, haz lo siguiente:

        1. En la lista Mantenimiento en el host, selecciona Desactivar la instancia de VM. Las instancias con GPUs conectadas no se pueden migrar en directo. Consulta Gestionar eventos de host de GPU.

        2. En la lista Reinicio automático, selecciona Activado.

    5. Para aplicar los cambios, haz clic en Guardar.

    6. Para reiniciar la VM, haz clic en Iniciar/Reanudar.

REST

Puedes añadir o modificar GPUs en tu instancia deteniéndola y cambiando su configuración a través de la API.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la instancia y, a continuación, crea un comando POST para detener la instancia de forma que pueda pasar a un sistema host en el que haya GPUs disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Si tu instancia no tiene ninguna GPU conectada, sigue estos pasos:

    1. Identifica el tipo de GPU que quieres añadir a tu instancia. Puedes enviar una GETsolicitud para enumerar los tipos de GPU que están disponibles para tu proyecto en una zona específica.

      GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
      
    2. Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina para que tenga una o más vCPUs. No puedes añadir aceleradores a instancias con tipos de máquina de núcleo compartido.

    3. Crea un comando POST para definir las opciones de programación de la instancia.

      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling
      
      {
      "onHostMaintenance": "TERMINATE",
      "automaticRestart": true
      }
      
  3. Crea una solicitud POST para añadir o modificar las GPUs conectadas a tu instancia.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources
    
        {
         "guestAccelerators": [
          {
            "acceleratorCount": ACCELERATOR_COUNT,
            "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
          }
         ]
        }
    
  4. Inicia la instancia.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

    Haz los cambios siguientes:

    • PROJECT_ID: tu ID de proyecto.
    • VM_NAME: el nombre de la instancia a la que quieres añadir GPUs.
    • ZONE: la zona en la que se encuentra la instancia.
    • ACCELERATOR_COUNT: el número de GPUs que quieres asociar a tu instancia. Para ver una lista de los límites de las GPU en función del tipo de máquina de tu instancia, consulta GPUs en Compute Engine.
    • ACCELERATOR_TYPE: el modelo de GPU que quieres adjuntar o cambiar. Si tienes previsto ejecutar cargas de trabajo que requieran muchos gráficos en esta instancia, usa uno de los modelos de estación de trabajo virtual.

      Elige uno de los valores que se indican a continuación.

      • GPUs NVIDIA:

        • NVIDIA T4: nvidia-tesla-t4
        • NVIDIA P4: nvidia-tesla-p4
        • NVIDIA P100: nvidia-tesla-p100
        • NVIDIA V100: nvidia-tesla-v100
      • Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):

        • Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
        • Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
        • Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws

        En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.

Instalar controladores

Para instalar los controladores, elija una de las siguientes opciones:

Quitar GPUs

En esta sección se explica cómo quitar los siguientes tipos de GPU de una instancia de uso general N1.

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):

  • Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws

    En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual (vWS) NVIDIA RTX a tu instancia.

Puedes usar el Google Cloud console para quitar GPUs de una instancia. Para quitar GPUs, sigue estos pasos:

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la instancia.

  2. En la Google Cloud consola, ve a la página Instancias de VM para ver la lista de tus instancias.

    Ir a instancias de VM

  3. Haga clic en el nombre de la instancia de la que quiera quitar GPUs. Se abrirá la página Detalles.

  4. Sigue estos pasos en la página Detalles.

    1. Si la instancia está en ejecución, haz clic en Detener para detenerla. Si no aparece la opción Detener, haz clic en Más acciones > Detener.

    2. En la barra de herramientas, haz clic en Editar.

    3. En la sección Configuración de la máquina, seleccione la familia de máquinas De uso general y, a continuación, haga lo siguiente:

      1. Para ver las GPUs conectadas, despliega Configuraciones avanzadas.

      2. En la sección GPUs, elimina las GPUs con una de las siguientes opciones:

        • Para quitar algunas GPUs, en la lista Número de GPUs, selecciona un número nuevo.

        • Para quitar todas las GPUs, haz clic en Eliminar GPU.

    4. Opcional: Modifica la configuración de la política de mantenimiento del host de la instancia. Las instancias con GPUs deben tener la política de mantenimiento del host definida como Desactivar la instancia de VM. Sin embargo, si has quitado todas las GPUs, tienes la opción de migrar en directo esta instancia durante el mantenimiento del host. Para obtener más información, consulta Definir la política de mantenimiento del host de la VM.

    5. Para aplicar los cambios, haz clic en Guardar.

    6. Para reiniciar la instancia, haz clic en Iniciar/Reanudar.

Siguientes pasos