Agregar o quitar GPU

Compute Engine proporciona unidades de procesamiento de gráficos (GPU) que puedes agregar a tus instancias de Compute Engine. Puedes usar estas GPU para acelerar cargas de trabajo específicas en tus instancias de procesamiento, como inteligencia artificial (IA), aprendizaje automático (AA) y cargas de trabajo con uso intensivo de gráficos.

Solo puedes usar dos familias de máquinas cuando ejecutas GPU en Compute Engine:

Antes de comenzar

  • Para revisar los pasos de requisitos previos adicionales, como elegir una imagen de SO y verificar la cuota de GPU, revisa el documento de descripción general.
  • Si aún no lo hiciste, configura la autenticación. La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:

    Selecciona la pestaña que corresponda a la forma en que planeas usar las muestras de esta página:

    Console

    Cuando usas la consola de Google Cloud para acceder a los servicios y las APIs de Google Cloud , no necesitas configurar la autenticación.

    REST

    Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.

      Instala Google Cloud CLI.

      Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.

    Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .

Instancias optimizadas para aceleradores

Revisa las siguientes opciones y limitaciones de modificación para los tipos de máquinas optimizados para aceleradores:

  • No puedes quitar GPUs de los tipos de máquinas optimizadas para aceleradores.

  • En el caso de las instancias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge y A2 Ultra, no puedes cambiar el tipo de máquina. Si necesitas cambiar a un tipo de máquina de otra familia o serie de máquinas, crea una instancia nueva con el tipo de máquina que elegiste. Luego, migra tu carga de trabajo a la instancia nueva.

  • En el caso de las instancias estándar G4, G2 y A2, puedes ajustar el recuento de GPU si cambias a un tipo de máquina diferente dentro de la misma serie de máquinas. Por ejemplo, para agregar GPUs a una instancia G2, puedes cambiar el tipo de máquina de g2-standard-16 a g2-standard-48.

    No puedes cambiar las instancias estándar G4, G2 o A2 a un tipo de máquina de una serie o familia de máquinas diferente. Por ejemplo, no puedes cambiar el tipo de máquina de una instancia de g2-standard-16 a g4-standard-48 porque G2 y G4 son series de máquinas diferentes. Si necesitas cambiar a un tipo de máquina de otra serie o familia, crea una instancia nueva con el tipo de máquina que elijas. Luego, migra tu carga de trabajo a la instancia nueva.

Modifica el recuento de GPU

Puedes modificar el recuento de GPU de una instancia estándar optimizada para aceleradores G4, G2 o A2 con la Google Cloud consola o REST.

Console

Puedes modificar la cantidad de GPU de tu instancia; para ello, debes detener y editar la configuración de la instancia.

  1. Verifica que todas las aplicaciones importantes estén detenidas en la instancia.

  2. En la consola de Google Cloud , ve a la página Instancias de VM para ver tu lista de instancias.

    Ir a Instancias de VM

  3. Haz clic en el nombre de la instancia de la que deseas modificar la cantidad de GPU. Se abrirá la página Detalles.

  4. Completa los siguientes pasos desde la página Detalles.

    1. Si la instancia se está ejecutando, haz clic en Detener para detenerla. Si no hay una opción de Detener, haz clic en Más acciones > Detener.

    2. Haz clic en Editar.

    3. En la sección Configuración de la máquina, selecciona la familia de máquinas GPU y, luego, haz lo siguiente:

      1. En la lista Cantidad de GPU, aumenta o disminuye el recuento de GPU.

    4. Para aplicar los cambios, haz clic en Guardar.

    5. Para reiniciar la instancia, haz clic en Iniciar/Reanudar.

REST

Puedes modificar la cantidad de GPUs en tu instancia deteniéndola y cambiando el tipo de máquina. Cada tipo de máquina optimizada para acelerador tiene una cantidad específica de GPU conectadas. Si cambias el tipo de máquina, se ajusta la cantidad de GPU conectadas a la instancia.

  1. Verifica que todas tus aplicaciones importantes estén detenidas en la instancia y, luego, crea una solicitud POST para detener la instancia y que pueda trasladarse a un sistema host en el que las GPU estén disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Después de que se detenga la instancia, crea una solicitud POST para modificar el tipo de máquina.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType
    
    {
       machineType: "zones/ZONE/machineTypes/MACHINE_TYPE"
    }
    
  3. Crea una solicitud POST para iniciar la instancia.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

Reemplaza lo siguiente:

  • PROJECT_ID: el ID de tu proyecto
  • VM_NAME: El nombre de la instancia a la que deseas agregar las GPU.
  • ZONE: Es la zona en la que se encuentra la instancia. Esta zona debe ser compatible con las GPU.
  • MACHINE_TYPE: es el tipo de máquina que deseas usar. Debe ser una de las siguientes opciones:

    • Si tu instancia usa una máquina G4, elige otro tipo de máquina G4.
    • Si tu instancia usa un tipo de máquina G2, elige otro tipo de máquina G2. Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1,024 MB y debe estar dentro del rango de memoria admitido. Por ejemplo, el nombre del tipo de máquina para una instancia con 4 CPU virtuales y 19 GB de memoria sería g2-custom-4-19456.
    • Si tu instancia usa una máquina estándar A2, elige otro tipo de máquina estándar A2.

Limitaciones

Instancias G4

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina G4.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G4.
  • Solo puedes usar un tipo de máquina G4 en ciertas regiones y zonas.
  • No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina G4.
  • El tipo de máquina G4 solo está disponible en la plataforma AMD EPYC Turin de 5ª generación.
  • No puedes crear instancias de VM confidenciales que usen un tipo de máquina G4.
  • No puedes crear instancias G4 en nodos de usuario único.
  • No puedes usar sistemas operativos Windows en instancias g4-standard-384.
  • No puedes adjuntar discos Hyperdisk ML creados antes del 4 de febrero de 2026 a tipos de máquinas G4.
  • Cuando crees instancias G4 que tengan menos de una GPU conectada (GPU fraccionarias), no uses las marcas --no-service-account ni --no-scopes. Para autenticar los controladores de GPU virtual de NVIDIA, Compute Engine debe verificar la identidad de la VM. Este proceso requiere que las cuentas de servicio estén habilitadas.

Instancias G2

  • Solo puedes solicitar capacidad con las opciones de consumo compatibles para un tipo de máquina G2.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G2.
  • Solo puedes usar un tipo de máquina G2 en ciertas regiones y zonas.
  • Los tipos de máquinas G2 solo están disponibles en la plataforma Cascade Lake.
  • El disco persistente estándar (pd-standard) no es compatible con las instancias que usan el tipo de máquina G2. Para conocer los tipos de discos compatibles, consulta Tipos de discos compatibles con G2.
  • No puedes crear GPUs de instancias múltiples en una instancia que usa un tipo de máquina G2.
  • Si necesitas cambiar el tipo de máquina de una instancia G2, revisa Modifica las instancias optimizadas para aceleradores.
  • No puedes usar imágenes de Deep Learning VM Image como discos de arranque para las instancias que usan el tipo de máquina G2.
  • El controlador predeterminado actual para Container-Optimized OS no es compatible con las GPU L4 que se ejecutan en los tipos de máquinas G2. Además, Container-Optimized OS solo admite un conjunto selecto de controladores. Si deseas usar Container-Optimized OS en tipos de máquinas G2, revisa las siguientes notas:
    • Usa una versión de Container-Optimized OS que sea compatible con la versión mínima recomendada del controlador NVIDIA 525.60.13 o posterior. Para obtener más información, revisa las notas de la versión de Container-Optimized OS.
    • Cuando instalas el controlador, especifica la versión más reciente disponible que funcione para las GPU L4. Por ejemplo, sudo cos-extensions install gpu -- -version=525.60.13
  • Debes usar Google Cloud CLI o REST para crear instancias de G2 en las siguientes situaciones:
    • Deseas especificar valores de memoria personalizados.
    • Deseas personalizar la cantidad de núcleos de CPU visibles.

Instancias A2

  • Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina estándar A2.
  • No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A2 estándar.
  • Solo puedes usar un tipo de máquina A2 estándar en ciertas regiones y zonas.
  • Los tipos de máquinas A2 estándar solo están disponibles en la plataforma Cascade Lake.
  • Si tu instancia usa un tipo de máquina estándar A2, solo puedes cambiar de un tipo de máquina estándar A2 a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Cómo modificar instancias optimizadas para aceleradores.
  • No puedes usar el sistema operativo Windows con el tipo de máquina a2-megagpu-16g. Cuando uses un sistema operativo Windows, elige un tipo de máquina A2 estándar diferente.
  • No puedes realizar un formateo rápido de las SSD locales conectadas en las instancias de Windows que usan los tipos de máquinas A2 estándar. Para formatear estos SSD locales, debes realizar un formateo completo mediante el uso de la utilidad diskpart y la especificación de format fs=ntfs label=tmpfs.

Instancias de uso general N1

En esta sección, se explica cómo agregar, modificar o quitar GPU de una instancia de VM creada con un tipo de máquina de uso general N1.

En resumen, el proceso para agregar, modificar o quitar GPU de una instancia existente es el siguiente:

  1. Verifica que tu instancia tenga un tamaño de disco de arranque de al menos 40 GiB.
  2. Detén la instancia.
  3. Agrega, modifica o quita las GPU.

    Si tu instancia N1 no tiene ninguna GPU conectada, debes completar los siguientes pasos:

    1. Prepara tu instancia para la modificación.
    2. Modifica la configuración de mantenimiento del host de la instancia. Las instancias con GPU no pueden migrar en vivo porque están asignadas a dispositivos de hardware específicos. Para obtener más información, consulta las restricciones de GPU.
    3. Cambiar el tipo de máquina Las GPU solo son compatibles con tipos de máquinas N1 seleccionados.
    4. Instala un controlador de GPU en tu instancia para que tu sistema pueda usar el dispositivo de GPU.

Prepara tu instancia

Cuando se agrega una GPU a una instancia, el orden de la interfaz de red puede cambiar.

La mayoría de las imágenes públicas de Compute Engine no tienen nombres de interfaz de red persistentes y se ajustan al orden nuevo.

Sin embargo, si usas SLES o una imagen personalizada, debes actualizar la configuración del sistema para evitar que la interfaz de red sea persistente. Para evitar que la interfaz de red persista, ejecuta el siguiente comando en tu instancia:

 rm /etc/udev/rules.d/70-persistent-net.rules 

Agrega GPU o modifica el tipo de GPU en instancias existentes

En esta sección, se explica cómo agregar GPU o modificar el tipo de GPU en una instancia de uso general N1 existente. Este procedimiento admite los siguientes tipos de GPU:

GPU de NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):

  • Estación de trabajo virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual NVIDIA P100: nvidia-tesla-p100-vws

    Para estas estaciones de trabajo virtuales, se agrega automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.

Console

Para agregar GPU o modificar el tipo de GPU, completa los siguientes pasos.

  1. Verifica que todas las aplicaciones importantes estén detenidas en la instancia.

  2. En la consola de Google Cloud , ve a la página Instancias de VM para ver tu lista de instancias.

    Ir a Instancias de VM

  3. Haz clic en el nombre de la instancia que deseas actualizar. Se abrirá la página Detalles.

  4. Completa los siguientes pasos desde la página Detalles.

    1. Si la instancia se está ejecutando, haz clic en Detener. Si no hay una opción de Detener, haz clic en Más acciones > Detener.

    2. Haz clic en Editar.

    3. En la sección Configuración de la máquina, selecciona la familia de máquinas GPU y, luego, haz lo siguiente:

      1. En la lista Tipo de GPU, elige o cambia a cualquiera de los tipos de GPU compatibles con las VM N1.

      2. En la lista Cantidad de GPU, selecciona la cantidad.

      3. Si tu modelo de GPU es compatible con estaciones de trabajo virtuales (vWS) de NVIDIA RTX para cargas de trabajo de gráficos y planeas ejecutar cargas de trabajo de alto contenido gráfico en esta instancia, selecciona Habilitar estación de trabajo virtual (NVIDIA GRID).

    4. Si tu instancia no tenía GPU conectadas antes, completa lo siguiente:

      1. Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina. En la lista Tipo de máquina, elige uno de los tipos de máquina N1 predeterminados. Como alternativa, también puedes especificar una configuración de tipo de máquina personalizado.

      2. En la sección Administración, completa lo siguiente:

        1. En la lista Mantenimiento en el host, selecciona Finalizar instancia de VM. Las instancias con GPU conectadas no se pueden migrar en vivo. Consulta Controla eventos del host de GPU.

        2. En la lista Reinicio automático, selecciona Desactivado.

    5. Para aplicar los cambios, haz clic en Guardar.

    6. Para reiniciar la VM, haz clic en Iniciar/Reanudar.

REST

Puedes agregar o modificar GPU en tu instancia; para ello, debes detenerla y cambiar su configuración a través de la API.

  1. Verifica que todas tus aplicaciones importantes estén detenidas en la instancia y, luego, crea una solicitud POST para detener la instancia a fin de que pueda trasladarse a un sistema host en el que las GPU estén disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Si tu instancia no tiene ninguna GPU conectada, completa los siguientes pasos:

    1. Identifica el tipo de GPU que deseas agregar a tu instancia. Puedes enviar una solicitud GET a fin de enumerar los tipos de GPU que están disponibles para tu proyecto en una zona específica.

      GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
      
    2. Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina para que tenga una o más CPU virtuales. No puedes agregar aceleradores a instancias con tipos de máquina de núcleo compartido.

    3. Crea una solicitud POST para establecer las opciones de programación de la instancia.

      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling
      
      {
      "onHostMaintenance": "TERMINATE",
      "automaticRestart": true
      }
      
  3. Crea una solicitud POST para agregar o modificar las GPUs conectadas a tu instancia.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources
    
        {
         "guestAccelerators": [
          {
            "acceleratorCount": ACCELERATOR_COUNT,
            "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
          }
         ]
        }
    
  4. Crea una solicitud POST para iniciar la instancia.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

    Reemplaza lo siguiente:

    • PROJECT_ID: el ID de tu proyecto
    • VM_NAME: El nombre de la instancia a la que deseas agregar las GPU.
    • ZONE: Es la zona en la que se encuentra la instancia.
    • ACCELERATOR_COUNT: La cantidad de GPU que deseas conectar a tu instancia. Para obtener una lista de los límites de GPU en función del tipo de máquina de tu instancia, consulta GPU en Compute Engine
    • ACCELERATOR_TYPE: el modelo de GPU que deseas adjuntar o cambiarte. Si planeas ejecutar cargas de trabajo de alto contenido gráfico en esta instancia, usa uno de los modelos de estación de trabajo virtual.

      Elige uno de los siguientes valores:

      • GPU de NVIDIA:

        • NVIDIA T4: nvidia-tesla-t4
        • NVIDIA P4: nvidia-tesla-p4
        • NVIDIA P100: nvidia-tesla-p100
        • NVIDIA V100: nvidia-tesla-v100
      • NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):

        • Estación de trabajo virtual NVIDIA T4: nvidia-tesla-t4-vws
        • Estación de trabajo virtual NVIDIA P4: nvidia-tesla-p4-vws
        • Estación de trabajo virtual NVIDIA P100: nvidia-tesla-p100-vws

        Para estas estaciones de trabajo virtuales, se agrega de forma automática una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.

Instalar controladores

Para instalar los controladores, elige una de las siguientes opciones:

Quita GPUs

En esta sección, se explica cómo quitar los siguientes tipos de GPU de una instancia de uso general N1 existente.

GPU de NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):

  • Estación de trabajo virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual NVIDIA P100: nvidia-tesla-p100-vws

    Para estas estaciones de trabajo virtuales, se agrega automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.

Puedes usar Google Cloud console para quitar GPU de una instancia existente. Para quitar las GPU, completa los siguientes pasos:

  1. Verifica que todas las aplicaciones importantes estén detenidas en la instancia.

  2. En la consola de Google Cloud , ve a la página Instancias de VM para ver tu lista de instancias.

    Ir a Instancias de VM

  3. Haz clic en el nombre de la instancia de la que deseas quitar las GPUs. Se abrirá la página Detalles.

  4. Completa los siguientes pasos desde la página Detalles.

    1. Si la instancia se está ejecutando, haz clic en Detener para detenerla. Si no hay una opción de Detener, haz clic en Más acciones > Detener.

    2. En la barra de herramientas, haz clic en Editar.

    3. En la sección Configuración de la máquina, elige la familia de máquinas De uso general y, luego, haz lo siguiente:

      1. Para ver las GPU conectadas, expande los parámetros de Configuración avanzada.

      2. En la sección GPU, quita las GPU con una de las siguientes opciones:

        • Para quitar algunas GPU, elige una cantidad nueva en la lista Cantidad de GPU.

        • Para quitar todas las GPU, haz clic en Borrar GPU.

    4. Opcional: Modifica la configuración de la política de mantenimiento del host de la instancia. Las instancias con GPU deben tener la política de mantenimiento del host configurada como Finalizar instancia de VM. Sin embargo, si quitaste todas las GPU, tienes la opción de migrar en vivo esta instancia durante el mantenimiento del host. Para obtener más información, consulta Configura la política de mantenimiento del host de VM.

    5. Para aplicar los cambios, haz clic en Guardar.

    6. Para reiniciar la instancia, haz clic en Iniciar/Reanudar.

Próximos pasos