Compute Engine proporciona unidades de procesamiento de gráficos (GPU) que puedes agregar a tus instancias de Compute Engine. Puedes usar estas GPU para acelerar cargas de trabajo específicas en tus instancias de procesamiento, como inteligencia artificial (IA), aprendizaje automático (AA) y cargas de trabajo con uso intensivo de gráficos.
Solo puedes usar dos familias de máquinas cuando ejecutas GPU en Compute Engine:
- La familia de máquinas con optimización de acelerador Estos tipos de máquinas tienen GPU conectadas.
- La familia de máquinas de uso general N1. Puedes usar la mayoría de los tipos de máquinas N1, excepto el tipo de máquina de núcleo compartido N1.
Antes de comenzar
- Para revisar los pasos de requisitos previos adicionales, como elegir una imagen de SO y verificar la cuota de GPU, revisa el documento de descripción general.
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Selecciona la pestaña que corresponda a la forma en que planeas usar las muestras de esta página:
Console
Cuando usas la consola de Google Cloud para acceder a los servicios y las APIs de Google Cloud , no necesitas configurar la autenticación.
REST
Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.
Instala Google Cloud CLI.
Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .
Instancias optimizadas para aceleradores
Revisa las siguientes opciones y limitaciones de modificación para los tipos de máquinas optimizados para aceleradores:
No puedes quitar GPUs de los tipos de máquinas optimizadas para aceleradores.
En el caso de las instancias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge y A2 Ultra, no puedes cambiar el tipo de máquina. Si necesitas cambiar a un tipo de máquina de otra familia o serie de máquinas, crea una instancia nueva con el tipo de máquina que elegiste. Luego, migra tu carga de trabajo a la instancia nueva.
En el caso de las instancias estándar G4, G2 y A2, puedes ajustar el recuento de GPU si cambias a un tipo de máquina diferente dentro de la misma serie de máquinas. Por ejemplo, para agregar GPUs a una instancia G2, puedes cambiar el tipo de máquina de
g2-standard-16ag2-standard-48.No puedes cambiar las instancias estándar G4, G2 o A2 a un tipo de máquina de una serie o familia de máquinas diferente. Por ejemplo, no puedes cambiar el tipo de máquina de una instancia de
g2-standard-16ag4-standard-48porque G2 y G4 son series de máquinas diferentes. Si necesitas cambiar a un tipo de máquina de otra serie o familia, crea una instancia nueva con el tipo de máquina que elijas. Luego, migra tu carga de trabajo a la instancia nueva.
Modifica el recuento de GPU
Puedes modificar el recuento de GPU de una instancia estándar optimizada para aceleradores G4, G2 o A2 con la Google Cloud consola o REST.
Console
Puedes modificar la cantidad de GPU de tu instancia; para ello, debes detener y editar la configuración de la instancia.
Verifica que todas las aplicaciones importantes estén detenidas en la instancia.
En la consola de Google Cloud , ve a la página Instancias de VM para ver tu lista de instancias.
Haz clic en el nombre de la instancia de la que deseas modificar la cantidad de GPU. Se abrirá la página Detalles.
Completa los siguientes pasos desde la página Detalles.
Si la instancia se está ejecutando, haz clic en Detener para detenerla. Si no hay una opción de Detener, haz clic en Más acciones > Detener.
Haz clic en Editar.
En la sección Configuración de la máquina, selecciona la familia de máquinas GPU y, luego, haz lo siguiente:
En la lista Cantidad de GPU, aumenta o disminuye el recuento de GPU.
Para aplicar los cambios, haz clic en Guardar.
Para reiniciar la instancia, haz clic en Iniciar/Reanudar.
REST
Puedes modificar la cantidad de GPUs en tu instancia deteniéndola y cambiando el tipo de máquina. Cada tipo de máquina optimizada para acelerador tiene una cantidad específica de GPU conectadas. Si cambias el tipo de máquina, se ajusta la cantidad de GPU conectadas a la instancia.
Verifica que todas tus aplicaciones importantes estén detenidas en la instancia y, luego, crea una solicitud
POSTpara detener la instancia y que pueda trasladarse a un sistema host en el que las GPU estén disponibles.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
Después de que se detenga la instancia, crea una solicitud
POSTpara modificar el tipo de máquina.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType { machineType: "zones/ZONE/machineTypes/MACHINE_TYPE" }Crea una solicitud
POSTpara iniciar la instancia.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
Reemplaza lo siguiente:
PROJECT_ID: el ID de tu proyectoVM_NAME: El nombre de la instancia a la que deseas agregar las GPU.ZONE: Es la zona en la que se encuentra la instancia. Esta zona debe ser compatible con las GPU.MACHINE_TYPE: es el tipo de máquina que deseas usar. Debe ser una de las siguientes opciones:- Si tu instancia usa una máquina G4, elige otro tipo de máquina G4.
- Si tu instancia usa un tipo de máquina G2, elige otro tipo de máquina G2.
Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1,024 MB y debe estar dentro del rango de memoria admitido. Por ejemplo, el nombre del tipo de máquina para una instancia con 4 CPU virtuales y 19 GB de memoria sería
g2-custom-4-19456. - Si tu instancia usa una máquina estándar A2, elige otro tipo de máquina estándar A2.
Limitaciones
Instancias G4
- Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina G4.
- No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G4.
- Solo puedes usar un tipo de máquina G4 en ciertas regiones y zonas.
- No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina G4.
- El tipo de máquina G4 solo está disponible en la plataforma AMD EPYC Turin de 5ª generación.
- No puedes crear instancias de VM confidenciales que usen un tipo de máquina G4.
- No puedes crear instancias G4 en nodos de usuario único.
- No puedes usar sistemas operativos Windows en instancias
g4-standard-384. - No puedes adjuntar discos Hyperdisk ML creados antes del 4 de febrero de 2026 a tipos de máquinas G4.
- Cuando crees instancias G4 que tengan menos de una GPU conectada (GPU fraccionarias), no uses las marcas
--no-service-accountni--no-scopes. Para autenticar los controladores de GPU virtual de NVIDIA, Compute Engine debe verificar la identidad de la VM. Este proceso requiere que las cuentas de servicio estén habilitadas.
Instancias G2
- Solo puedes solicitar capacidad con las opciones de consumo compatibles para un tipo de máquina G2.
- No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G2.
- Solo puedes usar un tipo de máquina G2 en ciertas regiones y zonas.
- Los tipos de máquinas G2 solo están disponibles en la plataforma Cascade Lake.
- El disco persistente estándar (
pd-standard) no es compatible con las instancias que usan el tipo de máquina G2. Para conocer los tipos de discos compatibles, consulta Tipos de discos compatibles con G2. - No puedes crear GPUs de instancias múltiples en una instancia que usa un tipo de máquina G2.
- Si necesitas cambiar el tipo de máquina de una instancia G2, revisa Modifica las instancias optimizadas para aceleradores.
- No puedes usar imágenes de Deep Learning VM Image como discos de arranque para las instancias que usan el tipo de máquina G2.
- El controlador predeterminado actual para Container-Optimized OS no es compatible con las GPU L4 que se ejecutan en los tipos de máquinas G2. Además, Container-Optimized OS solo admite un conjunto selecto de controladores.
Si deseas usar Container-Optimized OS en tipos de máquinas G2, revisa las siguientes notas:
- Usa una versión de Container-Optimized OS que sea compatible con la versión mínima recomendada del controlador NVIDIA
525.60.13o posterior. Para obtener más información, revisa las notas de la versión de Container-Optimized OS. - Cuando instalas el controlador, especifica la versión más reciente disponible que funcione para las GPU L4.
Por ejemplo,
sudo cos-extensions install gpu -- -version=525.60.13
- Usa una versión de Container-Optimized OS que sea compatible con la versión mínima recomendada del controlador NVIDIA
- Debes usar Google Cloud CLI o REST para crear instancias de G2 en las siguientes situaciones:
- Deseas especificar valores de memoria personalizados.
- Deseas personalizar la cantidad de núcleos de CPU visibles.
Instancias A2
- Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina estándar A2.
- No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A2 estándar.
- Solo puedes usar un tipo de máquina A2 estándar en ciertas regiones y zonas.
- Los tipos de máquinas A2 estándar solo están disponibles en la plataforma Cascade Lake.
- Si tu instancia usa un tipo de máquina estándar A2, solo puedes cambiar de un tipo de máquina estándar A2 a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Cómo modificar instancias optimizadas para aceleradores.
- No puedes usar el sistema operativo Windows con el tipo de máquina
a2-megagpu-16g. Cuando uses un sistema operativo Windows, elige un tipo de máquina A2 estándar diferente. - No puedes realizar un formateo rápido de las SSD locales conectadas en las instancias de Windows que usan los tipos de máquinas A2 estándar.
Para formatear estos SSD locales, debes realizar un formateo completo mediante el uso de la utilidad diskpart y la especificación de
format fs=ntfs label=tmpfs.
Instancias de uso general N1
En esta sección, se explica cómo agregar, modificar o quitar GPU de una instancia de VM creada con un tipo de máquina de uso general N1.
En resumen, el proceso para agregar, modificar o quitar GPU de una instancia existente es el siguiente:
- Verifica que tu instancia tenga un tamaño de disco de arranque de al menos 40 GiB.
- Detén la instancia.
Agrega, modifica o quita las GPU.
Si tu instancia N1 no tiene ninguna GPU conectada, debes completar los siguientes pasos:
- Prepara tu instancia para la modificación.
- Modifica la configuración de mantenimiento del host de la instancia. Las instancias con GPU no pueden migrar en vivo porque están asignadas a dispositivos de hardware específicos. Para obtener más información, consulta las restricciones de GPU.
- Cambiar el tipo de máquina Las GPU solo son compatibles con tipos de máquinas N1 seleccionados.
- Instala un controlador de GPU en tu instancia para que tu sistema pueda usar el dispositivo de GPU.
Prepara tu instancia
Cuando se agrega una GPU a una instancia, el orden de la interfaz de red puede cambiar.
La mayoría de las imágenes públicas de Compute Engine no tienen nombres de interfaz de red persistentes y se ajustan al orden nuevo.
Sin embargo, si usas SLES o una imagen personalizada, debes actualizar la configuración del sistema para evitar que la interfaz de red sea persistente. Para evitar que la interfaz de red persista, ejecuta el siguiente comando en tu instancia:
rm /etc/udev/rules.d/70-persistent-net.rules
Agrega GPU o modifica el tipo de GPU en instancias existentes
En esta sección, se explica cómo agregar GPU o modificar el tipo de GPU en una instancia de uso general N1 existente. Este procedimiento admite los siguientes tipos de GPU:
GPU de NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):
- Estación de trabajo virtual NVIDIA T4:
nvidia-tesla-t4-vws - Estación de trabajo virtual NVIDIA P4:
nvidia-tesla-p4-vws Estación de trabajo virtual NVIDIA P100:
nvidia-tesla-p100-vwsPara estas estaciones de trabajo virtuales, se agrega automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.
Console
Para agregar GPU o modificar el tipo de GPU, completa los siguientes pasos.
Verifica que todas las aplicaciones importantes estén detenidas en la instancia.
En la consola de Google Cloud , ve a la página Instancias de VM para ver tu lista de instancias.
Haz clic en el nombre de la instancia que deseas actualizar. Se abrirá la página Detalles.
Completa los siguientes pasos desde la página Detalles.
Si la instancia se está ejecutando, haz clic en Detener. Si no hay una opción de Detener, haz clic en Más acciones > Detener.
Haz clic en Editar.
En la sección Configuración de la máquina, selecciona la familia de máquinas GPU y, luego, haz lo siguiente:
En la lista Tipo de GPU, elige o cambia a cualquiera de los tipos de GPU compatibles con las VM N1.
En la lista Cantidad de GPU, selecciona la cantidad.
Si tu modelo de GPU es compatible con estaciones de trabajo virtuales (vWS) de NVIDIA RTX para cargas de trabajo de gráficos y planeas ejecutar cargas de trabajo de alto contenido gráfico en esta instancia, selecciona Habilitar estación de trabajo virtual (NVIDIA GRID).
Si tu instancia no tenía GPU conectadas antes, completa lo siguiente:
Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina. En la lista Tipo de máquina, elige uno de los tipos de máquina N1 predeterminados. Como alternativa, también puedes especificar una configuración de tipo de máquina personalizado.
En la sección Administración, completa lo siguiente:
En la lista Mantenimiento en el host, selecciona Finalizar instancia de VM. Las instancias con GPU conectadas no se pueden migrar en vivo. Consulta Controla eventos del host de GPU.
En la lista Reinicio automático, selecciona Desactivado.
Para aplicar los cambios, haz clic en Guardar.
Para reiniciar la VM, haz clic en Iniciar/Reanudar.
REST
Puedes agregar o modificar GPU en tu instancia; para ello, debes detenerla y cambiar su configuración a través de la API.
Verifica que todas tus aplicaciones importantes estén detenidas en la instancia y, luego, crea una solicitud
POSTpara detener la instancia a fin de que pueda trasladarse a un sistema host en el que las GPU estén disponibles.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
Si tu instancia no tiene ninguna GPU conectada, completa los siguientes pasos:
Identifica el tipo de GPU que deseas agregar a tu instancia. Puedes enviar una solicitud
GETa fin de enumerar los tipos de GPU que están disponibles para tu proyecto en una zona específica.GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina para que tenga una o más CPU virtuales. No puedes agregar aceleradores a instancias con tipos de máquina de núcleo compartido.
Crea una solicitud
POSTpara establecer las opciones de programación de la instancia.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling { "onHostMaintenance": "TERMINATE", "automaticRestart": true }
Crea una solicitud
POSTpara agregar o modificar las GPUs conectadas a tu instancia.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources { "guestAccelerators": [ { "acceleratorCount": ACCELERATOR_COUNT, "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE" } ] }Crea una solicitud
POSTpara iniciar la instancia.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
Reemplaza lo siguiente:
PROJECT_ID: el ID de tu proyectoVM_NAME: El nombre de la instancia a la que deseas agregar las GPU.ZONE: Es la zona en la que se encuentra la instancia.ACCELERATOR_COUNT: La cantidad de GPU que deseas conectar a tu instancia. Para obtener una lista de los límites de GPU en función del tipo de máquina de tu instancia, consulta GPU en Compute EngineACCELERATOR_TYPE: el modelo de GPU que deseas adjuntar o cambiarte. Si planeas ejecutar cargas de trabajo de alto contenido gráfico en esta instancia, usa uno de los modelos de estación de trabajo virtual.Elige uno de los siguientes valores:
GPU de NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
- NVIDIA T4:
NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):
- Estación de trabajo virtual NVIDIA T4:
nvidia-tesla-t4-vws - Estación de trabajo virtual NVIDIA P4:
nvidia-tesla-p4-vws - Estación de trabajo virtual NVIDIA P100:
nvidia-tesla-p100-vws
Para estas estaciones de trabajo virtuales, se agrega de forma automática una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.
- Estación de trabajo virtual NVIDIA T4:
Instalar controladores
Para instalar los controladores, elige una de las siguientes opciones:
- Si planeas ejecutar cargas de trabajo de alto procesamiento gráfico, como las de videojuegos y visualización, instala controladores para la estación de trabajo virtual de NVIDIA RTX.
- Para la mayoría de las cargas de trabajo, instala los controladores de GPU.
Quita GPUs
En esta sección, se explica cómo quitar los siguientes tipos de GPU de una instancia de uso general N1 existente.
GPU de NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):
- Estación de trabajo virtual NVIDIA T4:
nvidia-tesla-t4-vws - Estación de trabajo virtual NVIDIA P4:
nvidia-tesla-p4-vws Estación de trabajo virtual NVIDIA P100:
nvidia-tesla-p100-vwsPara estas estaciones de trabajo virtuales, se agrega automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.
Puedes usar Google Cloud console para quitar GPU de una instancia existente. Para quitar las GPU, completa los siguientes pasos:
Verifica que todas las aplicaciones importantes estén detenidas en la instancia.
En la consola de Google Cloud , ve a la página Instancias de VM para ver tu lista de instancias.
Haz clic en el nombre de la instancia de la que deseas quitar las GPUs. Se abrirá la página Detalles.
Completa los siguientes pasos desde la página Detalles.
Si la instancia se está ejecutando, haz clic en Detener para detenerla. Si no hay una opción de Detener, haz clic en Más acciones > Detener.
En la barra de herramientas, haz clic en Editar.
En la sección Configuración de la máquina, elige la familia de máquinas De uso general y, luego, haz lo siguiente:
Para ver las GPU conectadas, expande los parámetros de Configuración avanzada.
En la sección GPU, quita las GPU con una de las siguientes opciones:
Para quitar algunas GPU, elige una cantidad nueva en la lista Cantidad de GPU.
Para quitar todas las GPU, haz clic en Borrar GPU.
Opcional: Modifica la configuración de la política de mantenimiento del host de la instancia. Las instancias con GPU deben tener la política de mantenimiento del host configurada como Finalizar instancia de VM. Sin embargo, si quitaste todas las GPU, tienes la opción de migrar en vivo esta instancia durante el mantenimiento del host. Para obtener más información, consulta Configura la política de mantenimiento del host de VM.
Para aplicar los cambios, haz clic en Guardar.
Para reiniciar la instancia, haz clic en Iniciar/Reanudar.
Próximos pasos
- Más información sobre las plataformas de GPU.
- Agrega SSD locales a tus instancias. Los dispositivos SSD locales se combinan bien con las GPU cuando tus apps requieren almacenamiento de alto rendimiento.
- Crea grupos de instancias de GPU con plantillas de instancias.
- Para supervisar el rendimiento de la GPU, consulta la página sobre cómo supervisar el rendimiento de las GPU.
- Para mejorar el rendimiento de la red, consulta Usa un ancho de banda de red más alto.
- Para controlar el mantenimiento del host de la GPU, consulta la página sobre cómo controlar eventos del host de la GPU.
- Prueba el instructivo sobre la ejecución de las cargas de trabajo de inferencia de TensorFlow a gran escala con TensorRT5 y GPU NVIDIA T4.