Compute Engine proporciona unidades de procesamiento de gráficos (GPU) que puedes agregar a tus instancias de máquina virtual (VM). Puedes usar estas GPU para acelerar cargas de trabajo específicas en las VM, como el aprendizaje automático y el procesamiento de datos.
Solo puedes usar dos familias de máquinas cuando ejecutas GPU en Compute Engine:
- Es la familia de máquinas con optimización de acelerador. Todos los tipos de máquinas optimizadas para aceleradores tienen GPU conectadas.
- La familia de máquinas de uso general N1. Puedes usar la mayoría de los tipos de máquinas N1, excepto el tipo de máquina de núcleo compartido N1. Si no usas una máquina de uso general N1, puedes cambiar a una máquina de uso general N1 y, luego, agregar las GPU.
Antes de comenzar
- Para revisar los pasos de requisitos previos adicionales, como elegir una imagen de SO y verificar la cuota de GPU, revisa el documento de descripción general.
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a gcloud CLI.
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI ejecutando el siguiente comando:
gcloud initSi usas un proveedor de identidad externo (IdP), primero debes acceder a gcloud CLI con tu identidad federada.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .
VMs optimizadas para aceleradores
Cada tipo de máquina optimizada para aceleradores tiene un modelo específico de GPU de NVIDIA conectada para admitir el tipo de carga de trabajo recomendado.
Cargas de trabajo de IA y AA Gráficos y visualización Los tipos de máquinas de la serie A optimizados para aceleradores están diseñados para cargas de trabajo de computación de alto rendimiento (HPC), inteligencia artificial (IA) y aprendizaje automático (AA). En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.
Los tipos de máquinas de la serie G optimizados para aceleradores están diseñados para cargas de trabajo como las de simulación de NVIDIA Omniverse, aplicaciones de alto procesamiento gráfico, transcodificación de video y escritorios virtuales. Estos tipos de máquinas admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX. En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.
- A4X
(Superchips NVIDIA GB200)
(nvidia-gb200) - A4
(NVIDIA B200)
(nvidia-b200) - A3 Ultra
(NVIDIA H200)
(nvidia-h200-141gb) - A3 Mega
(NVIDIA H100)
(nvidia-h100-mega-80gb) - A3 High
(NVIDIA H100)
(nvidia-h100-80gb) - A3 Edge
(NVIDIA H100)
(nvidia-h100-80gb) - A2 Ultra
(NVIDIA A100 80 GB)
(nvidia-a100-80gb) - A2 Standard
(NVIDIA A100)
(nvidia-a100-40gb)
Puedes modificar cada instancia optimizada para aceleradores de la siguiente manera:
En el caso de las instancias A4X, A4, A3 y A2 Ultra, no puedes modificar el tipo de máquina. Si usas alguno de estos tipos de máquinas para tu instancia y necesitas cambiar el tipo de máquina, crea una instancia nueva.
Para las instancias estándar A2, puedes modificar el recuento de GPU si cambias de un tipo de máquina estándar A2 a otro.
En el caso de las instancias G4, puedes modificar el recuento de GPU si cambias de un tipo de máquina G4 a otro.
Para las instancias de G2, puedes hacer lo siguiente:
- Para modificar el recuento de GPU, cambia de un tipo de máquina estándar G2 a otro tipo de máquina estándar G2.
- Puedes cambiar de un tipo de máquina estándar G2 a uno desde una familia de máquinas diferente, como optimizada para procesamiento o de uso general. Consulta Edita el tipo de máquina de una VM.
No puedes quitar las GPU de ninguno de los tipos de máquinas optimizadas para aceleradores.
Modifica el recuento de GPU
Puedes modificar el recuento de GPU de una instancia estándar A2, G4 o G2 optimizada para aceleradores con la Google Cloud consola o REST.
Console
Puedes modificar la cantidad de GPU de tu instancia; para ello, debes detener y editar la configuración de la instancia.
Verifica que todas las aplicaciones importantes estén detenidas en la instancia.
En la Google Cloud consola, ve a la página Instancias de VM para ver tu lista de instancias.
Haz clic en el nombre de la instancia de la que deseas modificar la cantidad de GPU. Se abrirá la página Detalles.
Completa los siguientes pasos desde la página Detalles.
Si la instancia se está ejecutando, haz clic en Detener para detenerla. Si no hay una opción de Detener, haz clic en Más acciones > Detener.
Haz clic en Editar.
En la sección Configuración de la máquina, selecciona la familia de máquinas GPU y, luego, haz lo siguiente:
En la lista Cantidad de GPU, aumenta o disminuye el recuento de GPU.
Para aplicar los cambios, haz clic en Guardar.
Para reiniciar la instancia, haz clic en Iniciar/Reanudar.
REST
Puedes modificar la cantidad de GPUs en tu instancia deteniéndola y cambiando el tipo de máquina. Cada tipo de máquina optimizada para acelerador tiene una cantidad específica de GPU conectadas. Si cambias el tipo de máquina, se ajusta la cantidad de GPU conectadas a la instancia.
Verifica que todas tus aplicaciones importantes estén detenidas en la instancia y, luego, crea un comando POST para detener la instancia a fin de que pueda trasladarse a un sistema host en el que las GPU estén disponibles.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
Después de que la instancia se detenga, crea una solicitud POST para cambiar el tipo de máquina.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType { machineType: "zones/ZONE/machineTypes/MACHINE_TYPE" }Inicia la instancia.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
Reemplaza lo siguiente:
PROJECT_ID: el ID de tu proyectoVM_NAME: El nombre de la instancia a la que deseas agregar las GPU.ZONE: Es la zona en la que se encuentra la instancia. Esta zona debe ser compatible con las GPU.MACHINE_TYPE: es el tipo de máquina que deseas usar. Debe ser una de las siguientes opciones:- Si tu instancia usa una máquina estándar A2, elige otro tipo de máquina estándar A2.
- Si tu instancia usa una máquina G4, elige otro tipo de máquina G4.
- Si tu instancia usa un tipo de máquina G2, elige otro tipo de máquina G2.
Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1,024 MB y debe estar dentro del rango de memoria admitido. Por ejemplo, el nombre del tipo de máquina para una instancia con 4 CPU virtuales y 19 GB de memoria sería
g2-custom-4-19456.
Limitaciones
Instancias A2
- Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina estándar A2.
- No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina A2 estándar.
- Solo puedes usar un tipo de máquina A2 estándar en ciertas regiones y zonas.
- Los tipos de máquinas A2 estándar solo están disponibles en la plataforma Cascade Lake.
- Si tu instancia usa un tipo de máquina estándar A2, solo puedes cambiar de un tipo de máquina estándar A2 a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Modifica instancias optimizadas para aceleradores.
- No puedes usar el sistema operativo Windows con el tipo de máquina
a2-megagpu-16g. Cuando uses un sistema operativo Windows, elige un tipo de máquina A2 estándar diferente. - No puedes realizar un formateo rápido de las SSD locales conectadas en las instancias de Windows que usan los tipos de máquinas A2 estándar.
Para formatear estos SSD locales, debes realizar un formateo completo mediante el uso de la utilidad diskpart y la especificación de
format fs=ntfs label=tmpfs. - Los tipos de máquinas A2 estándar no admiten usuarios únicos.
Instancias G2
- Solo puedes solicitar capacidad con las opciones de consumo compatibles para un tipo de máquina G2.
- No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G2.
- Solo puedes usar un tipo de máquina G2 en ciertas regiones y zonas.
- Los tipos de máquinas G2 solo están disponibles en la plataforma Cascade Lake.
- El disco persistente estándar (
pd-standard) no es compatible con las instancias que usan el tipo de máquina G2. Para conocer los tipos de discos compatibles, consulta Tipos de discos compatibles con G2. - No puedes crear GPUs de instancias múltiples en una instancia que usa un tipo de máquina G2.
- Si necesitas cambiar el tipo de máquina de una instancia G2, revisa Modifica las instancias optimizadas para aceleradores.
- No puedes usar imágenes de Deep Learning VM Image como discos de arranque para las instancias que usan el tipo de máquina G2.
- El controlador predeterminado actual para Container-Optimized OS no es compatible con las GPU L4 que se ejecutan en los tipos de máquinas G2. Además, Container-Optimized OS solo admite un conjunto selecto de controladores.
Si deseas usar Container-Optimized OS en tipos de máquinas G2, revisa las siguientes notas:
- Usa una versión de Container-Optimized OS que sea compatible con la versión mínima recomendada del controlador NVIDIA
525.60.13o posterior. Para obtener más información, revisa las notas de la versión de Container-Optimized OS. - Cuando instalas el controlador, especifica la versión más reciente disponible que funcione para las GPU L4.
Por ejemplo,
sudo cos-extensions install gpu -- -version=525.60.13
- Usa una versión de Container-Optimized OS que sea compatible con la versión mínima recomendada del controlador NVIDIA
- Debes usar Google Cloud CLI o REST para crear instancias de G2 en las siguientes situaciones:
- Deseas especificar valores de memoria personalizados.
- Deseas personalizar la cantidad de núcleos de CPU visibles.
Instancias G4
- Solo puedes solicitar capacidad con las opciones de consumo admitidas para un tipo de máquina G4.
- No recibirás descuentos por uso continuo ni descuentos por compromiso de uso flexible para las instancias que usan un tipo de máquina G4.
- Solo puedes usar un tipo de máquina G4 en ciertas regiones y zonas.
- No puedes usar Persistent Disk (regional o zonal) en una instancia que use un tipo de máquina G4.
- El tipo de máquina G4 solo está disponible en la plataforma AMD EPYC Turin de 5ª generación.
- No puedes crear instancias de VM confidenciales que usen un tipo de máquina G4.
- No puedes crear instancias G4 en nodos de usuario único.
- No puedes usar sistemas operativos Windows en instancias
g4-standard-384.
Instancias de uso general N1
En esta sección, se explica cómo agregar, modificar o quitar GPU de una máquina de uso general N1.
En resumen, el proceso para agregar, modificar o quitar GPU de una instancia existente es el siguiente:
- Verifica que tu instancia tenga un tamaño de disco de arranque de al menos 40 GB.
- Detén la instancia.
Agrega, modifica o quita las GPU.
Si tu instancia N1 no tiene ninguna GPU conectada, debes completar los siguientes pasos:
- Prepara tu instancia para la modificación.
- Modifica la configuración de mantenimiento del host de la instancia. Las instancias con GPU no pueden migrar en vivo porque están asignadas a dispositivos de hardware específicos. Para obtener más información, consulta las restricciones de GPU.
- Cambiar el tipo de máquina Las GPU solo son compatibles con tipos de máquinas N1 seleccionados.
- Instala un controlador de GPU en tu instancia para que tu sistema pueda usar el dispositivo de GPU.
Prepara tu instancia
Cuando se agrega una GPU a una instancia, el orden de la interfaz de red puede cambiar.
La mayoría de las imágenes públicas de Compute Engine no tienen nombres de interfaz de red persistentes y se ajustan al orden nuevo.
Sin embargo, si usas SLES o una imagen personalizada, debes actualizar la configuración del sistema para evitar que la interfaz de red sea persistente. Para evitar que la interfaz de red persista, ejecuta el siguiente comando en tu instancia:
rm /etc/udev/rules.d/70-persistent-net.rules
Agrega GPU o modifica el tipo de GPU en instancias existentes
En esta sección, se explica cómo agregar GPU o modificar el tipo de GPU en una instancia de uso general N1 existente. Este procedimiento admite los siguientes tipos de GPU:
GPU de NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):
- Estación de trabajo virtual NVIDIA T4:
nvidia-tesla-t4-vws - Estación de trabajo virtual NVIDIA P4:
nvidia-tesla-p4-vws Estación de trabajo virtual NVIDIA P100:
nvidia-tesla-p100-vwsPara estas estaciones de trabajo virtuales, se agrega de forma automática una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.
Console
Para agregar GPU o modificar el tipo de GPU, completa los siguientes pasos.
Verifica que todas las aplicaciones importantes estén detenidas en la instancia.
En la Google Cloud consola, ve a la página Instancias de VM para ver tu lista de instancias.
Haz clic en el nombre de la instancia que deseas actualizar. Se abrirá la página Detalles.
Completa los siguientes pasos desde la página Detalles.
Si la instancia se está ejecutando, haz clic en Detener. Si no hay una opción de Detener, haz clic en Más acciones > Detener.
Haz clic en Editar.
En la sección Configuración de la máquina, selecciona la familia de máquinas GPU y, luego, haz lo siguiente:
En la lista Tipo de GPU, elige o cambia a cualquiera de los tipos de GPU compatibles con las VM N1.
En la lista Cantidad de GPU, selecciona la cantidad.
Si tu modelo de GPU es compatible con estaciones de trabajo virtuales (vWS) de NVIDIA RTX para cargas de trabajo de gráficos y planeas ejecutar cargas de trabajo de alto contenido gráfico en esta instancia, selecciona Habilitar estación de trabajo virtual (NVIDIA GRID).
Si tu instancia no tenía GPU conectadas antes, completa lo siguiente:
Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina. En la lista Tipo de máquina, elige uno de los tipos de máquina N1 predeterminados. Como alternativa, también puedes especificar una configuración de tipo de máquina personalizado.
En la sección Administración, completa lo siguiente:
En la lista Mantenimiento en el host, selecciona Finalizar instancia de VM. Las instancias con GPU conectadas no se pueden migrar en vivo. Consulta Controla eventos del host de GPU.
En la lista Reinicio automático, selecciona Desactivado.
Para aplicar los cambios, haz clic en Guardar.
Para reiniciar la VM, haz clic en Iniciar/Reanudar.
REST
Puedes agregar o modificar GPU en tu instancia; para ello, debes detenerla y cambiar su configuración a través de la API.
Verifica que todas tus aplicaciones importantes estén detenidas en la instancia y, luego, crea un comando POST para detener la instancia a fin de que pueda trasladarse a un sistema host en el que las GPU estén disponibles.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
Si tu instancia no tiene ninguna GPU conectada, completa los siguientes pasos:
Identifica el tipo de GPU que deseas agregar a tu instancia. Puedes enviar una solicitud
GETa fin de enumerar los tipos de GPU que están disponibles para tu proyecto en una zona específica.GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
Si la instancia tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina para que tenga una o más CPU virtuales. No puedes agregar aceleradores a instancias con tipos de máquina de núcleo compartido.
Crea un comando POST para establecer las opciones de programación de la instancia.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling { "onHostMaintenance": "TERMINATE", "automaticRestart": true }
Crea una solicitud POST para agregar o modificar las GPUs conectadas a tu instancia.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources { "guestAccelerators": [ { "acceleratorCount": ACCELERATOR_COUNT, "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE" } ] }Inicia la instancia.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
Reemplaza lo siguiente:
PROJECT_ID: el ID de tu proyectoVM_NAME: El nombre de la instancia a la que deseas agregar las GPU.ZONE: Es la zona en la que se encuentra la instancia.ACCELERATOR_COUNT: La cantidad de GPU que deseas conectar a tu instancia. Para obtener una lista de los límites de GPU en función del tipo de máquina de tu instancia, consulta GPU en Compute EngineACCELERATOR_TYPE: el modelo de GPU que deseas adjuntar o cambiarte. Si planeas ejecutar cargas de trabajo de alto contenido gráfico en esta instancia, usa uno de los modelos de estación de trabajo virtual.Elige uno de los siguientes valores:
GPU de NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
- NVIDIA T4:
NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):
- Estación de trabajo virtual NVIDIA T4:
nvidia-tesla-t4-vws - Estación de trabajo virtual NVIDIA P4:
nvidia-tesla-p4-vws - Estación de trabajo virtual NVIDIA P100:
nvidia-tesla-p100-vws
Para estas estaciones de trabajo virtuales, se agrega de forma automática una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.
- Estación de trabajo virtual NVIDIA T4:
Instalar controladores
Para instalar los controladores, elige una de las siguientes opciones:
- Si planeas ejecutar cargas de trabajo de alto procesamiento gráfico, como las de videojuegos y visualización, instala controladores para la estación de trabajo virtual de NVIDIA RTX.
- Para la mayoría de las cargas de trabajo, instala los controladores de GPU.
Quita GPUs
En esta sección, se explica cómo quitar los siguientes tipos de GPU de una instancia de uso general N1 existente.
GPU de NVIDIA:
- NVIDIA T4:
nvidia-tesla-t4 - NVIDIA P4:
nvidia-tesla-p4 - NVIDIA P100:
nvidia-tesla-p100 - NVIDIA V100:
nvidia-tesla-v100
NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):
- Estación de trabajo virtual NVIDIA T4:
nvidia-tesla-t4-vws - Estación de trabajo virtual NVIDIA P4:
nvidia-tesla-p4-vws Estación de trabajo virtual NVIDIA P100:
nvidia-tesla-p100-vwsPara estas estaciones de trabajo virtuales, se agrega de forma automática una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.
Puedes usar Google Cloud console para quitar GPU de una instancia existente. Para quitar las GPU, completa los siguientes pasos:
Verifica que todas las aplicaciones importantes estén detenidas en la instancia.
En la Google Cloud consola, ve a la página Instancias de VM para ver tu lista de instancias.
Haz clic en el nombre de la instancia de la que deseas quitar las GPUs. Se abrirá la página Detalles.
Completa los siguientes pasos desde la página Detalles.
Si la instancia se está ejecutando, haz clic en Detener para detenerla. Si no hay una opción de Detener, haz clic en Más acciones > Detener.
En la barra de herramientas, haz clic en Editar.
En la sección Configuración de la máquina, elige la familia de máquinas De uso general y, luego, haz lo siguiente:
Para ver las GPU conectadas, expande los parámetros de Configuración avanzada.
En la sección GPU, quita las GPU con una de las siguientes opciones:
Para quitar algunas GPU, elige una cantidad nueva en la lista Cantidad de GPU.
Para quitar todas las GPU, haz clic en Borrar GPU.
Opcional: Modifica la configuración de la política de mantenimiento del host de la instancia. Las instancias con GPU deben tener la política de mantenimiento del host configurada como Finalizar instancia de VM. Sin embargo, si quitaste todas las GPU, tienes la opción de migrar en vivo esta instancia durante el mantenimiento del host. Para obtener más información, consulta Configura la política de mantenimiento del host de VM.
Para aplicar los cambios, haz clic en Guardar.
Para reiniciar la instancia, haz clic en Iniciar/Reanudar.
Próximos pasos
- Más información sobre las plataformas de GPU.
- Agrega SSD locales a tus instancias. Los dispositivos SSD locales se combinan bien con las GPU cuando tus apps requieren almacenamiento de alto rendimiento.
- Crea grupos de instancias de GPU con plantillas de instancias.
- Para supervisar el rendimiento de la GPU, consulta la página sobre cómo supervisar el rendimiento de las GPU.
- Para mejorar el rendimiento de la red, consulta Usa un ancho de banda de red más alto.
- Para controlar el mantenimiento del host de la GPU, consulta la página sobre cómo controlar eventos del host de la GPU.
- Prueba el instructivo sobre la ejecución de las cargas de trabajo de inferencia de TensorFlow a gran escala con TensorRT5 y GPU NVIDIA T4.
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-10-22 (UTC)
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-10-22 (UTC)"],[],[]] - A4X
(Superchips NVIDIA GB200)