Crear VMs de GPU de forma masiva
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Linux
Windows
Puedes crear un grupo de máquinas virtuales (VM) que
tengan unidades de procesamiento gráfico (GPU) conectadas
mediante el proceso de creación masiva. Con el proceso de creación masiva, obtienes
una validación por adelantado en la que la solicitud falla rápido si no es factible.
Además, si usas la marca de región, la API de creación masiva elige
de forma automática la zona que tiene la capacidad de completar la solicitud.
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
gcloud
Instala Google Cloud CLI.
Después de la instalación,
inicializa Google Cloud CLI con el siguiente comando:
Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local,
debes usar las credenciales que proporciones a la gcloud CLI.
Para obtener más información, consulta
Autentícate para usar REST
en la documentación de autenticación de Google Cloud .
Este rol predefinido contiene
los permisos necesarios para crear VM. Para ver los permisos exactos que son
necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para crear VM:
compute.instances.create
en el proyecto
Si deseas usar una imagen personalizada para crear la VM, sigue estos pasos: compute.images.useReadOnly en la imagen
Para usar una instantánea a fin de crear la VM, haz lo siguiente: compute.snapshots.useReadOnly en la instantánea
Si quieres usar una plantilla de instancias para crear la VM, sigue estos pasos: compute.instanceTemplates.useReadOnly en la plantilla de instancias
A fin de especificar una subred para tu VM: compute.subnetworks.use en el proyecto o en la subred elegida
Si deseas especificar una dirección IP estática para la VM: compute.addresses.use en el proyecto
Para asignar una dirección IP externa a la VM cuando se usa una red de VPC, compute.subnetworks.useExternalIp en el proyecto o en la subred elegida.
Para asignar una red heredada a la VM, ejecuta compute.networks.use en el proyecto.
Para asignar una dirección IP externa a la VM cuando se usa una red heredada, ejecuta compute.networks.useExternalIp en el proyecto
Para configurar los metadatos de la instancia de VM para la VM, compute.instances.setMetadata en el proyecto.
Para configurar etiquetas en la VM, haz lo siguiente: compute.instances.setTags en la VM
Para configurar etiquetas en la VM, haz lo siguiente: compute.instances.setLabels en la VM
A fin de configurar una cuenta de servicio para que la VM use: compute.instances.setServiceAccount en la VM
Crear un disco nuevo para la VM: compute.disks.create en el proyecto
Para conectar un disco existente en modo de solo lectura o de lectura y escritura, usa compute.disks.use en el disco.
Para conectar un disco existente en modo de solo lectura, haz lo siguiente: compute.disks.useReadOnly en el disco
Cuando creas VMs con GPU conectadas mediante el método de creación masiva, puedes elegir crear VMs en una región (como us-central1) o en una zona específica, como (us-central1-a).
Si eliges especificar una región, Compute Engine coloca las VMs en cualquier zona dentro de la región que admite las GPU.
Tipos de máquina
La familia de máquinas optimizadas para aceleradores contiene varios tipos de máquinas.
Cada tipo de máquina optimizada para aceleradores tiene un modelo específico de GPU de NVIDIA conectada para admitir el tipo de carga de trabajo recomendado.
Cargas de trabajo de IA y AA
Gráficos y visualización
Los tipos de máquinas de la serie A optimizados para aceleradores están diseñados para cargas de trabajo de computación de alto rendimiento (HPC), inteligencia artificial (IA) y aprendizaje automático (AA).
En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.
Los tipos de máquinas de la serie G optimizados para aceleradores están diseñados para cargas de trabajo como las de simulación de NVIDIA Omniverse, aplicaciones de alto procesamiento gráfico, transcodificación de video y escritorios virtuales. Estos tipos de máquinas admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX.
En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.
A4X Max
(NVIDIA GB300 Ultra Superchips) (nvidia-gb300)
En esta sección, se explica cómo puedes crear instancias de forma masiva para las series de máquinas A3 High, A3 Mega, A3 Edge, A2 Standard, A2 Ultra, G4 y G2 con Google Cloud CLI o REST.
Un tipo de máquina G2
Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1,024 MB y debe estar dentro del rango de memoria admitido. Por ejemplo, para crear una VM con 4 CPU virtuales y 19 GB de memoria, especifica --machine-type=g2-custom-4-19456.
Si deseas usar la imagen más reciente en una familia de imágenes, reemplaza la marca --image por la marca --image-family y configura su valor en una familia de imágenes que admita GPU. Por ejemplo: --image-family=rocky-linux-8-optimized-gcp
IMAGE_PROJECT: el proyecto de imagen de Compute Engine al que pertenece la imagen de SO. Si usas una imagen personalizada o una Deep Learning VM Image, especifica el proyecto al que pertenecen esas imágenes.
VWS_ACCELERATOR_COUNT es la cantidad de GPUs virtuales que necesitas.
Si se ejecuta de forma correcta, el resultado es similar al siguiente:
NAME ZONE
my-test-vm-1 us-central1-b
my-test-vm-2 us-central1-b
Bulk create request finished with status message: [VM instances created: 2, failed: 0.]
Marcas opcionales
Para configurar aún más tu instancia y satisfacer las necesidades de tu carga de trabajo o sistema operativo, incluye una o más de las siguientes marcas cuando ejecutes el comando gcloud compute instances bulk create.
Función
Descripción
Modelo de aprovisionamiento
Establece el modelo de aprovisionamiento para la instancia. Puedes especificar STANDARD o SPOT. Si no especificas un modelo de aprovisionamiento, Compute Engine establece el valor en STANDARD. Para obtener más información, consulta los modelos de aprovisionamiento de instancias de Compute Engine.
Para VWS_ACCELERATOR_TYPE, elige una de las siguientes opciones:
Para las instancias G4, especifica nvidia-rtx-pro-6000-vws.
Para las instancias G2, especifica nvidia-l4-vws.
Para VWS_ACCELERATOR_COUNT, especifica la cantidad de GPU virtuales que necesitas.
SSD local
Conecta uno o más SSD locales a tu instancia. Las SSD locales se pueden usar como discos rápidos para instalación nueva o para ingresar datos a las GPU y evitar los cuellos de botella de E/S.
Para conocer la cantidad máxima de discos SSD locales que puedes conectar por instancia de VM,
consulta Límites de SSD locales.
Interfaz de red
Asocia varias interfaces de red a tu instancia. En el caso de las instancias g4-standard-384, puedes adjuntar hasta dos interfaces de red. Puedes usar esta marca para crear una instancia con interfaces de red dobles (2 veces 200 Gbps). Cada interfaz de red debe estar en una red de VPC única.
SUBNET_NAME: Es el nombre de la subred que forma parte de la red de VPC especificada.
Política de posición
Controla la ubicación de tu instancia dentro de una zona. Puedes especificar una política de compactación para minimizar la latencia de red en tus instancias G2 o una política de distribución para mejorar la resiliencia de tus instancias G4 o G2 ante interrupciones específicas de la zona.
--resource-policies=POLICY_NAME
Reemplaza POLICY_NAME por el nombre de tu política de ubicación. Solo puedes crear la instancia en la misma región que la política.
REST
Usa el método instances.bulkInsert con los parámetros necesarios para crear varias VM en una región. Para obtener más información sobre los parámetros y cómo usar este comando, consulta Crea VMs de forma masiva.
Ejemplo
En este ejemplo, se crean dos VMs que tienen GPUs conectadas mediante las siguientes especificaciones:
Un tipo de máquina G2.
Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1,024 MB y debe estar dentro del rango de memoria admitido. Por ejemplo, el nombre del tipo de máquina para una instancia con 4 CPU virtuales y 19 GB de memoria sería g2-custom-4-19456.
Familia de imágenes: "sourceImage": "projects/rocky-linux-cloud/global/images/family/rocky-linux-8-optimized-gcp".
Cuando especificas una familia de imágenes, Compute Engine crea una VM a partir de la imagen de SO no obsoleta más reciente de esa familia. Para obtener más información sobre el balanceo de cargas, consulta Prácticas recomendadas para las familias de imágenes.
Campos opcionales
Para configurar aún más tu instancia y satisfacer las necesidades de tu carga de trabajo o sistema operativo, incluye una o más de las siguientes marcas cuando ejecutes el método instances.bulkInsert.
Función
Descripción
Modelo de aprovisionamiento
Para reducir los costos, puedes especificar un modelo de aprovisionamiento diferente agregando el campo "provisioningModel": "PROVISIONING_MODEL" al objeto scheduling en tu solicitud. Para obtener más información, consulta los modelos de aprovisionamiento de instancias de Compute Engine.
Reemplaza PROVISIONING_MODEL por uno de los siguientes valores:
STANDARD: Es una instancia estándar. Este es el valor predeterminado.
SPOT: Una VM Spot. Si creas una VM Spot, se anularán los campos onHostMaintenance y automaticRestart.
Las VMs Spot tienen descuentos significativos, pero Compute Engine puede interrumpirlas en cualquier momento para recuperar capacidad.
Para VWS_ACCELERATOR_TYPE, elige una de las siguientes opciones:
Para las instancias G4, especifica nvidia-rtx-pro-6000-vws.
Para las instancias G2, especifica nvidia-l4-vws.
Para VWS_ACCELERATOR_COUNT, especifica la cantidad de GPU virtuales que necesitas.
SSD local
Conecta uno o más SSD locales a tu instancia. Las SSD locales se pueden usar como discos rápidos para instalación nueva o para ingresar datos a las GPU y evitar los cuellos de botella de E/S.
Para conocer la cantidad máxima de discos SSD locales que puedes conectar por instancia de VM,
consulta Límites de SSD locales.
Interfaz de red
Asocia varias interfaces de red a tu instancia. En el caso de las instancias g4-standard-384, puedes adjuntar hasta dos interfaces de red. Esto crea una instancia con interfaces de red dobles (2 x 200 Gbps). Cada interfaz de red debe estar en una red de VPC única.
Las interfaces de red duales solo son compatibles con los tipos de máquinas g4-standard-384.
Reemplaza lo siguiente:
VPC_NAME_1 y VPC_NAME_2: Son los nombres de tus redes de VPC.
SUBNET_NAME: Es el nombre de la subred que forma parte de las redes de VPC especificadas.
Política de posición
Controla la ubicación de tu instancia dentro de una zona. Puedes especificar una política de compactación para minimizar la latencia de red en tus instancias G2 o una política de distribución para mejorar la resiliencia de tus instancias G4 o G2 ante interrupciones específicas de la zona.
Si se ejecuta de forma correcta, el resultado es similar al siguiente:
NAME ZONE
my-test-vm-1 us-central1-b
my-test-vm-2 us-central1-b
Bulk create request finished with status message: [VM instances created: 2, failed: 0.]
REST
Usa el método instances.bulkInsert con los parámetros necesarios para crear varias VM en una región.
Para obtener más información sobre los parámetros y cómo usar este comando, consulta Crea VMs de forma masiva.
Ejemplo
En el siguiente ejemplo, se crean dos VMs con GPU conectadas mediante las siguientes especificaciones:
Nombres de las VM: my-test-vm-1, my-test-vm-2
VM creadas en cualquier zona de us-central1 que admita GPU
Cada VM tiene dos GPU T4 conectadas, especificadas mediante el tipo de acelerador y las marcas de recuento de aceleradores.
Cada VM tiene instalados controladores de GPU
Cada VM usa Deep Learning VM Image pytorch-latest-gpu-v20211028-debian-10
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2026-03-14 (UTC)"],[],[]]