Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Crear VMs de GPU de forma masiva

Linux Windows

Puedes crear un grupo de máquinas virtuales (VM) que tengan unidades de procesamiento gráfico (GPU) conectadas mediante el proceso de creación masiva. Con el proceso de creación masiva, obtienes una validación por adelantado en la que la solicitud falla rápido si no es factible. Además, si usas la marca de región, la API de creación masiva elige de forma automática la zona que tiene la capacidad de completar la solicitud.

Para obtener más información sobre la creación masiva, consulta Acerca de la creación masiva de VMs. Para obtener más información sobre cómo crear VMs con GPU conectadas, consulta la Descripción general de la creación de una instancia con GPU conectadas.

Antes de comenzar

Para revisar las limitaciones y los pasos de requisitos previos adicionales para crear instancias con GPU conectadas, como seleccionar una imagen de SO y verificar la cuota de GPU, consulta la Descripción general de la creación de una instancia con GPU conectadas.
Para revisar las limitaciones de la creación masiva, consulta Acerca de la creación masiva de VMs.
Si aún no lo hiciste, configura la autenticación. La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Selecciona la pestaña que corresponda a la forma en que planeas usar las muestras de esta página:
gcloud
1. Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
  gcloud init
  Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.
  
  Nota: Si ya instalaste gcloud CLI, asegúrate de tener la versión más reciente. Para esto, ejecuta gcloud components update.
Configura una región y una zona predeterminadas.

REST

Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.

Instala Google Cloud CLI.

Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.

Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .

Roles obligatorios

Para obtener los permisos que necesitas para crear VMs, pídele a tu administrador que te otorgue el rol de IAM Administrador de instancias de Compute (v1) (roles/compute.instanceAdmin.v1) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para crear VM. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para crear VM:

compute.instances.create en el proyecto
Si deseas usar una imagen personalizada para crear la VM, sigue estos pasos: compute.images.useReadOnly en la imagen
Para usar una instantánea a fin de crear la VM, haz lo siguiente: compute.snapshots.useReadOnly en la instantánea
Si quieres usar una plantilla de instancias para crear la VM, sigue estos pasos: compute.instanceTemplates.useReadOnly en la plantilla de instancias
A fin de especificar una subred para tu VM: compute.subnetworks.use en el proyecto o en la subred elegida
Si deseas especificar una dirección IP estática para la VM: compute.addresses.use en el proyecto
Para asignar una dirección IP externa a la VM cuando se usa una red de VPC, compute.subnetworks.useExternalIp en el proyecto o en la subred elegida.
Para asignar una red heredada a la VM, ejecuta compute.networks.use en el proyecto.
Para asignar una dirección IP externa a la VM cuando se usa una red heredada, ejecuta compute.networks.useExternalIp en el proyecto
Para configurar los metadatos de la instancia de VM para la VM, compute.instances.setMetadata en el proyecto.
Para configurar etiquetas en la VM, haz lo siguiente: compute.instances.setTags en la VM
Para configurar etiquetas en la VM, haz lo siguiente: compute.instances.setLabels en la VM
A fin de configurar una cuenta de servicio para que la VM use: compute.instances.setServiceAccount en la VM
Crear un disco nuevo para la VM: compute.disks.create en el proyecto
Para conectar un disco existente en modo de solo lectura o de lectura y escritura, usa compute.disks.use en el disco.
Para conectar un disco existente en modo de solo lectura, haz lo siguiente: compute.disks.useReadOnly en el disco

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Descripción general

Cuando creas VMs con GPU conectadas mediante el método de creación masiva, puedes elegir crear VMs en una región (como us-central1) o en una zona específica, como (us-central1-a).

Si eliges especificar una región, Compute Engine coloca las VMs en cualquier zona dentro de la región que admite las GPU.

Tipos de máquina

Puedes crear VMs con GPU de forma masiva con tipos de máquinas optimizados para aceleradores o de uso general N1.

Compute Engine ofrece diferentes tipos de máquinas para admitir tus diversas cargas de trabajo.

Algunos tipos de máquinas admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX. Cuando creas una instancia que usa la estación de trabajo virtual NVIDIA RTX, Compute Engine agrega automáticamente una licencia de vWS. Para obtener información sobre los precios de las estaciones de trabajo virtuales, consulta la página de precios de GPU.

Tipos de máquinas de GPU
Cargas de trabajo de IA y AA	Gráficos y visualización	Otras cargas de trabajo de GPU
Los tipos de máquinas de la serie A optimizados para aceleradores están diseñados para cargas de trabajo de computación de alto rendimiento (HPC), inteligencia artificial (IA) y aprendizaje automático (AA). La serie A de generaciones posteriores es ideal para el entrenamiento previo y el ajuste de modelos de base que involucran grandes clústeres de aceleradores, mientras que la serie A2 se puede usar para entrenar modelos más pequeños y realizar inferencias de un solo host. En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.	Los tipos de máquinas de la serie G optimizados para aceleradores están diseñados para cargas de trabajo como las de simulación de NVIDIA Omniverse, aplicaciones de alto procesamiento gráfico, transcodificación de video y escritorios virtuales. Estos tipos de máquinas admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX. La serie G también se puede usar para entrenar modelos más pequeños y para la inferencia de un solo host. En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.	Para los tipos de máquinas N1 de uso general, excepto el N1 con núcleo compartido (`f1-micro` y `g1-small`), puedes conectar un conjunto selecto de modelos de GPU. Algunos de estos modelos de GPU también admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX.
A4X Max (NVIDIA GB300 Ultra Superchips) (`nvidia-gb300`) A4X (NVIDIA GB200 Superchips) (`nvidia-gb200`) A4 (NVIDIA B200) (`nvidia-b200`) A3 Ultra (NVIDIA H200) (`nvidia-h200-141gb`) A3 Mega (NVIDIA H100) (`nvidia-h100-mega-80gb`) A3 High (NVIDIA H100) (`nvidia-h100-80gb`) A3 Edge (NVIDIA H100) (`nvidia-h100-80gb`) A2 Ultra (NVIDIA A100 80 GB) (`nvidia-a100-80gb`) A2 Standard (NVIDIA A100 40 GB) (`nvidia-tesla-a100`)	G4 (NVIDIA RTX PRO 6000) (`nvidia-rtx-pro-6000`) (`nvidia-rtx-pro-6000-vws`) G2 (NVIDIA L4) (`nvidia-l4`) (`nvidia-l4-vws`)	Los siguientes modelos de GPU se pueden conectar a los tipos de máquinas de uso general N1: NVIDIA T4 (`nvidia-tesla-t4`) (`nvidia-tesla-t4-vws`) NVIDIA P4 (`nvidia-tesla-p4`) (`nvidia-tesla-p4-vws`) NVIDIA V100 (`nvidia-tesla-v100`) NVIDIA P100 (`nvidia-tesla-p100`) (`nvidia-tesla-p100-vws`). La GPU NVIDIA P100 se acerca al fin de su asistencia. Consulta Fin de la asistencia de NVIDIA P100.

Tipos de máquinas de GPU

Cargas de trabajo de IA y AA Gráficos y visualización Otras cargas de trabajo de GPU

Los tipos de máquinas de la serie A optimizados para aceleradores están diseñados para cargas de trabajo de computación de alto rendimiento (HPC), inteligencia artificial (IA) y aprendizaje automático (AA).

La serie A de generaciones posteriores es ideal para el entrenamiento previo y el ajuste de modelos de base que involucran grandes clústeres de aceleradores, mientras que la serie A2 se puede usar para entrenar modelos más pequeños y realizar inferencias de un solo host.

En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.

Los tipos de máquinas de la serie G optimizados para aceleradores están diseñados para cargas de trabajo como las de simulación de NVIDIA Omniverse, aplicaciones de alto procesamiento gráfico, transcodificación de video y escritorios virtuales. Estos tipos de máquinas admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX.

La serie G también se puede usar para entrenar modelos más pequeños y para la inferencia de un solo host.

En estos tipos de máquinas, el modelo de GPU se conecta automáticamente a la instancia.

Para los tipos de máquinas N1 de uso general, excepto el N1 con núcleo compartido (f1-micro y g1-small), puedes conectar un conjunto selecto de modelos de GPU. Algunos de estos modelos de GPU también admiten estaciones de trabajo virtuales (vWS) NVIDIA RTX.

A4X Max (NVIDIA GB300 Ultra Superchips)
(nvidia-gb300)
A4X (NVIDIA GB200 Superchips)
(nvidia-gb200)
A4 (NVIDIA B200)
(nvidia-b200)
A3 Ultra (NVIDIA H200)
(nvidia-h200-141gb)
A3 Mega (NVIDIA H100)
(nvidia-h100-mega-80gb)
A3 High (NVIDIA H100)
(nvidia-h100-80gb)
A3 Edge (NVIDIA H100)
(nvidia-h100-80gb)
A2 Ultra (NVIDIA A100 80 GB)
(nvidia-a100-80gb)
A2 Standard (NVIDIA A100 40 GB)
(nvidia-tesla-a100)

G4 (NVIDIA RTX PRO 6000)
(nvidia-rtx-pro-6000)
(nvidia-rtx-pro-6000-vws)
G2 (NVIDIA L4)
(nvidia-l4)
(nvidia-l4-vws)

Los siguientes modelos de GPU se pueden conectar a los tipos de máquinas de uso general N1:

NVIDIA T4
(nvidia-tesla-t4)
(nvidia-tesla-t4-vws)
NVIDIA P4
(nvidia-tesla-p4)
(nvidia-tesla-p4-vws)
NVIDIA V100
(nvidia-tesla-v100)
NVIDIA P100
(nvidia-tesla-p100)
(nvidia-tesla-p100-vws). La GPU NVIDIA P100 se acerca al fin de su asistencia. Consulta Fin de la asistencia de NVIDIA P100.

Crea grupos de A4X, A4 y A3 Ultra

Para crear instancias de forma masiva para las series de máquinas A4X, A4 y A3 Ultra, consulta la Descripción general de las opciones de implementación en la documentación de AI Hypercomputer.

Crea grupos de VMs A3, A2, G4 y G2

En esta sección, se explica cómo puedes crear instancias de forma masiva para las series de máquinas A3 High, A3 Mega, A3 Edge, A2 Standard, A2 Ultra, G4 y G2 con Google Cloud CLI o REST.

gcloud

Para crear un grupo de VMs, usa el comando gcloud compute instances bulk create. Para obtener más información sobre los parámetros y cómo usar este comando, consulta Crea VMs de forma masiva.

Ejemplo

En este ejemplo, se crean dos VMs que tienen GPUs conectadas mediante las siguientes especificaciones:

Nombres de las VM: my-test-vm-1, my-test-vm-2
Cada VM tiene dos GPU conectadas, especificadas mediante el tipo de máquina optimizado para aceleradores adecuado

gcloud compute instances bulk create \
    --name-pattern="my-test-vm-#" \
    --region=REGION \
    --count=2 \
    --machine-type=MACHINE_TYPE \
    --boot-disk-size=200 \
    --image=IMAGE \
    --image-project=IMAGE_PROJECT \
    --on-host-maintenance=TERMINATE

Reemplaza lo siguiente:

REGION: la región para las VMs. Esta región debe ser compatible con el tipo de máquina optimizado para aceleradores que seleccionaste.
MACHINE_TYPE: el tipo de máquina que seleccionaste. Elige una de las siguientes opciones:
- Un tipo de máquina A3 High
- Un tipo de máquina A3 Mega
- Un tipo de máquina A3 Edge
- Un tipo de máquina estándar A2
- Un tipo de máquina A2 Ultra
- Un tipo de máquina G4
- Un tipo de máquina G2 Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1,024 MB y debe estar dentro del rango de memoria admitido. Por ejemplo, para crear una VM con 4 CPU virtuales y 19 GB de memoria, especifica --machine-type=g2-custom-4-19456.
IMAGE: una imagen del sistema operativo que admite GPU.

Si deseas usar la imagen más reciente en una familia de imágenes, reemplaza la marca --image por la marca --image-family y configura su valor en una familia de imágenes que admita GPU. Por ejemplo: --image-family=rocky-linux-8-optimized-gcp

También puedes especificar una imagen personalizada o una Deep Learning VM Image.
IMAGE_PROJECT: el proyecto de imagen de Compute Engine al que pertenece la imagen de SO. Si usas una imagen personalizada o una Deep Learning VM Image, especifica el proyecto al que pertenecen esas imágenes.
VWS_ACCELERATOR_COUNT es la cantidad de GPUs virtuales que necesitas.

Si se ejecuta de forma correcta, el resultado es similar al siguiente:

NAME          ZONE
my-test-vm-1  us-central1-b
my-test-vm-2  us-central1-b
Bulk create request finished with status message: [VM instances created: 2, failed: 0.]

Marcas opcionales

Para configurar aún más tu instancia y satisfacer las necesidades de tu carga de trabajo o sistema operativo, incluye una o más de las siguientes marcas cuando ejecutes el comando gcloud compute instances bulk create.

Función	Descripción
Modelo de aprovisionamiento	Establece el modelo de aprovisionamiento para la instancia. Puedes especificar `STANDARD` o `SPOT`. Si no especificas un modelo de aprovisionamiento, Compute Engine establece el valor en `STANDARD`. Para obtener más información, consulta los modelos de aprovisionamiento de instancias de Compute Engine. --provisioning-model=`PROVISIONING_MODEL`
Estación de trabajo virtual	Especifica estaciones de trabajo virtuales (vWS) NVIDIA RTX para cargas de trabajo de gráficos. Esta función solo es compatible con las instancias G4 y G2. --accelerator=type=`VWS_ACCELERATOR_TYPE`,count=`VWS_ACCELERATOR_COUNT` Reemplaza lo siguiente: Para `VWS_ACCELERATOR_TYPE`, elige una de las siguientes opciones: Para las instancias G4, especifica `nvidia-rtx-pro-6000-vws`. Para las instancias de G2, especifica `nvidia-l4-vws`. Para `VWS_ACCELERATOR_COUNT`, especifica la cantidad de GPU virtuales que necesitas.
SSD local	Conecta uno o más SSD locales a tu instancia. Las SSD locales se pueden usar como discos rápidos para instalación nueva o para ingresar datos a las GPU y evitar los cuellos de botella de E/S. --local-ssd=interface=nvme \ --local-ssd=interface=nvme \ --local-ssd=interface=nvme ... Para conocer la cantidad máxima de discos SSD locales que puedes conectar por instancia de VM, consulta Límites de SSD locales.
Interfaz de red	Conecta varias interfaces de red a tu instancia. En el caso de las instancias `g4-standard-384`, puedes adjuntar hasta dos interfaces de red. Puedes usar esta marca para crear una instancia con interfaces de red dobles (2 veces 200 Gbps). Cada interfaz de red debe estar en una red de VPC única. --network-interface=network=`VPC_NAME_1`,subnet=`SUBNET_NAME_1`,nic-type=GVNIC \ --network-interface=network=`VPC_NAME_2`,subnet=`SUBNET_NAME_2`,nic-type=GVNIC Las interfaces de red duales solo son compatibles con los tipos de máquinas `g4-standard-384`. Reemplaza lo siguiente: `VPC_NAME`: Es el nombre de tu red de VPC. `SUBNET_NAME`: Es el nombre de la subred que forma parte de la red de VPC especificada.
Política de posición	Controla la ubicación de tu instancia dentro de una zona. Puedes especificar una política de compactación para minimizar la latencia de red en tus instancias G2 o una política de distribución para mejorar la resiliencia de tus instancias G4 o G2 ante interrupciones específicas de la zona. --resource-policies=`POLICY_NAME` Reemplaza `POLICY_NAME` por el nombre de tu política de ubicación. Solo puedes crear la instancia en la misma región que la política.

REST

Usa el método instances.bulkInsert con los parámetros necesarios para crear varias VM en una región. Para obtener más información sobre los parámetros y cómo usar este comando, consulta Crea VMs de forma masiva.

Ejemplo

En este ejemplo, se crean dos VMs que tienen GPUs conectadas mediante las siguientes especificaciones:

Nombres de las VM: my-test-vm-1, my-test-vm-2

Cada VM tiene dos GPU conectadas, especificadas mediante el tipo de máquina optimizado para aceleradores adecuado

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instances/bulkInsert
{
"namePattern":"my-test-vm-#",
"count":"2",
"instanceProperties": {
  "machineType":MACHINE_TYPE,
  "disks":[
    {
      "type":"PERSISTENT",
      "initializeParams":{
        "diskSizeGb":"200",
        "sourceImage":SOURCE_IMAGE_URI
      },
      "boot":true
    }
  ],
  "name": "default",
  "networkInterfaces":
  [
    {
      "network": "projects/PROJECT_ID/global/networks/default"
    }
  ],
  "scheduling":{
    "onHostMaintenance":"TERMINATE",
    ["automaticRestart":true]
  }
}
}

Reemplaza lo siguiente:

PROJECT_ID: El ID de tu proyecto
REGION: la región para las VMs. Esta región debe ser compatible con el modelo de GPU seleccionado.
MACHINE_TYPE: el tipo de máquina que seleccionaste. Elige una de las siguientes opciones:
- Un tipo de máquina A3 High
- Un tipo de máquina A3 Mega
- Un tipo de máquina A3 Edge
- Un tipo de máquina estándar A2
- Un tipo de máquina A2 Ultra
- Un tipo de máquina G4
- Un tipo de máquina G2. Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1,024 MB y debe estar dentro del rango de memoria admitido. Por ejemplo, el nombre del tipo de máquina para una instancia con 4 CPU virtuales y 19 GB de memoria sería g2-custom-4-19456.
SOURCE_IMAGE_URI: el URI de la imagen o familia de imágenes específicas que deseas usar.

Por ejemplo:
- Imagen específica: "sourceImage": "projects/rocky-linux-cloud/global/images/rocky-linux-8-optimized-gcp-v20220719"
- Familia de imágenes: "sourceImage": "projects/rocky-linux-cloud/global/images/family/rocky-linux-8-optimized-gcp".
Cuando especificas una familia de imágenes, Compute Engine crea una VM a partir de la imagen de SO no obsoleta más reciente de esa familia. Para obtener más información sobre el balanceo de cargas, consulta Prácticas recomendadas para las familias de imágenes.

Campos opcionales

Para configurar aún más tu instancia y satisfacer las necesidades de tu carga de trabajo o sistema operativo, incluye una o más de las siguientes marcas cuando ejecutes el método instances.bulkInsert.

Función	Descripción
Modelo de aprovisionamiento	Para reducir los costos, puedes especificar un modelo de aprovisionamiento diferente agregando el campo `"provisioningModel": "PROVISIONING_MODEL"` al objeto `scheduling` en tu solicitud. Para obtener más información, consulta los modelos de aprovisionamiento de instancias de Compute Engine. "scheduling": { "onHostMaintenance": "TERMINATE", "provisioningModel": "`PROVISIONING_MODEL`" } Reemplaza `PROVISIONING_MODEL` por uno de los siguientes valores: `STANDARD`: Es una instancia estándar. Este es el valor predeterminado. `SPOT`: Una VM Spot Si creas una VM Spot, se anularán los campos `onHostMaintenance` y `automaticRestart`. Las VMs Spot tienen descuentos significativos, pero Compute Engine puede interrumpirlas en cualquier momento para recuperar capacidad.
Estación de trabajo virtual	Especifica estaciones de trabajo virtuales (vWS) NVIDIA RTX para cargas de trabajo de gráficos. Esta función solo es compatible con las instancias G4 y G2. "guestAccelerators": [ { "acceleratorCount": `VWS_ACCELERATOR_COUNT`, "acceleratorType": "projects/`PROJECT_ID`/zones/`ZONE`/acceleratorTypes/`VWS_ACCELERATOR_TYPE`" } ] Reemplaza lo siguiente: Para `VWS_ACCELERATOR_TYPE`, elige una de las siguientes opciones: Para las instancias G4, especifica `nvidia-rtx-pro-6000-vws`. Para las instancias de G2, especifica `nvidia-l4-vws`. Para `VWS_ACCELERATOR_COUNT`, especifica la cantidad de GPU virtuales que necesitas.
SSD local	Conecta uno o más SSD locales a tu instancia. Las SSD locales se pueden usar como discos rápidos para instalación nueva o para ingresar datos a las GPU y evitar los cuellos de botella de E/S. { "type": "SCRATCH", "autoDelete": true, "initializeParams": { "diskType": "projects/`PROJECT_ID`/zones/`ZONE`/diskTypes/local-nvme-ssd" } } Para conocer la cantidad máxima de discos SSD locales que puedes conectar por instancia de VM, consulta Límites de SSD locales.
Interfaz de red	Conecta varias interfaces de red a tu instancia. En el caso de las instancias `g4-standard-384`, puedes adjuntar hasta dos interfaces de red. Esto crea una instancia con interfaces de red dobles (2 x 200 Gbps). Cada interfaz de red debe estar en una red de VPC única. "networkInterfaces": [ { "network": "projects/`PROJECT_ID`/global/networks/`VPC_NAME_1`", "subnetwork": "projects/`PROJECT_ID`/regions/`REGION`/subnetworks/`SUBNET_NAME_1`", "nicType": "GVNIC" }, { "network": "projects/`PROJECT_ID`/global/networks/`VPC_NAME_2`", "subnetwork": "projects/`PROJECT_ID`/regions/`REGION`/subnetworks/`SUBNET_NAME_2`", "nicType": "GVNIC" } ] Las interfaces de red duales solo son compatibles con los tipos de máquinas `g4-standard-384`. Reemplaza lo siguiente: `VPC_NAME_1` y `VPC_NAME_2`: Son los nombres de tus redes de VPC. `SUBNET_NAME`: Es el nombre de la subred que forma parte de las redes de VPC especificadas.
Política de posición	Controla la ubicación de tu instancia dentro de una zona. Puedes especificar una política de compactación para minimizar la latencia de red en tus instancias G2 o una política de distribución para mejorar la resiliencia de tus instancias G4 o G2 ante interrupciones específicas de la zona. "resourcePolicies": [ "projects/`PROJECT_ID`/regions/`REGION`/resourcePolicies/`POLICY_NAME`" ] Reemplaza lo siguiente: `REGION`: Es la región en la que existe tu política de posición. Solo puedes crear la instancia en la misma región que la política. `POLICY_NAME`: El nombre de tu política de posición.

Crear grupos de VMs de uso general N1

Puedes crear un grupo de VMs con GPU conectadas mediante Google Cloud CLI o REST.

En esta sección, se describe cómo crear varias VM con los siguientes tipos de GPU:

GPU de NVIDIA:

NVIDIA T4: nvidia-tesla-t4
NVIDIA P4: nvidia-tesla-p4
NVIDIA P100: nvidia-tesla-p100
NVIDIA V100: nvidia-tesla-v100

NVIDIA RTX Virtual Workstation (vWS) (antes conocida como NVIDIA GRID):

Estación de trabajo virtual NVIDIA T4: nvidia-tesla-t4-vws
Estación de trabajo virtual NVIDIA P4: nvidia-tesla-p4-vws
Estación de trabajo virtual NVIDIA P100: nvidia-tesla-p100-vws

Para estas estaciones de trabajo virtuales, se agrega de forma automática una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.

gcloud

Para crear un grupo de VMs, usa el comando gcloud compute instances bulk create. Para obtener más información sobre los parámetros y cómo usar este comando, consulta Crea VMs de forma masiva.

Ejemplo

En el siguiente ejemplo, se crean dos VMs con GPU conectadas mediante las siguientes especificaciones:

Nombres de las VM: my-test-vm-1, my-test-vm-2
VM creadas en cualquier zona de us-central1 que admita GPU
Cada VM tiene dos GPU T4 conectadas, especificadas mediante el tipo de acelerador y las marcas de recuento de aceleradores.
Cada VM tiene instalados controladores de GPU
Cada VM usa Deep Learning VM Image pytorch-latest-gpu-v20211028-debian-10

gcloud compute instances bulk create \
    --name-pattern="my-test-vm-#" \
    --count=2 \
    --region=us-central1 \
    --machine-type=n1-standard-2 \
    --accelerator type=nvidia-tesla-t4,count=2 \
    --boot-disk-size=200 \
    --metadata="install-nvidia-driver=True" \
    --scopes="https://www.googleapis.com/auth/cloud-platform" \
    --image=pytorch-latest-gpu-v20211028-debian-10 \
    --image-project=deeplearning-platform-release \
    --on-host-maintenance=TERMINATE --restart-on-failure

Si se ejecuta de forma correcta, el resultado es similar al siguiente:

NAME          ZONE
my-test-vm-1  us-central1-b
my-test-vm-2  us-central1-b
Bulk create request finished with status message: [VM instances created: 2, failed: 0.]

REST

Ejemplo

En el siguiente ejemplo, se crean dos VMs con GPU conectadas mediante las siguientes especificaciones:

Nombres de las VM: my-test-vm-1, my-test-vm-2
VM creadas en cualquier zona de us-central1 que admita GPU
Cada VM tiene dos GPU T4 conectadas, especificadas mediante el tipo de acelerador y las marcas de recuento de aceleradores.
Cada VM tiene instalados controladores de GPU
Cada VM usa Deep Learning VM Image pytorch-latest-gpu-v20211028-debian-10

Reemplaza PROJECT_ID con el ID del proyecto.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/us-central1/instances/bulkInsert

{
    "namePattern":"my-test-vm-#",
    "count":"2",
    "instanceProperties": {
      "machineType":"n1-standard-2",
      "disks":[
        {
          "type":"PERSISTENT",
          "initializeParams":{
            "diskSizeGb":"200",
            "sourceImage":"projects/deeplearning-platform-release/global/images/pytorch-latest-gpu-v20211028-debian-10"
          },
          "boot":true
        }
      ],
      "name": "default",
      "networkInterfaces":
      [
        {
          "network": "projects/PROJECT_ID/global/networks/default"
        }
      ],
      "guestAccelerators":
      [
        {
          "acceleratorCount": 2,
          "acceleratorType": "nvidia-tesla-t4"
        }
      ],
      "scheduling":{
        "onHostMaintenance":"TERMINATE",
        "automaticRestart":true
      },
      "metadata":{
        "items":[
          {
            "key":"install-nvidia-driver",
            "value":"True"
          }
        ]
      }
  }
 }

Próximos pasos

Aprende a controlar el rendimiento de la GPU.
Obtén más información para usar un ancho de banda de red más alto.
Obtén información para controlar los eventos de mantenimiento del host de GPU.

Obtén información para ver el uso real y previsto de tus VMs y GPUs.

Crear VMs de GPU de forma masiva Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Antes de comenzar

gcloud

REST

Roles obligatorios

Permisos necesarios

Descripción general

Tipos de máquina

Crea grupos de A4X, A4 y A3 Ultra

Crea grupos de VMs A3, A2, G4 y G2

gcloud

Marcas opcionales

REST

Campos opcionales

Crear grupos de VMs de uso general N1

gcloud

REST

Próximos pasos

Crear VMs de GPU de forma masiva