En este documento, se explica cómo crear políticas para grupos de instancias administrados (MIGs) que tienen instancias de Compute Engine A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D. Para obtener más información sobre los requisitos y las limitaciones que se aplican cuando creas políticas de cargas de trabajo, consulta Acerca de las políticas de cargas de trabajo.
Una política de cargas de trabajo te permite especificar la posición o la topología de las instancias de Compute Engine en tu MIG. Por ejemplo, puedes usar políticas de cargas de trabajo para colocar instancias de procesamiento más cerca unas de otras, lo que minimiza la latencia de la red para las cargas de trabajo de inteligencia artificial (IA), aprendizaje automático (AA) o computación de alto rendimiento (HPC).
Antes de comenzar
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los Google Cloud servicios y las APIs. Para ejecutar
código o muestras desde un entorno de desarrollo local, puedes autenticarte en
Compute Engine seleccionando una de las siguientes opciones:
Selecciona la pestaña según cómo planeas usar las muestras en esta página:
gcloud
-
Instala la Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
gcloud initSi usas un proveedor de identidad (IdP) externo, primero debes acceder a gcloud CLI con tu identidad federada.
-
- Configura una región y una zona predeterminadas.
REST
Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.
Instala la Google Cloud CLI.
Si usas un proveedor de identidad (IdP) externo, primero debes acceder a gcloud CLI con tu identidad federada.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de. Google Cloud
Roles obligatorios
Para obtener los permisos que
necesitas para crear y aplicar políticas de cargas de trabajo a los MIGs,
pídele a tu administrador que te otorgue el
rol de IAM Administrador de instancias de Compute (v1) (roles/compute.instanceAdmin.v1) en el proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene los permisos necesarios para crear y aplicar políticas de cargas de trabajo a los MIGs. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para crear y aplicar políticas de cargas de trabajo a los MIGs:
-
Para crear una política de cargas de trabajo:
compute.resourcePolicies.createen el proyecto
También puedes obtener estos permisos con roles personalizados o otros roles predefinidos.
Crear una política de cargas de trabajo
Para crear una política de cargas de trabajo, usa uno de los siguientes métodos según la serie de máquinas que usen las instancias de procesamiento en tu MIG:
Crea una política de cargas de trabajo para instancias A4X Max o A4X
Crea una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D
Crea una política de cargas de trabajo para instancias A4X Max o A4X
Si aplicas una política de cargas de trabajo a instancias A4X Max o A4X en un MIG, entonces debes especificar unvalor de topología de aceleradorcuando crees tu política. Esta acción ayuda a que tus cargas de trabajo logren un rendimiento de red a gran escala y sin bloqueos.
Para crear una política de cargas de trabajo para instancias A4X Max o A4X, selecciona una de las siguientes opciones:
gcloud
Para crear una política de cargas de trabajo para instancias A4X Max o A4X, usa el
gcloud compute resource-policies create workload-policy comando
con la --accelerator-topology=1x72 marca:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
Reemplaza lo siguiente:
WORKLOAD_POLICY_NAME: el nombre de tu política de cargas de trabajo.REGION: la región en la que se creará tu política de cargas de trabajo. Especifica una región en la que deseas crear el MIG y en la que está disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas A4X Max o A4X, consulta Regiones y zonas disponibles.
REST
Para crear una política de cargas de trabajo para instancias A4X Max o A4X, realiza una POST
solicitud al
resourcePolicies.insert método.
En el cuerpo de la solicitud, incluye el campo acceleratorTopology configurado como 1x72:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
Reemplaza lo siguiente:
PROJECT_ID: el ID del proyecto en el que se creará tu política de cargas de trabajo.REGION: la región en la que se creará tu política de cargas de trabajo. Especifica una región en la que deseas crear el MIG y en la que está disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas A4X Max o A4X, consulta Regiones y zonas disponibles.WORKLOAD_POLICY_NAME: el nombre de tu política de cargas de trabajo.
Crea una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D
Si deseas aplicar una política de cargas de trabajo a instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en un MIG, te recomendamos que especifiques un valor de distancia máxima de la topología cuando crees tu política. Esta acción ayuda a garantizar una posición más cercana entre tus instancias de procesamiento. Sin embargo, cuanto más compacta sea la posición que especifiques, menos recursos podrían estar disponibles en la zona en la que deseas crear tus instancias de procesamiento.
Para crear una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega o A3 High (8 GPUs), selecciona una de las siguientes opciones:
gcloud
Para crear una política de cargas de trabajo, usa el
gcloud compute resource-policies create workload-policy comando. Según qué tan cerca desees colocar las instancias de procesamiento en un MIG, incluye las siguientes marcas en el comando:
Para colocar tus instancias de procesamiento cerca unas de otras de la mejor manera posible, incluye la marca
--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONPara controlar aún más la posición de tus instancias de procesamiento, incluye las marcas
--max-topology-distancey--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
Reemplaza lo siguiente:
WORKLOAD_POLICY_NAME: el nombre de tu política de cargas de trabajo.REGION: la región en la que se creará tu política de cargas de trabajo. Especifica una región en la que deseas crear el MIG y en la que está disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas de GPU, consulta Regiones y zonas disponibles.TOPOLOGY_DISTANCE: la distancia máxima de la topología. Una distancia máxima más corta puede reducir la probabilidad de disponibilidad de la VM. Especifica uno de los siguientes valores:Para colocar instancias A4 o H4D en el mismo clúster:
CLUSTERPara colocar instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en el mismo bloque:
BLOCKPara colocar instancias A4, A3 Ultra o H4D en el mismo subbloque:
SUBBLOCK
REST
Para crear una política de cargas de trabajo, realiza una POST solicitud al
resourcePolicies.insert método. Según qué tan cerca desees colocar las instancias de procesamiento en un MIG, incluye los siguientes campos en el cuerpo de la solicitud:
Para colocar tus instancias de procesamiento cerca unas de otras de la mejor manera posible, incluye el campo
typeen el cuerpo de la solicitud:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }Para controlar aún más la posición de tus instancias de procesamiento, incluye los campos
maxTopologyDistanceytypeen el cuerpo de la solicitud:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
Reemplaza lo siguiente:
PROJECT_ID: el ID del proyecto en el que se creará tu política de cargas de trabajo.REGION: la región en la que se creará tu política de cargas de trabajo. Especifica una región en la que deseas crear el MIG y en la que está disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas de GPU, consulta Regiones y zonas disponibles.WORKLOAD_POLICY_NAME: el nombre de tu política de cargas de trabajo.TOPOLOGY_DISTANCE: la distancia máxima de la topología. Una distancia máxima más corta puede reducir la probabilidad de disponibilidad de la VM. Especifica uno de los siguientes valores:Para colocar instancias A4 o H4D en el mismo clúster:
CLUSTERPara colocar instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en el mismo bloque:
BLOCKPara colocar instancias A4, A3 Ultra o H4D en el mismo subbloque:
SUBBLOCK
¿Qué sigue?
Después de crear una política de cargas de trabajo, obtén información para aplicarla a un MIG:
Obtén información para ver la topología de la instancia de procesamiento.
Obtén información para ver las políticas de cargas de trabajo.
Obtén información para reemplazar, quitar o borrar políticas de cargas de trabajo.