En este documento, se explica cómo crear políticas para grupos de instancias administrados (MIG) que tienen instancias de Compute Engine A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D. Para obtener más información sobre los requisitos y las limitaciones que se aplican cuando creas políticas de cargas de trabajo, consulta Acerca de las políticas de cargas de trabajo.
Una política de carga de trabajo te permite especificar la ubicación o la topología de las instancias de Compute Engine en tu MIG. Por ejemplo, puedes usar políticas de carga de trabajo para colocar instancias de procesamiento más cerca unas de otras, lo que minimiza la latencia de red para las cargas de trabajo de inteligencia artificial (IA), aprendizaje automático (AA) o computación de alto rendimiento (HPC).
Antes de comenzar
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Selecciona la pestaña que corresponda a la forma en que planeas usar las muestras de esta página:
gcloud
-
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
gcloud initSi usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.
-
- Configura una región y una zona predeterminadas.
REST
Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.
Instala Google Cloud CLI.
Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.
Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Google Cloud .
Roles obligatorios
Para obtener los permisos que necesitas
para crear y aplicar políticas de cargas de trabajo a los MIG,
pídele a tu administrador que te otorgue el rol de IAM
Administrador de instancias de Compute (v1) (roles/compute.instanceAdmin.v1)
en el proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene los permisos necesarios para crear y aplicar políticas de cargas de trabajo a los MIGs. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para crear y aplicar políticas de cargas de trabajo a los MIGs:
-
Para crear una política de cargas de trabajo, haz lo siguiente:
compute.resourcePolicies.createen el proyecto
También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.
Crear una política de cargas de trabajo
Para crear una política de carga de trabajo, usa uno de los siguientes métodos según la serie de máquinas que usen las instancias de procesamiento de tu MIG:
Crea una política de cargas de trabajo para instancias de A4X Max o A4X
Crea una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D
Crea una política de cargas de trabajo para instancias de A4X Max o A4X
Si aplicas una política de carga de trabajo a instancias A4X Max o A4X en un MIG, debes especificar un valor de topología del acelerador cuando crees la política. Esta acción ayuda a tus cargas de trabajo a lograr un rendimiento de red a gran escala y sin bloqueos.
Para crear una política de carga de trabajo para instancias A4X Max o A4X, selecciona una de las siguientes opciones:
gcloud
Para crear una política de cargas de trabajo para instancias A4X Max o A4X, usa el comando gcloud compute resource-policies create workload-policy con la marca --accelerator-topology=1x72:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
Reemplaza lo siguiente:
WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas A4X Max o A4X, consulta Regiones y zonas disponibles.
REST
Para crear una política de cargas de trabajo para instancias A4X Max o A4X, realiza una solicitud POST al método resourcePolicies.insert.
En el cuerpo de la solicitud, incluye el campo acceleratorTopology configurado como 1x72:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
Reemplaza lo siguiente:
PROJECT_ID: Es el ID del proyecto en el que se creará la política de cargas de trabajo.REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas A4X Max o A4X, consulta Regiones y zonas disponibles.WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.
Crea una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D
Si deseas aplicar una política de carga de trabajo a instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en un MIG, te recomendamos que especifiques un valor de distancia máxima de la topología cuando crees tu política. Esta acción ayuda a garantizar una colocación más cercana entre tus instancias de procesamiento. Sin embargo, cuanto más compacta sea la posición que especifiques, menos recursos podrían estar disponibles en la zona en la que deseas crear tus instancias de procesamiento.
Para crear una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega o A3 High (8 GPUs), selecciona una de las siguientes opciones:
gcloud
Para crear una política de cargas de trabajo, usa el comando gcloud compute resource-policies create workload-policy. Según qué tan cerca quieras colocar las instancias de procesamiento en un MIG, incluye las siguientes marcas en el comando:
Para colocar tus instancias de procesamiento cerca unas de otras de la mejor manera posible, incluye la marca
--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONPara controlar aún más la ubicación de tus instancias de procesamiento, incluye las marcas
--max-topology-distancey--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
Reemplaza lo siguiente:
WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas con GPU, consulta Regiones y zonas disponibles.TOPOLOGY_DISTANCE: Es la distancia máxima de la topología. Una distancia máxima más corta puede reducir la probabilidad de disponibilidad de la VM. Especifica uno de los siguientes valores:Para colocar instancias de A4 o H4D en el mismo clúster, haz lo siguiente:
CLUSTERPara colocar instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en el mismo bloque, haz lo siguiente:
BLOCKPara colocar instancias de A4, A3 Ultra o H4D en el mismo subbloque, haz lo siguiente:
SUBBLOCK
REST
Para crear una política de cargas de trabajo, realiza una solicitud POST al método resourcePolicies.insert. Según qué tan cerca quieras colocar las instancias de procesamiento en un MIG, incluye los siguientes campos en el cuerpo de la solicitud:
Para colocar tus instancias de procesamiento cerca unas de otras de la mejor manera posible, incluye el campo
typeen el cuerpo de la solicitud:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }Para controlar aún más la colocación de tus instancias de procesamiento, incluye los campos
maxTopologyDistanceytypeen el cuerpo de la solicitud:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
Reemplaza lo siguiente:
PROJECT_ID: Es el ID del proyecto en el que se creará la política de cargas de trabajo.REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas con GPU, consulta Regiones y zonas disponibles.WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.TOPOLOGY_DISTANCE: Es la distancia máxima de la topología. Una distancia máxima más corta puede reducir la probabilidad de disponibilidad de la VM. Especifica uno de los siguientes valores:Para colocar instancias de A4 o H4D en el mismo clúster, haz lo siguiente:
CLUSTERPara colocar instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en el mismo bloque, haz lo siguiente:
BLOCKPara colocar instancias de A4, A3 Ultra o H4D en el mismo subbloque, haz lo siguiente:
SUBBLOCK
¿Qué sigue?
Después de crear una política de cargas de trabajo, obtén información para aplicarla a un MIG:
Obtén más información para ver la topología de la instancia de procesamiento.
Obtén más información para ver las políticas de cargas de trabajo.
Obtén más información para reemplazar, quitar o borrar políticas de carga de trabajo.