Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Elige una serie de máquinas para optimizar el rendimiento de los pods de Autopilot

Autopilot

En este documento, se muestra cómo colocar cargas de trabajo en una serie de máquinas de Compute Engine específica para obtener un rendimiento óptimo de la carga de trabajo en tus clústeres de Google Kubernetes Engine (GKE) Autopilot.

Asegúrate de estar familiarizado con lo siguiente:

Series de máquinas y casos de uso de Compute Engine
Requisitos a nivel de kernel para tus aplicaciones

Cómo funciona la selección de series de máquinas

Puedes agregar un selector de nodos cloud.google.com/machine-family a la especificación de tu Pod para que Autopilot asigne hardware específico de Compute Engine a ese Pod. Por ejemplo, puedes elegir la serie de máquinas C3 para los Pods que necesitan más potencia de CPU o la serie de máquinas N1 para los Pods que necesitan más memoria. Para ejecutar de manera óptima tu carga de trabajo, Autopilot aprovisiona uno de los tipos de máquinas predefinidos de la serie de máquinas que seleccionaste.

Además del rendimiento óptimo del Pod, elegir una serie de máquinas específica ofrece los siguientes beneficios:

Uso eficiente de los nodos: De forma predeterminada, Autopilot optimiza el uso de recursos de los nodos mediante la programación en cada nodo de la mayor cantidad posible de Pods que solicitan la misma serie de máquinas. Este enfoque optimiza el uso de recursos en el nodo, lo que mejora la relación precio-rendimiento. Si tu carga de trabajo necesita acceder a todos los recursos del nodo, puedes configurar tu carga de trabajo para que solicite un Pod para cada nodo.
Cargas de trabajo con capacidad de aumento de actividad: Puedes configurar los Pods para que generen un aumento de actividad en la capacidad de recursos sin usar en el nodo si estableces los límites de recursos más altos que tus solicitudes. Para obtener más información, consulta Configura el aumento de actividad de Pods en GKE.

Planifica un nodo dedicado para cada Pod

Si tienes cargas de trabajo con uso intensivo de CPU que necesitan acceso confiable a todos los recursos del nodo, puedes configurar tu Pod para que Autopilot coloque un Pod que solicite una serie de máquinas en su propio nodo.

Se recomiendan nodos dedicados por Pod cuando ejecutas cargas de trabajo a gran escala con uso intensivo de CPU, como cargas de trabajo de entrenamiento de IA/AA o cargas de trabajo por lotes de computación de alto rendimiento (HPC).

Elige entre la programación de varios Pods y la de un solo Pod

Usa la siguiente guía para elegir un comportamiento de programación de Pods según tus requisitos:

Si tienes Pods que pueden compartir recursos de procesamiento con otros Pods o deseas optimizar los costos mientras ejecutas Pods en hardware especializado, usa el comportamiento de programación predeterminado de varios Pods por nodo.
Si tienes Pods que necesitan acceso confiable a los recursos completos del nodo o deseas minimizar la posibilidad de interrupciones causadas por el uso compartido de recursos de procesamiento, solicita un nodo dedicado para cada Pod.

Precios

Se te factura la VM subyacente y cualquier hardware conectado por Compute Engine, además de un recargo por la administración y escalabilidad de los nodos de Autopilot. Para obtener más detalles, consulta Precios de GKE.

Antes de comenzar

Antes de comenzar, asegúrate de haber realizado las siguientes tareas:

Habilita la API de Google Kubernetes Engine.

Habilitar la API de Google Kubernetes Engine

Para usar Google Cloud CLI para esta tarea, instala y, luego, inicializa gcloud CLI. Si ya instalaste gcloud CLI, ejecuta el comando gcloud components update para obtener la versión más reciente. Es posible que las versiones anteriores de gcloud CLI no admitan la ejecución de los comandos de este documento.
Nota: Para las instalaciones de gcloud CLI existentes, asegúrate de configurar la compute/region propiedad. Si usas principalmente clústeres zonales, configura compute/zone en su lugar. Cuando configuras una ubicación predeterminada, puedes evitar errores en gcloud CLI como el siguiente: One of [--zone, --region] must be supplied: Please specify location. Es posible que debas especificar la ubicación en ciertos comandos si la ubicación de tu clúster difiere de la predeterminada que estableciste.

Asegúrate de tener un clúster de Autopilot existente que ejecute la versión 1.30.1-gke.1396000 o posterior. Para crear un clúster, consulta Crea un clúster de Autopilot.

Selecciona una serie de máquinas

En esta sección, se muestra cómo seleccionar una serie de máquinas de Compute Engine específica en un Pod.

Guarda el siguiente manifiesto como machine-series-pod.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: machine-series-pod
spec:
  nodeSelector:
    cloud.google.com/machine-family: MACHINE_SERIES
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 5
        memory: "25Gi"
      limits:
        cpu: 20
        memory: 100Gi

Reemplaza MACHINE_SERIES por la serie de máquinas de Compute Engine para tu Pod, como c3. Para obtener los valores admitidos, consulta Serie de máquinas compatible en esta página.

Implementa el Pod:

kubectl apply -f machine-series-pod.yaml

Este manifiesto permite que Autopilot optimice el uso de recursos de los nodos mediante la programación eficiente de otros Pods que seleccionan la misma serie de máquinas en el mismo nodo si hay capacidad disponible.

Usa SSD locales

Los Pods que seleccionan una serie de máquinas pueden usar SSDs locales para el almacenamiento efímero si especificas una serie de máquinas que ofrece SSD local. Autopilot considera las solicitudes de almacenamiento efímero cuando elige un tipo de máquina de Compute Engine para el Pod.

Para obtener más información, consulta Usa el almacenamiento efímero respaldado por SSD local con clústeres de Autopilot.

Solicita un nodo dedicado para un Pod

Si tu Pod tiene requisitos de rendimiento específicos, como la necesidad de acceso confiable a todos los recursos de tu nodo, puedes solicitar un nodo dedicado para cada Pod si especificas el selector de nodos cloud.google.com/compute-class: Performance junto con el selector de nodos de tu serie de máquinas. Esto le indica a Autopilot que coloque tu Pod en un nodo nuevo que use la serie de máquinas especificada y que esté dedicado a ese Pod. Este selector de nodos también evita que Autopilot programe otros Pods en ese nodo.

Guarda el siguiente manifiesto como dedicated-node-pod.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: dedicated-node-pod
spec:
  nodeSelector:
    cloud.google.com/machine-family: MACHINE_SERIES
    cloud.google.com/compute-class: Performance
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 12
        memory: "50Gi"
        ephemeral: "200Gi"

Reemplaza MACHINE_SERIES por una serie de máquinas compatible que también admita la programación de un Pod por nodo. Si la serie de máquinas especificada no admite la programación de un Pod por nodo, la implementación fallará y mostrará un error.

Implementa el Pod:

kubectl apply -f dedicated-node-pod.yaml

Cuando implementas este manifiesto, Autopilot hace lo siguiente:

Garantiza que el Pod implementado solicite al menos los recursos mínimos para el nodo optimizado para el rendimiento.
Calcula el total de solicitudes de recursos del Pod implementado y cualquier DaemonSet en el clúster.
Aprovisiona un nodo respaldado por la serie de máquinas seleccionada.
Modifica el manifiesto del Pod con una combinación de selectores de nodos y tolerancias para garantizar que el Pod se ejecute en su propio nodo.

Serie de máquinas compatible

El selector machine-family admite las siguientes series de máquinas:

Series de máquinas	Valor del selector de nodos	Admite varios Pods por nodo	Admite un solo Pod por nodo
Serie de máquinas C4N (consulta Requisitos de la versión)	`c4n`
Serie de máquinas C4D (consulta Requisitos de la versión)	`c4d`
Serie de máquinas C4A (consulta Requisitos y limitaciones)	`c4a`
Serie de máquinas C4 Predeterminado para la clase de rendimiento	`c4`
Serie de máquinas C3	`c3`
Serie de máquinas C3D	`c3d`
Serie de máquinas C2	`c2`
Serie de máquinas C2D	`c2d`
Serie de máquinas H4D	`h4d`
Serie de máquinas H3	`h3`
Serie de máquinas T2D	`t2d`
Serie de máquinas T2A	`t2a`
Serie de máquinas E2	`e2`
Serie de máquinas N4	`n4`
Serie de máquinas N4D (consulta Requisitos de la versión)	`n4d`
Serie de máquinas N2	`n2`
Serie de máquinas N2D	`n2d`
Serie de máquinas N1	`n1`
Serie de máquinas Z3	`z3`

Si no especificas una serie de máquinas cuando seleccionas la clase de rendimiento, GKE usa la serie de máquinas C4 si los tipos de máquinas C4 están disponibles en una región.

Para comparar estas series de máquinas y sus casos de uso, consulta Comparación de series de máquinas en la documentación de Compute Engine.

Requisitos de la versión

Consulta los siguientes requisitos de la versión para series de máquinas específicas:

C4N: Versión 1.36.0-gke.3009002 de GKE y versiones posteriores
C4D: Versión 1.32.9-gke.1711000 de GKE y versiones posteriores
N4D:
- Versión 1.33.13-gke.1079000 de GKE y versiones posteriores
- Versión 1.34.1-gke.2037000 de GKE y versiones posteriores

Compatibilidad con otras funciones de GKE

Los Pods que seleccionan una serie de máquinas pueden usar las capacidades y funciones de GKE compatibles con esa serie de máquinas, como las siguientes:

Spot Pods
Pods de tiempo de ejecución extendido (solo con nodos dedicados por Pod)
Separación de cargas de trabajo
Reservas de capacidad
Descuentos por compromiso de uso

Los Pods Spot y los Pods de tiempo de ejecución extendidos son mutuamente excluyentes. GKE no aplica solicitudes de recursos mínimas más altas para los Pods dedicados por nodo, aunque usen la separación de cargas de trabajo.

Cómo GKE selecciona un tipo de máquina

Para seleccionar un tipo de máquina en la serie de máquinas especificada, GKE calcula el total de CPU, el total de memoria y el total de solicitudes de almacenamiento efímero de los Pods y cualquier DaemonSet que se ejecute en el nodo nuevo. GKE redondea estos valores hasta el tipo de máquina de Compute Engine disponible más cercano que admita todos estos totales.

Ejemplo 1: Considera una Deployment con cuatro réplicas que selecciona la serie de máquinas C3D. No solicitas nodos dedicados por Pod. Las solicitudes de recursos de cada réplica son las siguientes:
- CPU virtual 500 m (0.5 CPU virtual)
- 1 GiB de memoria
Autopilot coloca los cuatro Pods en un nodo respaldado por el tipo de máquina c3d-standard-4, que tiene 4 CPU virtuales y 16 GB de memoria.
Ejemplo 2: Considera un Pod que selecciona la serie de máquinas C3D y los SSDs locales para el almacenamiento efímero. Solicitas un nodo dedicado para el Pod. Las solicitudes de recursos totales, incluidos los DaemonSets, son las siguientes:
- 12 CPU virtuales
- 50 GiB de memoria
- 200 GiB de almacenamiento efímero
Autopilot coloca el Pod en un nodo que usa el tipo de máquina c3d-standard-16-lssd, que tiene 16 CPU virtuales, 64 GiB de memoria y 365 GiB de capacidad de SSD local.

¿Qué sigue?

Para obtener orientación sobre las opciones de procesamiento que ofrece Autopilot para varios casos de uso, consulta Clases de procesamiento en Autopilot.
Implementa cargas de trabajo basadas en GPU en Autopilot.

Elige una serie de máquinas para optimizar el rendimiento de los pods de Autopilot Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.