Configurer les nœuds pour utiliser l'espace disque comme mémoire virtuelle

L'échange de mémoire de nœud Google Kubernetes Engine (GKE) permet aux nœuds GKE d'utiliser de l'espace disque comme mémoire virtuelle lorsque la mémoire physique est épuisée. L'échange de mémoire de nœud peut contribuer à améliorer la résilience des applications et à éviter les erreurs de mémoire insuffisante (OOM) pour certaines charges de travail.

Quand utiliser l'échange de mémoire de nœud ?

Utilisez l'échange de mémoire de nœud pour fournir un tampon contre les erreurs OOM pour les applications gourmandes en mémoire, en particulier lors de pics d'utilisation inattendus. L'échange de mémoire de nœud peut contribuer à améliorer la résilience de votre charge de travail, par exemple dans les scénarios suivants :

  • Exécuter des charges de travail avec des modèles de mémoire imprévisibles.
  • Réduire le risque de plantage des applications en raison de l'épuisement de la mémoire des nœuds.
  • Optimiser les coûts en évitant de surprovisionner la mémoire pour les pics occasionnels.

Fonctionnement de l'échange de mémoire de nœud

Lorsque vous activez l'échange de mémoire de nœud, GKE configure le système d'exploitation du nœud pour qu'il utilise de l'espace disque comme mémoire virtuelle. Ce processus fournit un tampon pour les applications qui subissent une pression de mémoire temporaire.

GKE calcule les limites d'échange de conteneur en fonction des limites de ressources de mémoire du conteneur et de la mémoire totale du nœud.

Vous pouvez configurer l'échange sur différents types de stockage pour équilibrer les performances et les coûts :

  • Disque de démarrage : utilise le disque de démarrage du nœud pour l'espace d'échange.
  • SSD local éphémère : utilise un SSD local également partagé avec le stockage éphémère du pod.
  • SSD local dédié : réserve un ou plusieurs SSD locaux exclusivement pour l'échange.

Pour protéger les données sensibles, GKE chiffre l'espace d'échange par défaut à l'aide d'une clé éphémère.

Conditions requises et limites

L'échange de mémoire de nœud est soumis aux exigences et limites suivantes :

  • Les clusters GKE doivent être de la version 1.34.1-gke.1341000 ou ultérieure.
  • Seuls les pods qui ont la classe de qualité de service (QoS) Burstable peuvent utiliser l'échange de mémoire de nœud. Pour en savoir plus sur les classes QoS, consultez la documentation Kubernetes sur les classes de qualité de service des pods.
  • Pour redimensionner les ressources de mémoire des conteneurs, vous devez définir la règle de redimensionnement des conteneurs sur RestartContainer.
  • Si vous configurez l'échange de mémoire de nœud pour utiliser un disque de démarrage, la taille de l'échange ne peut pas dépasser 50% de la capacité totale du disque de démarrage.

Si vous configurez l'échange de mémoire de nœud pour utiliser un SSD local, vous devez vous assurer que les exigences suivantes sont remplies :

  • Le type de machine doit être compatible avec les SSD locaux. Vous ne pouvez pas utiliser le stockage de blocs bruts avec un SSD local.
  • Les nœuds doivent être provisionnés avec des SSD locaux. La méthode de provisionnement dépend de la série de machines :
    • Pour les séries de machines de première ou deuxième génération, définissez l'option --ephemeral-storage-local-ssd=count.
    • Pour les séries de machines de troisième ou quatrième génération, choisissez un type de machine qui regroupe les SSD locaux.
  • Le type de machine e2-medium par défaut n'est pas compatible avec les SSD locaux. Vous devez donc sélectionner un autre type de machine.
  • Pour savoir comment créer ou mettre à jour un cluster afin qu'il provisionne des SSD locaux, consultez la section Provisionner et utiliser un stockage éphémère sauvegardé sur disque SSD local.

Bonnes pratiques

L'échange de mémoire de nœud est conçu comme un filet de sécurité pour les pics de mémoire imprévisibles, et non comme un remplacement d'une mémoire physique suffisante. Pour obtenir des conseils sur l'optimisation des charges de travail, consultez la section Dimensionner correctement vos charges de travail GKE à grande échelle.

Vous devez également tenir compte des bonnes pratiques suivantes lorsque vous utilisez l'échange de mémoire de nœud :

  • Isolez les nœuds pour lesquels l'échange de mémoire de nœud est activé en appliquant un rejet au pool de nœuds, par exemple, gke-swap=enabled:NoSchedule, et en ajoutant une tolérance correspondante aux charges de travail destinées à utiliser l'échange.
  • Dimensionnez correctement votre espace d'échange de mémoire de nœud. Un espace d'échange de mémoire de nœud insuffisant peut ne pas empêcher les erreurs OOM, et une utilisation excessive peut dégrader les performances.
  • Surveillez l'utilisation de l'échange de mémoire de nœud sur vos charges de travail. Une utilisation fréquente de l'échange de mémoire de nœud peut indiquer une pression de mémoire.

Avant de commencer

Avant de commencer, effectuez les tâches suivantes :

  • Activez l'API Google Kubernetes Engine.
  • Activer l'API Google Kubernetes Engine
  • Si vous souhaitez utiliser la Google Cloud CLI pour cette tâche, installez et initialisez la gcloud CLI. Si vous avez déjà installé la gcloud CLI, obtenez la dernière version en exécutant la commande gcloud components update. Il est possible que les versions antérieures de la gcloud CLI ne permettent pas d'exécuter les commandes de ce document.

Activer l'échange de mémoire de nœud

Vous pouvez activer l'échange de mémoire de nœud au niveau du cluster ou du pool de nœuds. Pour activer l'échange de mémoire de nœud, créez ou mettez à jour un fichier system-config.yaml contenant la configuration d'échange de mémoire de nœud souhaitée. L'exemple suivant active l'échange de mémoire de nœud avec les paramètres par défaut :

linuxConfig:
  swapConfig:
    enabled: true

Vous pouvez configurer d'autres paramètres. Cet exemple configure un échange non chiffré pour utiliser 30% du stockage d'un SSD local éphémère :

linuxConfig:
  swapConfig:
    enabled: true
    encryptionConfig:
      disabled: true
    ephemeralLocalSsdProfile:
      swapSizePercent: 30

Pour obtenir la liste des champs facultatifs que vous pouvez configurer, consultez la LinuxNodeConfig documentation de l'API.

Activer l'échange de mémoire de nœud sur un cluster

Pour activer l'échange de mémoire de nœud sur un cluster, procédez comme suit :

  • Pour créer un cluster avec l'échange de mémoire de nœud activé, exécutez la commande suivante :

    gcloud container clusters create CLUSTER_NAME \
        --location=LOCATION \
        --cluster-version=1.34.1-gke.1341000 \
        --system-config-from-file=system-config.yaml
    

    Remplacez les éléments suivants :

    • CLUSTER_NAME : nom de votre nouveau cluster
    • LOCATION : région ou zone de votre cluster
  • Pour mettre à jour un cluster existant afin d'activer l'échange de mémoire de nœud, exécutez la commande suivante :

    gcloud container clusters update CLUSTER_NAME \
        --location=LOCATION \
        --system-config-from-file=system-config.yaml
    

    Remplacez les éléments suivants :

    • CLUSTER_NAME : nom de votre nouveau cluster
    • LOCATION : région ou zone de votre cluster

Activer l'échange de mémoire de nœud sur un pool de nœuds

Pour activer l'échange de mémoire de nœud sur un pool de nœuds, procédez comme suit :

  • Pour créer un pool de nœuds avec l'échange de mémoire de nœud activé, exécutez la commande suivante :

    gcloud container node-pools create NODEPOOL_NAME \
        --cluster=CLUSTER_NAME \
        --location=LOCATION \
        --node-version=1.34.1-gke.1293000 \
        --system-config-from-file=system-config.yaml \
        --machine-type=MACHINE_TYPE
    

    Remplacez les éléments suivants :

    • NODEPOOL_NAME : nom de votre nouveau pool de nœuds.
    • CLUSTER_NAME : nom du cluster
    • LOCATION : région ou zone de votre cluster
    • MACHINE_TYPE : type de machine compatible Pour les SSD locaux, assurez-vous de choisir un type de machine qui regroupe les SSD locaux, par exemple n1-standard-1.
  • Pour mettre à jour un pool de nœuds existant afin d'activer l'échange de mémoire de nœud, exécutez la commande suivante :

    gcloud container node-pools update NODEPOOL_NAME \
        --cluster=CLUSTER_NAME \
        --location=LOCATION \
        --system-config-from-file=system-config.yaml
    

    Remplacez les éléments suivants :

    • NODEPOOL_NAME : nom de votre pool de nœuds.
    • CLUSTER_NAME : nom du cluster
    • LOCATION : région ou zone de votre cluster

Vérifier la configuration

Pour vérifier que l'échange de mémoire de nœud est activé, procédez comme suit :

  1. Vérifiez que le fichier system-config.yaml est appliqué avec les paramètres swapConfig en exécutant la commande suivante :

    gcloud container node-pools describe NODEPOOL_NAME \
        --cluster=CLUSTER_NAME \
        --location=LOCATION \
        --format='yaml(config.linuxNodeConfig.swapConfig)'
    
  2. Vérifiez que la configuration kubelet existe sur le nœud en exécutant la commande suivante :

    kubectl get --raw "/api/v1/nodes/NODE_NAME/proxy/configz" | jq .kubeletconfig.memorySwap
    

Surveiller l'utilisation de l'échange de mémoire

Vous pouvez surveiller la mémoire de nœud avec Cloud Monitoring ou kubectl.

Surveillance

Les métriques système suivantes sont disponibles par défaut pour observer l'utilisation de l'échange :

  • kubernetes.io/node/memory/swap_used_bytes
  • kubernetes.io/container/memory/swap_used_bytes

GKE fournit également des métriques d'utilisation de l'échange au niveau du conteneur via cAdvisor. Pour utiliser ces métriques, activez cAdvisor sur le cluster :

  • prometheus.googleapis.com/container_memory_swap/gauge

kubectl

Surveillez l'utilisation de l'échange avec les commandes kubectl en procédant comme suit :

  1. Vérifiez la condition SwapDetected sur l'objet de nœud en exécutant la commande suivante :

    kubectl get node NODE_NAME -o jsonpath='{.status.conditions[?(@.type=="Swap")]}' | jq .
    

    Le résultat ressemble à ce qui suit :

    {
      "lastHeartbeatTime": "2025-07-11T00:14:52Z",
      "lastTransitionTime": "2025-06-25T05:20:10Z",
      "message": "Swap is active: Total=49Gi Used=0B Free=49Gi",
      "reason": "SwapDetected",
      "status": "True",
      "type": "Swap"
    }
    
  2. Vérifiez la capacité d'échange en exécutant la commande suivante :

    kubectl get node NODE_NAME -o jsonpath='{.status.nodeInfo.swap}'
    

    Le résultat ressemble à ce qui suit :

    {"capacity":53687087104}
    

Désactiver l'échange de mémoire de nœud

Pour désactiver l'échange de mémoire de nœud, mettez à jour votre fichier system-config.yaml en procédant comme suit :

  1. Mettez à jour le fichier system-config.yaml pour définir swapConfig.enabled sur false :

    linuxConfig:
      swapConfig:
        enabled: false
    
  2. Mettez à jour le pool de nœuds avec la nouvelle configuration :

    gcloud container node-pools update NODEPOOL_NAME \
        --cluster=CLUSTER_NAME \
        --location=LOCATION \
        --system-config-from-file=system-config.yaml
    

Étape suivante