Utiliser le tableau de bord "Présentation de GKE"

Le tableau de bord "Présentation de GKE" de la Google Cloud console fournit une vue d'ensemble de votre parc. Cette présentation vous aide à utiliser les fonctionnalités de GKE en vous indiquant le nombre de problèmes de sécurité rencontrés par votre parc, la couverture de Policy Controller à l'échelle de votre parc et l'état de synchronisation de vos packages Config Sync. En outre, le tableau de bord fournit une vue au niveau du parc de l'utilisation des ressources de vos parcs, clusters et équipes. Vous pouvez utiliser ces informations pour optimiser les dépenses, la conception des applications et l'allocation des ressources, y compris l'utilisation du processeur, de la mémoire et du disque.

Avant de lire cette page, assurez-vous de connaître la gestion des ressources Kubernetes, comme décrit dans la documentation Kubernetes sur la gestion des ressources pour les pods et les conteneurs.

Consulter la présentation

Pour afficher le tableau de bord de présentation :

Sélectionner un filtre temporel

Par défaut, la présentation de GKE affiche l'utilisation des ressources au cours de la dernière heure. Pour modifier cette période, utilisez l'option de filtre temporel :

  • Sélectionnez la période sur laquelle vous souhaitez afficher l'utilisation moyenne des ressources des conteneurs de parc. Choisissez l'une des options prédéfinies ou sélectionnez Personnalisé pour spécifier une période personnalisée.

Afficher les clusters, les niveaux d'accès d'équipe, les coûts et l'utilisation totale des ressources

La première section fournit une vue d'ensemble de vos clusters, des niveaux d'accès d'équipe, du coût estimé de votre parc et de l'utilisation totale du processeur/de la mémoire/du disque au cours de la période que vous avez sélectionnée. Les métriques d'utilisation des ressources sont générées à l'aide des données système Cloud Monitoring des clusters de votre parc.

Si la notification Données manquantes de... s'affiche, consultez la section Activer le système Cloud Monitoring pour les clusters de parc afin de résoudre le problème.

Afficher l'état du cluster

Dans la section Clusters de ce parc, vous pouvez voir le nombre de clusters présents dans votre parc. En cas de problème de connectivité du cluster au parc, des avertissements ou des erreurs s'affichent. C'est le cas, par exemple, si vous avez supprimé un cluster sans annuler son enregistrement au préalable, ou si vous devez vous connecter à un cluster situé en dehors Google Cloud pour en afficher les détails.

  • Si une erreur ou un avertissement s'affiche, cliquez sur la notification pour afficher le ou les clusters problématiques, et résoudre le problème.
  • Cliquez sur Afficher tous les clusters pour afficher la liste complète des clusters de votre parc.

Afficher les niveaux d'accès d'équipe

Dans la section Niveaux d'accès d'équipe, vous pouvez voir le nombre de niveaux d'accès d'équipe dans ce parc. Les niveaux d'accès d'équipe vous permettent de définir des sous-ensembles de ressources de parc par équipe. Une fois ces niveaux d'accès définis, vous pouvez utiliser les fonctionnalités de gestion des équipes pour que chaque équipe puisse agir en tant que "locataire" distinct sur votre parc.

  • Cliquez sur Afficher tous les niveaux d'accès d'équipe pour afficher la liste complète des niveaux d'accès d'équipe de votre parc.

Afficher le coût mensuel estimé

Dans la section Coût mensuel estimé, vous pouvez consulter le coût mensuel estimé de toutes vos ressources de parc.

Afficher l'utilisation totale des ressources

La section Utilisation totale affiche l'utilisation moyenne des ressources réelles de processeur, de mémoire et de disque de tous les conteneurs de votre parc, par rapport aux ressources pouvant être allouées aux nœuds de cluster de ce parc. Les données sont affichées sur la période que vous avez sélectionnée. L'indication Pouvant être alloué sur un nœud Kubernetes correspond à la quantité de ressources pouvant être utilisées par les pods standards de ce nœud.

Cette vue offre un aperçu rapide de l'utilisation des ressources et des ressources disponibles de votre parc. Elle peut indiquer les problèmes potentiels à examiner plus en détail avec des métriques plus détaillées. Par exemple, si l'utilisation totale du processeur est très faible, vous pouvez utiliser les métriques "par cluster" ci-dessous pour identifier les clusters pouvant être redimensionnés. Par exemple, si l'utilisation totale du processeur est très faible, vous pouvez utiliser les métriques "par cluster" ci-dessous pour identifier les clusters pouvant être redimensionnés.

Afficher la gestion des fonctionnalités

Afficher les problèmes de sécurité

Pour vous aider à identifier les problèmes de sécurité qui affectent les clusters membres de votre parc, tels que les failles actives ou les problèmes de configuration des charges de travail, consultez la section Problèmes de sécurité. Cette section affiche les informations suivantes :

  • Nombre total de problèmes détectés dans votre parc. Les problèmes sont regroupés par gravité, et la gravité est attribuée en fonction de l'échelle d'évaluation qualitative de la gravité CVSS.
  • Répartition des problèmes par type. Cela vous permet de déterminer si les problèmes proviennent de problèmes de configuration, d'un bulletin de sécurité ou d'une faille.

Pour afficher une présentation de la sécurité de GKE et des conseils pratiques sur la résolution des problèmes détectés, cliquez sur Afficher la stratégie de sécurité. Si vous n'avez jamais utilisé le tableau de bord de stratégie de sécurité, cliquez sur Activer la stratégie de sécurité pour activer l'API Container Security et accéder au tableau de bord de stratégie de sécurité.

Pour en savoir plus, consultez la section À propos du tableau de bord de stratégie de sécurité.

Afficher la couverture de Policy Controller

Policy Controller permet d'appliquer des règles entièrement programmables pour vos clusters. Ces règles servent de "garde-fous" et empêchent toute modification de la configuration de l'API Kubernetes de contrevenir aux contrôles de sécurité, opérationnels ou de conformité de votre organisation.

La section État des règles indique le nombre de clusters sur lesquels Policy Controller est activé.

Cliquez sur Afficher la règle pour afficher le tableau de bord de Policy Controller . Si vous n'avez pas installé Policy Controller sur un cluster, cliquez sur Activer la règle.

Pour en savoir plus sur Policy Controller, consultez sa documentation.

Afficher l'état des packages Config Sync

Config Sync est un service GitOps qui permet aux opérateurs de cluster et aux administrateurs de plate-forme de déployer des packages à partir d'une source de vérité. Un package contient toutes les configurations incluses dans chaque source à partir de laquelle vous synchronisez votre cluster. La source peut être un dépôt Git, un répertoire dans un dépôt Git, une image OCI ou un dépôt Helm. Étant donné que vous pouvez synchroniser votre cluster à partir de plusieurs sources, vous pouvez avoir plusieurs packages par cluster.

La section État de la configuration affiche les informations suivantes :

  • Nombre total de packages dans votre parc
  • État de synchronisation des packages de votre parc

Cliquez sur Afficher la présentation de la configuration pour afficher le tableau de bord Config Sync. Si vous n'avez pas installé Config Sync sur un cluster, cliquez sur Activer Config Sync.

Pour en savoir plus sur Config Sync, consultez sa documentation.

Afficher l'efficacité du parc

Cette section fournit une vue détaillée de l'utilisation que fait votre parc de ses ressources cloud ou sur site, y compris l'utilisation des ressources par parc, et l'utilisation principale et faible des ressources par cluster. Cela peut vous aider à identifier, par exemple, les clusters potentiellement sous-utilisés ou surutilisés que vous souhaiterez peut-être redimensionner. Pour en savoir plus sur le calcul de ces métriques, consultez la section Métriques d'utilisation des ressources de parc.

Afficher l'utilisation des ressources au fil du temps

La ligne Utilisation du processeur/de la mémoire/du disque par parc vous permet d'examiner plus en détail l'utilisation des ressources de votre parc au fil du temps. Elle vous permet également de voir les ressources demandées par vos clusters, les ressources pouvant être allouées et l'utilisation réelle. Chaque panneau affiche un graphique de votre utilisation agrégée des processeurs, de la mémoire ou du disque au cours de la période que vous avez sélectionnée, avec les informations suivantes affichées sous forme de lignes distinctes :

  • Pouvant être alloué : quantité de la ressource pouvant être allouée à vos nœuds de cluster de parc
  • Demandé : quantité de ressources demandée par les conteneurs de votre parc
  • Utilisé : quantité réelle de la ressource utilisée par vos conteneurs

Pour afficher les détails d'un point donné du graphique, faites défiler le graphique jusqu'à l'heure qui vous intéresse (par exemple, un pic visible de l'utilisation réelle sur le graphique). Les informations sur l'utilisation des ressources pouvant être allouées, demandées et des ressources réelles pour cette période sont affichées.

Pour activer ou désactiver l'affichage d'une ou plusieurs lignes du graphique, cliquez sur la ou les métriques correspondantes sous le graphique.

Afficher l'utilisation principale des ressources par cluster

La ligne suivante affiche l' utilisation principale du processeur/de la mémoire/du disque par cluster, ce qui vous permet d'identifier rapidement les clusters spécifiques qui utilisent le plus leurs ressources pouvant être allouées. Chaque panneau répertorie vos cinq clusters principaux par ordre d'utilisation (le plus élevé en premier). Pour chaque cluster, vous pouvez afficher un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie. Cette vue peut vous aider, par exemple, à identifier les clusters surutilisés. Les clusters qui ne disposent pas de suffisamment de ressources disponibles peuvent ne pas être en mesure de planifier les pods.

Cliquez sur le nom du cluster qui vous intéresse pour en savoir plus sur son utilisation des ressources. Dans la vue d'utilisation, vous pouvez également afficher le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.

Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher une liste triée de tous les clusters de votre parc.

Afficher la faible utilisation des ressources par cluster

La dernière ligne d'utilisation des ressources affiche la faible utilisation du processeur/de la mémoire/du disque par cluster de votre parc, ce qui vous permet d'identifier rapidement les clusters sous-utilisés. Les cinq clusters qui utilisent le moins de ressources apparaissent en haut de chaque panneau, avec un graphique de leur utilisation et une moyenne de l'utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie.

Cliquez sur le nom du cluster qui vous intéresse pour en savoir plus sur son utilisation des ressources. Dans la vue d'utilisation, vous pouvez également afficher le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.

Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher une liste triée de tous les clusters de votre parc.

Afficher l'efficacité de l'équipe

Cette section fournit une vue d'ensemble de l'utilisation des ressources cloud ou sur site par vos équipes. Elle vous aide également à surveiller les équipes qui rencontrent des problèmes.

Cliquez sur l'équipe qui vous intéresse pour en savoir plus dans le tableau de bord de l'équipe. Dans le tableau de bord de l'équipe, vous pouvez afficher plus de détails sur l'utilisation des ressources et les espaces de noms de l'équipe. Cela peut vous aider à identifier les espaces de noms qui affectent l'utilisation des ressources de l'équipe.

Afficher l'utilisation principale des ressources par niveau d'accès d'équipe

L'utilisation du processeur/de la mémoire/du disque par niveau d'accès vous permet d'identifier rapidement les équipes spécifiques qui utilisent le plus leurs ressources. Chaque panneau répertorie vos équipes principales par ordre d'utilisation (le plus élevé en premier). Pour chaque équipe, vous pouvez afficher un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport à la demande.

Pour afficher l'utilisation des ressources de toutes vos équipes pour la période choisie, cliquez sur Afficher toutes les équipes par utilisation du processeur/de la mémoire/du disque.

Afficher la distribution des erreurs par niveau d'accès

Cette fiche indique les équipes qui ont le plus de journaux d'erreurs pour la période que vous avez choisie.

Pour afficher une liste d'équipes triées par nombre d'erreurs, cliquez sur Afficher tous les niveaux d'accès par nombre d'erreurs.

Afficher le nombre de redémarrages par niveau d'accès

Cette section affiche les équipes qui ont le plus grand nombre de redémarrages de conteneurs pour la période que vous avez sélectionnée.

Pour afficher une liste d'équipes triées par nombre de redémarrages, cliquez sur Afficher tous les niveaux d'accès par redémarrage.

Activer le système Cloud Monitoring pour les clusters de parcs

Comme indiqué dans la section Afficher les clusters, les niveaux d'accès de l'équipe et l'utilisation totale des ressources, les métriques du tableau de bord sont générées à l'aide de données Cloud Monitoring pour les composants de cluster (tels que les charges de travail dans les espaces de noms kube-system et gke-connect). Par conséquent, Cloud Monitoring doit être activé pour tous les composants système, de plan de contrôle et Kube State Metrics de vos clusters membres de parc.

La plupart des clusters GKE sont activés par défaut pour Cloud Logging et Cloud Monitoring, mais vous devez toujours activer manuellement Cloud Monitoring pour tous les composants de cluster. Les clusters associés nécessitent toujours que vous configuriez Cloud Monitoring manuellement.

Si Cloud Monitoring n'est pas activé pour l'un des composants de cluster de votre parc, un panneau s'affiche en haut de la page indiquant le nombre de clusters pour lesquels des données sont manquantes.

Pour activer Cloud Monitoring pour les composants de ces clusters, consultez les guides suivants pour votre type de cluster :

Google Cloud

Activer la surveillance des clusters enregistrés entre projets

Pour collecter et afficher des métriques dans plusieurs Google Cloud projets, Cloud Monitoring vous permet de créer des champs d'application de métriques multi-projets scopes. Lorsque vous enregistrez un cluster GKE depuis un projet différent vers votre projet hôte de parc, un nouveau champ d'application de métriques est automatiquement créé qui inclut les deux projets (s'il n'existe pas déjà). Cela vous permet d'afficher les données d'utilisation du cluster dans la présentation.

Étapes suivantes