Surveiller et résoudre les problèmes avec l'aide de l'IA

Ce document explique comment utiliser l'assistance IA pour vous aider à surveiller et à résoudre les problèmes liés à vos ressources AlloyDB pour PostgreSQL. Vous pouvez utiliser les outils de dépannage assistés par l'IA d'AlloyDB et Gemini Cloud Assist pour résoudre les problèmes liés aux requêtes lentes et résoudre les problèmes liés à une charge de base de données élevée.

Limites

Les limites suivantes s'appliquent au dépannage assisté par IA dans AlloyDB :

  • Le dépannage assisté par IA fournit des informations précieuses basées sur les configurations PostgreSQL standards. L'architecture unique d'AlloyDB, y compris son stockage dissocié, sa mise en cache, son moteur de données en colonnes et ses processus en arrière-plan optimisés, signifie que certains contrôles et recommandations peuvent différer des métriques de performances AlloyDB réelles. Nous vous recommandons de considérer les recommandations de dépannage assisté par IA comme des points de départ et de consulter la documentation AlloyDB pour obtenir des conseils définitifs.
  • Le dépannage assisté par l'IA n'est pas compatible avec les configurations AlloyDB suivantes :

Avant de commencer

Assurez-vous que Gemini Cloud Assist est configuré pour votre compte utilisateur et votre projet Google Cloud .

Après avoir configuré Gemini Cloud Assist, vous devrez peut-être attendre cinq minutes que le service se propage avant de pouvoir activer le dépannage assisté par l'IA dans AlloyDB.

Rôles et autorisations nécessaires

Pour obtenir les autorisations nécessaires pour utiliser le dépannage assisté par IA, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet qui héberge l'instance AlloyDB :

Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Ces rôles prédéfinis contiennent les autorisations requises pour utiliser le dépannage assisté par l'IA. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour utiliser le dépannage assisté par IA :

  • databaseinsights.performanceIssues.detect
  • databaseinsights.performanceIssues.investigate

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Pour en savoir plus sur les rôles et autorisations requis pour utiliser les investigations Gemini Cloud Assist, consultez Résoudre les problèmes à l'aide des investigations Gemini Cloud Assist.

Activer le dépannage assisté par l'IA

Lorsque vous activez le dépannage assisté par IA pour votre instance AlloyDB, AlloyDB peut analyser les performances de vos bases de données et détecter les anomalies dans l'exécution de vos requêtes. Lorsque AlloyDB détecte des anomalies dans les performances des requêtes ou identifie une charge système élevée, le dépannage assisté par IA vous aide à analyser la situation avec des preuves et vous fournit des recommandations.

Pour activer le dépannage assisté par IA pour votre instance AlloyDB :

  1. Dans la console Google Cloud , accédez à la page Clusters.

    accéder aux clusters

  2. Dans la liste des clusters et des instances, cliquez sur une instance.

  3. Cliquez sur Insights sur les requêtes.

  4. Cliquez sur Activer ou Modifier les paramètres.

  5. Dans l'onglet Modifier les paramètres d'insights sur les requêtes, cochez la case Activer les fonctionnalités avancées d'insights sur les requêtes pour AlloyDB.

    Par défaut, la case Dépannage assisté par IA est cochée.

  6. Cliquez sur Enregistrer.

  7. Pour obtenir les meilleurs résultats, attendez 24 heures après avoir activé le dépannage assisté par IA dans la console Google Cloud . Cela permettra à AlloyDB d'établir une référence des performances moyennes de votre instance, de votre base de données et de vos requêtes.

Pour en savoir plus sur l'activation des insights avancés sur les requêtes, consultez Améliorer les performances des requêtes à l'aide des insights avancés sur les requêtes.

Ouvrir Gemini Cloud Assist

Pour utiliser Gemini Cloud Assist avec AlloyDB, procédez comme suit :

  1. Dans la console Google Cloud , accédez à la page Clusters.
  2. accéder aux clusters
  3. Dans la liste des clusters et des instances, cliquez sur une instance.
  4. Cliquez sur Insights sur les requêtes.
  5. Pour ouvrir le panneau Cloud Assist, cliquez sur Ouvrir ou fermer le chat Gemini Cloud Assist.
  6. Dans le panneau Cloud Assist, saisissez un prompt qui décrit les informations qui vous intéressent.
  7. Après avoir saisi la requête, cliquez sur  Envoyer la requête. Gemini renvoie une réponse à votre requête en fonction des informations de la dernière heure.

Résoudre les problèmes de lenteur des requêtes

Pour utiliser l'assistance IA afin de résoudre les problèmes liés à vos requêtes lentes, accédez au tableau de bord Insights sur les requêtes de votre instance AlloyDB dans la console Google Cloud .

Tableau des requêtes les plus fréquentes

Vous pouvez commencer à résoudre les problèmes liés à la lenteur des requêtes avec l'assistance IA dans la section Tableau "Requêtes principales" du tableau de bord Insights sur les requêtes.

AlloyDB peut vous aider à identifier les requêtes qui sont plus lentes que la moyenne au cours d'une période de détection spécifique. Après avoir sélectionné une période dans le tableau de bord Insights sur les requêtes, AlloyDB vérifie si des requêtes sont plus lentes que la moyenne en utilisant une période de détection de 24 heures avant la fin de la période sélectionnée.

Lorsque vous ajustez le filtre de période du graphique Charge de la base de données, ou tout autre filtre tel que la base de données ou l'utilisateur, AlloyDB actualise le tableau des principales requêtes et réexécute la détection des anomalies en fonction de la nouvelle liste de requêtes et d'une période de détection mise à jour.

Lorsqu'AlloyDB détecte une anomalie :

  • AlloyDB effectue une analyse des performances de référence pour votre requête.

  • Chaque requête listée dans le tableau est associée à une icône Examiner ou Avertissement warning_spark, qui s'affiche à côté de la valeur Temps d'exécution moyen (ms) de la requête.

Si une requête s'exécute plus lentement que prévu, l'icône Avertissement warning_spark s'affiche. Lorsque vous cliquez sur l'une ou l'autre icône, Gemini Cloud Assist est utilisé pour analyser l'exécution de la requête et fournit des observations sur les causes possibles du problème. À partir de ces observations, Gemini Cloud Assist génère une hypothèse qui peut vous aider à résoudre le problème.

Pour résoudre les problèmes de requêtes lentes dans le tableau Requêtes principales du tableau de bord Insights sur les requêtes, procédez comme suit :

  1. Dans la console Google Cloud , accédez à la page Clusters.
  2. accéder aux clusters
  3. Dans la liste des clusters et des instances, cliquez sur une instance.
  4. Cliquez sur Insights sur les requêtes.
  5. Dans le graphique Requêtes exécutées, utilisez le filtre Période pour sélectionner une heure, six heures, un jour, sept jours, 30 jours ou une période personnalisée.
  6. Dans le tableau Requêtes les plus fréquentes, sous l'onglet Requêtes, consultez la liste des requêtes pour votre base de données.
  7. Si une icône Avertissement warning_spark s'affiche à côté de la valeur Temps d'exécution moyen (ms) d'une requête, cela signifie qu'AlloyDB a détecté une anomalie dans les performances de votre requête. AlloyDB recherche les anomalies au cours de la période de 24 heures précédant la fin de la période sélectionnée.
  8. Cliquez sur l'icône Avertissement warning_spark.
  9. Dans la boîte de dialogue La requête est plus lente que d'habitude, cliquez sur Nouvelle investigation pour commencer le dépannage avec l'assistance de l'IA de Gemini Cloud Assist. Au bout de deux minutes environ, le volet Détails de l'investigation s'ouvre et contient les sections suivantes :
    • Problème Description du problème faisant l'objet de l'investigation, y compris l'heure de début et de fin de l'investigation.
    • Observations Liste des observations concernant le problème. Par exemple, il peut s'agir de détails sur les conflits de verrouillage, tels qu'un ratio d'attente de verrouillage plus long que prévu pour la requête.
    • Hypothèses. Liste des actions recommandées par l'IA pour résoudre le problème de lenteur des requêtes.
  10. Si vous souhaitez afficher toutes les investigations associées à la requête, cliquez sur Afficher toutes les investigations dans la boîte de dialogue La requête est plus lente que d'habitude. La page Gemini Cloud Assist s'ouvre. Vous pouvez y consulter toutes les investigations en cours d'exécution et celles qui ont déjà été effectuées. Vous pouvez filtrer la page par projet ou par libellé, par exemple, pour trouver l'enquête spécifique dont vous avez besoin.

    Vous pouvez également cliquer sur l'icône Notifications , puis sélectionner une notification associée à une investigation pour ouvrir la page Gemini Cloud Assist.

  11. Si vous souhaitez examiner la latence d'une requête, procédez comme suit :
    1. Identifiez la requête spécifique que vous souhaitez examiner.
    2. Dans la colonne Actions, cliquez sur l'icône  Actions associée à cette requête.
    3. Sélectionnez Examiner la latence dans le menu pour exécuter une investigation Gemini Cloud Assist.

Détails de la requête

Vous pouvez également résoudre les problèmes liés à la lenteur des requêtes avec l'assistance IA sur la page Détails de la requête.

  1. Dans la console Google Cloud , accédez à la page Clusters.
  2. accéder aux clusters
  3. Dans la liste des clusters et des instances, cliquez sur une instance.
  4. Cliquez sur Insights sur les requêtes pour ouvrir le tableau de bord Insights sur les requêtes.
  5. Dans le tableau de bord Insights sur les requêtes, cliquez sur la requête que vous souhaitez afficher dans Requêtes principales. La page Détails de la requête s'affiche.
  6. Facultatif : Utilisez le filtre "Période" pour sélectionner une période d'une heure, de six heures, d'un jour, de sept jours, de 30 jours ou une plage personnalisée. Lorsque vous ajustez le filtre de période de la page Détails de la requête, AlloyDB réexécute la détection d'anomalies.
  7. Si AlloyDB ne détecte aucune anomalie pour la requête, vous pouvez toujours exécuter une analyse sur la requête en cliquant sur le bouton Examiner dans la fiche Latence des requêtes.

Analyser la latence des requêtes

Grâce à l'assistance de l'IA, vous pouvez analyser et résoudre les problèmes liés à la latence de vos requêtes.

Période d'analyse

La période d'analyse correspond aux 24 heures précédant la fin de la période que vous sélectionnez dans le graphique Charge de la base de données du tableau de bord Insights sur les requêtes ou de la page Détails de la requête. AlloyDB utilise cette période pour comparer les métriques de référence avec celles récupérées pendant la période de l'anomalie.

Sur la page Détails de la requête, si AlloyDB a détecté une anomalie avec la requête, après que vous l'avez sélectionnée dans le tableau de bord Insights sur les requêtes, AlloyDB effectue une analyse des performances de référence pour la requête en utilisant les dernières 24 heures à partir de la fin de l'anomalie. Si AlloyDB n'a pas détecté d'anomalie avec la requête et exécute à nouveau la détection d'anomalie sur la requête, AlloyDB utilise les 48 heures précédant la fin de la période sélectionnée comme base de référence des performances pour la période d'analyse.

Période d'anomalie détectée

La période d'anomalie détectée correspond à une période pendant laquelle AlloyDB détecte une variation anormale des performances des requêtes. AlloyDB utilise les performances de référence mesurées pour la requête au cours de la période d'analyse.

Si AlloyDB détecte plusieurs anomalies pour une requête au cours d'une période sélectionnée, il utilise la dernière anomalie détectée.

Exemples de requêtes sur les performances

Vous pouvez également utiliser Gemini Cloud Assist pour saisir des requêtes qui vous aideront à améliorer les performances de vos requêtes. Gemini Cloud Assist répond aux questions concernant l'instance et la base de données AlloyDB sélectionnées.

Prompt Type de réponse
Quelles sont les principales requêtes par latence dans ma base de données ?
  • Résumés des requêtes triés par latence. Gemini limite la réponse en fonction du filtre de période sélectionné dans le graphique de charge de la base de données des insights sur les requêtes.
  • Conseils pour identifier et trier les requêtes par latence.
Quelle est la requête la plus lente dans cette instance de base de données ? Conseils pour identifier la requête la plus lente en fonction de la latence.

Résoudre les problèmes de charge élevée de la base de données

En accédant au tableau de bord Insights sur les requêtes dans la console Google Cloud , vous pouvez analyser votre base de données et résoudre les problèmes liés aux événements lorsque votre système connaît une charge de base de données supérieure à la moyenne. AlloyDB utilise les données des 24 heures précédant la période sélectionnée pour calculer la charge attendue de votre base de données. Vous pouvez examiner les raisons des événements de charge plus élevés et analyser les preuves de la baisse des performances. AlloyDB fournit également des recommandations pour optimiser votre base de données et améliorer ses performances.

Pour utiliser l'assistance IA afin de résoudre les problèmes de charge élevée de la base de données, accédez à la page Présentation de l'instance ou au tableau de bord Insights sur les requêtes dans la console Google Cloud .

Page "Présentation de l'instance"

Résolvez les problèmes de charge élevée de la base de données grâce à l'assistance de l'IA sur la page Présentation de l'instance en procédant comme suit :

  1. Dans la console Google Cloud , accédez à la page Clusters.
  2. accéder aux clusters
  3. Dans la liste des clusters et des instances, cliquez sur une instance.
  4. Sur la page Vue d'ensemble, dans le menu Graphique, sélectionnez une métrique pour la base de données. Vous pouvez sélectionner n'importe quelle métrique, par exemple Utilisation du processeur.
  5. Facultatif : Pour sélectionner une période d'analyse spécifique, utilisez le filtre Période et choisissez 1 heure, 6 heures, 1 jour, 7 jours, 30 jours ou une période personnalisée.

    Vous pouvez faire un zoom avant sur des sections spécifiques du graphique où vous remarquez des zones de forte charge que vous souhaitez analyser. Par exemple, une zone de charge élevée peut afficher des niveaux d'utilisation du processeur proches de 100%. Pour effectuer un zoom avant, vous pouvez cliquer sur une partie du graphique et la sélectionner.

    Cliquez sur le bouton Enquêter sur les performances pour commencer à résoudre les problèmes de charge de base de données élevée avec l'assistance IA de Gemini Cloud Assist.

    Au bout de deux minutes environ, le volet Détails de l'investigation s'ouvre et contient les sections suivantes :

    • Problème Description du problème faisant l'objet de l'investigation, y compris l'heure de début et de fin de l'investigation.
    • Observations Liste des observations concernant le problème. Par exemple, il peut s'agir de détails sur les conflits de verrouillage, tels qu'un ratio d'attente de verrouillage plus long que prévu pour la requête.
    • Hypothèses. Liste des actions recommandées par l'IA pour résoudre le problème de lenteur de la requête.

Tableau de bord "Insights sur les requêtes"

Résolvez les problèmes liés à une charge de base de données élevée grâce à l'assistance IA dans le tableau de bord Insights sur les requêtes en procédant comme suit :

  1. Dans la console Google Cloud , accédez à la page Clusters.
  2. accéder aux clusters
  3. Dans la liste des clusters et des instances, cliquez sur une instance.
  4. Cliquez sur Insights sur les requêtes pour ouvrir le tableau de bord Insights sur les requêtes.
  5. Facultatif : Utilisez le filtre Période pour sélectionner une période d'une heure, de six heures, d'un jour, de sept jours, de 30 jours ou une période personnalisée.
  6. Vous pouvez faire un zoom avant sur des sections spécifiques du graphique où vous remarquez des zones de charge de base de données plus élevée en fonction du temps d'exécution des requêtes. Pour effectuer un zoom avant, vous pouvez cliquer sur une partie du graphique et la sélectionner.

    Dans le graphique de charge de la base de données, cliquez sur le bouton Examiner les performances pour commencer à résoudre les problèmes de charge élevée de la base de données avec l'assistance de l'IA de Gemini Cloud Assist.

    Au bout de deux minutes environ, le volet Détails de l'investigation s'ouvre et contient les sections suivantes :

    • Problème Description du problème faisant l'objet de l'investigation, y compris l'heure de début et de fin de l'investigation.
    • Observations Liste des observations concernant le problème. Par exemple, il peut s'agir de détails sur les conflits de verrouillage, tels qu'un ratio d'attente de verrouillage plus long que prévu pour la requête.
    • Hypothèses. Liste des actions recommandées par l'IA pour résoudre le problème de lenteur de la requête.

Analyser une charge de base de données élevée

L'assistance IA vous permet d'analyser et de résoudre les problèmes liés à la charge de votre base de données.

Période d'analyse

AlloyDB analyse votre base de données pour la période que vous sélectionnez dans le graphique de charge de votre base de données, sur le tableau de bord Insights sur les requêtes ou la page Présentation de l'instance. Si vous sélectionnez une période inférieure à 24 heures, AlloyDB analyse l'intégralité de la période. Si vous sélectionnez une période supérieure à 24 heures, AlloyDB ne sélectionne que les 24 dernières heures de la période pour l'analyse.

Pour calculer l'analyse des performances de référence de votre base de données, AlloyDB inclut 24 heures de période de référence dans sa période d'analyse. Si la période sélectionnée ne commence pas un lundi, AlloyDB utilise une période de référence de 24 heures avant la période sélectionnée. Si la période sélectionnée commence un lundi, AlloyDB utilise une période de référence de sept jours avant la période sélectionnée.

Analyse des métriques

Lorsqu'AlloyDB lance l'analyse, il recherche des changements importants dans les différentes métriques, y compris, mais sans s'y limiter, les suivantes :

  • Requêtes par seconde (RPS)
  • Processeur
  • Mémoire
  • E/S disque

AlloyDB compare les données agrégées de référence de votre base de données aux données sur les performances de la période d'analyse. Si AlloyDB détecte un changement significatif du seuil d'une métrique clé, il indique une situation potentielle avec votre base de données. La situation identifiée peut expliquer une cause première de la charge élevée sur votre base de données au cours de la période sélectionnée.

Recommandations

Une fois l'analyse terminée par Gemini Cloud Assist, la section Hypothèses du volet Détails de l'investigation liste des insights exploitables pour vous aider à résoudre le problème.

Dans certains cas, aucune recommandation ne sera proposée en fonction de l'analyse.

Exemples de requêtes sur les performances du système

Vous pouvez également utiliser Gemini Cloud Assist pour saisir des requêtes afin de recueillir des informations sur les performances de votre système. Gemini Cloud Assist répond aux questions concernant l'instance AlloyDB sélectionnée.

Prompt Type de réponse
Combien d'entrées de journal d'erreurs y a-t-il pour cette instance de base de données au cours des sept derniers jours ? Récapitulatif des entrées de journal regroupées par type de gravité. Gemini limite la réponse en fonction du filtre de période sélectionné dans le graphique des performances de l'instance.
Quelle était l'utilisation du processeur pour cette instance de base de données vers 14h aujourd'hui ? Les résultats des métriques sont exprimés en pourcentage pour l'utilisation du processeur au cours de l'intervalle de temps.

Obtenir des recommandations d'index

Vous pouvez obtenir des recommandations d'index d'AlloyDB dans les insights sur les requêtes. Pour en savoir plus, consultez la présentation de l'Index Advisor.

Exemples de requêtes de recommandation d'index

Utilisez Gemini Cloud Assist pour en savoir plus sur l'utilisation des index dans vos bases de données. Gemini Cloud Assist répond aux questions concernant l'instance AlloyDB sélectionnée.

Prompt Type de réponse
Afficher les recommandations d'index pour les requêtes exécutées au cours des sept derniers jours. Conseils sur les types de requêtes pouvant bénéficier d'un index.

Surveiller les requêtes actives

Utilisez le tableau de bord Insights sur les requêtes pour surveiller les requêtes actives et, si nécessaire, mettre fin aux processus de longue durée. Pour en savoir plus, consultez Surveiller les requêtes actives.

Exemples de requêtes actives

Utilisez Gemini Cloud Assist pour en savoir plus sur les requêtes qui entraînent une latence ou une charge de processeur élevées. Gemini Cloud Assist répond aux questions concernant l'instance AlloyDB sélectionnée.

Prompt Type de réponse
Quelles sont les principales requêtes actuellement exécutées dans ma base de données ? Conseils pour trouver les requêtes les plus longues et les plus gourmandes en ressources.

Résoudre les problèmes de délai de réplication des instances répliquées avec accès en lecture

Vous pouvez analyser le délai de réplication à l'aide de Gemini Cloud Assist ou du tableau de bord Présentation de la console Google Cloud .

L'assistance IA évalue les facteurs suivants pour déterminer pourquoi une instance répliquée en lecture est en retard par rapport à une instance principale.

  • Volume d'écriture de l'instance principale

    Des taux élevés de modification des données sur l'instance principale peuvent générer des journaux WAL plus rapidement que l'instance répliquée ne peut les relire. Gemini recherche les schémas d'écriture "par rafales" qui sont corrélés aux pics de latence.

  • Contraintes de ressources (CPU/mémoire)

    La relecture de la réplication est un processus gourmand en ressources processeur. Gemini analyse si le niveau de machine de la réplique est insuffisant pour gérer la charge de relecture actuelle ou si les requêtes de lecture simultanées privent le processus de relecture de ressources.

  • Performances du réseau et du stockage

    Dans les déploiements multirégionaux, le débit réseau peut avoir une incidence sur la vitesse à laquelle les journaux sont envoyés au réplica. L'IA évalue les métadonnées d'opération interne pour déterminer si le goulot d'étranglement se situe au niveau du transport ou de l'application des journaux.

Examiner la latence des instances répliquées avec accès en lecture

Pour utiliser l'assistance IA afin de résoudre les problèmes de latence des instances répliquées en lecture, procédez comme suit :

  1. Dans la console Google Cloud , accédez à la page Clusters.
  2. accéder aux clusters
  3. Accédez à Insights sur le système. Dans le menu Instance, sélectionnez votre réplica en lecture.
  4. Dans le volet Résolvez les problèmes de base de données grâce au dépannage assisté par l'IA, cliquez sur Explorer les investigations.
  5. Dans la fenêtre Options d'investigation, recherchez la section Latence de la réplique en lecture.
  6. Facultatif : Sélectionnez une période d'analyse spécifique à l'aide du filtre Période (1 heure, 6 heures, 1 jour, 7 jours ou une période personnalisée).
  7. Cliquez sur Examiner.

    Gemini lance une analyse des signaux spécifiques à la réplication, y compris les taux de génération WAL (Write Ahead Log) et la vitesse de relecture des répliques. Une fois l'analyse terminée, le volet Détails de l'investigation affiche les sections suivantes :

    • Problème : récapitulatif de la durée du décalage et du décalage actuel en octets ou en temps entre l'instance principale et l'instance répliquée.
    • Observations : métriques spécifiques telles qu'une utilisation élevée du processeur sur le réplica ou une contention de verrouillage lors de la relecture du journal WAL.
    • Hypothèses : étapes recommandées par l'IA, comme l'optimisation des transactions d'écriture lourdes sur le serveur principal ou l'augmentation du niveau de la machine répliquée.

Exemples de requêtes sur la latence des instances répliquées avec accès en lecture

Vous pouvez également utiliser Gemini Cloud Assist et une requête en langage naturel pour résoudre les problèmes de latence entre votre instance répliquée avec accès en lecture et votre instance principale.

Prompt Type de réponse
Pourquoi le décalage de mon instance répliquée en lecture AlloyDB est-il si élevé ? Conseils pour réduire le délai de réplication en ajustant votre base de données ou en configurant votre cluster.

Étapes suivantes