Métriques d'index vectoriel

Sélectionnez une version de la documentation :

Cette page répertorie les métriques liées aux index vectoriels que vous générez dans AlloyDB Omni. Vous pouvez afficher ces métriques à l'aide de la vue pg_stat_ann_indexes, disponible lorsque vous installez l'extension alloydb_scann.

Pour en savoir plus sur l'affichage des métriques, consultez Afficher les métriques d'index vectoriel.

Métriques d'utilisation

Les métriques d'utilisation incluent des métriques qui vous aident à comprendre l'état d'utilisation de l'index, telles que la configuration de l'index et le nombre d'analyses d'index.

Nom de la métrique Type de données Description
relid OID Identifiant unique de la table contenant l'index vectoriel
indexrelid OID Identifiant unique de l'index vectoriel
schemaname NAME Nom du schéma propriétaire de l'index
relname NAME Nom de la table contenant l'index
indexrelname NAME Nom de l'index
indextype NAME Type d'index. Cette valeur est toujours définie sur alloydb_scann.
indexconfig TEXT[] Configuration, telle que le nombre de feuilles et le quantificateur, définie pour l'index lors de sa création
indexsize TEXT Taille de l'index
indexscan BIGINT Nombre d'analyses d'index lancées sur l'index
partitioncount BIGINT Nombre de partitions (nœuds feuilles) dans l'arborescence.

Métriques de réglage

Les métriques de réglage fournissent des insights sur l'optimisation actuelle de votre index, ce qui vous permet d'appliquer des recommandations pour améliorer les performances des requêtes.

Nom de la métrique Type de données Description
insertcount BIGINT Nombre d'opérations d'insertion sur l'index. Cette métrique inclut également le nombre de lignes qui existaient avant la création de l'index.
updatecount BIGINT Nombre d'opérations de mise à jour sur l'index. Cette métrique ne tient pas compte des mises à jour HOT.
deletecount BIGINT Nombre d'opérations de suppression sur l'index.
distribution JSONB Distributions vectorielles sur toutes les partitions de l'index.

Les champs suivants affichent la distribution :
  • maximum (INT8) : nombre maximal de vecteurs sur toutes les partitions.
  • minimum (INT8) : nombre minimal de vecteurs sur toutes les partitions.
  • average (FLOAT) : nombre moyen de vecteurs sur toutes les partitions.
  • outliers (INT8[]) : valeurs aberrantes les plus élevées sur toutes les partitions. Cette valeur affiche les 20 valeurs aberrantes les plus élevées.

Remarque : En raison des caractéristiques inhérentes à l'algorithme de clustering K-means, il y aura toujours un certain degré de variance dans la distribution des vecteurs entre les partitions, même lorsque l'index est créé initialement.

Recommandation de réglage basée sur les métriques

Mutation
Les insertcount, updatecount, et deletecount métriques indiquent ensemble les modifications ou mutations du vecteur pour l'index.
L'index est créé avec un nombre spécifique de vecteurs et de partitions. Lorsque des opérations telles que l'insertion, la mise à jour ou la suppression sont effectuées sur l'index vectoriel, elles n'affectent que l'ensemble initial de partitions dans lesquelles résident les vecteurs. Par conséquent, le nombre de vecteurs dans chaque partition fluctue au fil du temps, ce qui peut avoir un impact sur le rappel, le RPS ou les deux.
Si vous rencontrez des problèmes de lenteur ou de précision, tels qu'un faible RPS ou un rappel médiocre, dans vos requêtes de recherche ANN au fil du temps, envisagez de consulter ces métriques. Un nombre élevé de mutations par rapport au nombre total de vecteurs peut indiquer la nécessité d'une réindexation.
Distribution
La métrique distribution affiche les distributions vectorielles sur toutes les partitions.
Lorsque vous créez un index, il est créé avec un nombre spécifique de vecteurs et de partitions fixes. Le processus de partitionnement et la distribution ultérieure sont basés sur cette considération. Si des vecteurs supplémentaires sont ajoutés, ils sont partitionnés entre les partitions existantes, ce qui entraîne une distribution différente de celle qui existait lors de la création de l'index. Étant donné que la distribution finale ne prend pas en compte tous les vecteurs simultanément, le rappel, le RPS ou les deux peuvent être affectés.
Si vous constatez une baisse progressive des performances de vos requêtes de recherche ANN, par exemple des temps de réponse plus lents ou une précision réduite des résultats (mesurée par le RPS ou le rappel), envisagez de vérifier cette métrique et de réindexer.