Métricas del índice vectorial

Selecciona una versión de la documentación:

En esta página, se enumeran las métricas relacionadas con los índices vectoriales que generas en AlloyDB Omni. Puedes ver estas métricas con la vista pg_stat_ann_indexes que está disponible cuando instalas la extensión alloydb_scann.

Para obtener más información sobre cómo ver las métricas, consulta Cómo ver las métricas de índice vectorial.

Métricas de usabilidad

Las métricas de usabilidad incluyen métricas que te ayudan a comprender el estado de la utilización del índice con métricas, como la configuración del índice y la cantidad de análisis de índice.

Nombre de la métrica Tipo de datos Descripción
relid OID Identificador único de la tabla que contiene el índice vectorial
indexrelid OID Identificador único del índice vectorial
schemaname NAME Nombre del esquema que posee el índice
relname NAME Nombre de la tabla que contiene el índice
indexrelname NAME Nombre del índice
indextype NAME Tipo de índice. Este valor siempre se establece en alloydb_scann.
indexconfig TEXT[] Configuración, como el recuento de hojas y el cuantificador, definida para el índice cuando se creó
indexsize TEXT Tamaño del índice
indexscan BIGINT Cantidad de análisis de índice iniciados en el índice
partitioncount BIGINT Cantidad de particiones (nodos hoja) en el árbol

Métricas de ajuste

Las métricas de ajuste proporcionan estadísticas sobre la optimización actual del índice, lo que te permite aplicar recomendaciones para un rendimiento más rápido de las consultas.

Nombre de la métrica Tipo de datos Descripción
insertcount BIGINT Cantidad de operaciones de inserción en el índice. Esta métrica también incluye la cantidad de filas que existían antes de que se creara el índice.
updatecount BIGINT Cantidad de operaciones de actualización en el índice. Esta métrica no tiene en cuenta las actualizaciones HOT.
deletecount BIGINT Cantidad de operaciones de eliminación en el índice.
distribution JSONB Distribuciones vectoriales en todas las particiones del índice.

En los siguientes campos, se muestra la distribución:
  • maximum (INT8): Cantidad máxima de vectores en todas las particiones.
  • minimum (INT8): Cantidad mínima de vectores en todas las particiones.
  • average (FLOAT) : Cantidad promedio de vectores en todas las particiones.
  • outliers (INT8[]): Valores atípicos principales en todas las particiones. Este valor muestra los 20 valores atípicos principales.

Nota: Debido a las características inherentes del algoritmo de agrupamiento de K-means, siempre habrá cierto grado de varianza en la distribución de vectores en las particiones, incluso cuando se crea el índice inicialmente.

Recomendación de ajuste basada en las métricas

Mutación
Las métricas insertcount, updatecount, y deletecount juntas muestran los cambios o mutaciones en el vector del índice.
El índice se crea con una cantidad específica de vectores y particiones. Cuando se realizan operaciones como insertar, actualizar o borrar en el índice vectorial, solo afecta al conjunto inicial de particiones en las que residen los vectores. En consecuencia, la cantidad de vectores en cada partición fluctúa con el tiempo, lo que puede afectar la recuperación, la QPS o ambas.
Si tienes problemas de lentitud o precisión, como una QPS baja o una recuperación deficiente, en tus consultas de búsqueda de ANN con el tiempo, considera revisar estas métricas. Una gran cantidad de mutaciones en relación con la cantidad total de vectores podría indicar la necesidad de volver a indexar.
Distribución
La métrica distribution muestra las distribuciones vectoriales en todas las particiones.
Cuando creas un índice, se crea con una cantidad específica de vectores y particiones fijas. El proceso de partición y la distribución posterior se producen en función de esta consideración. Si se agregan vectores adicionales, se particionan entre las particiones existentes, lo que genera una distribución diferente en comparación con la distribución cuando se creó el índice. Dado que la distribución final no considera todos los vectores de forma simultánea, la recuperación, la QPS o ambas podrían verse afectadas.
Si observas una disminución gradual en el rendimiento de tus consultas de búsqueda de ANN, como tiempos de respuesta más lentos o una precisión reducida en los resultados (medida por QPS o recuperación), considera verificar esta métrica y volver a indexar.