En este documento, se describe cómo ajustar tus índices para lograr un rendimiento de consultas más rápido y una mejor recuperación en AlloyDB Omni.
Ajusta un índice de IVF
Ajustar los valores que estableces para los parámetros lists
, ivf.probes
y quantizer
puede ayudarte a optimizar el rendimiento de tu aplicación:
Parámetro de ajuste | Descripción | Tipo de parámetro |
---|---|---|
lists |
Es la cantidad de listas creadas durante la compilación del índice. El punto de partida para establecer este valor es (rows)/1000 para hasta un millón de filas y sqrt(rows) para más de un millón de filas. |
Creación de índices |
quantizer |
Es el tipo de cuantificador que deseas usar para el árbol de K-means. El valor predeterminado es SQ8 para mejorar el rendimiento de las consultas. Establécelo en FLAT para obtener una mejor recuperación. |
Creación de índices |
ivf.probes |
Es la cantidad de listas de vecinos más cercanos que se explorarán durante la búsqueda. El punto de partida para este valor es sqrt(lists) . |
Tiempo de ejecución de la consulta |
Considera el siguiente ejemplo que muestra un índice IVF
con los parámetros de ajuste establecidos:
SET LOCAL ivf.probes = 10;
CREATE INDEX my-ivf-index ON my-table
USING ivf (vector_column cosine)
WITH (lists = 100, quantizer = 'SQ8');
Analiza tus búsquedas
Usa el comando EXPLAIN ANALYZE
para analizar tus estadísticas de consultas, como se muestra en el siguiente ejemplo de consulta en SQL.
EXPLAIN ANALYZE SELECT result-column
FROM my-table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
La respuesta de ejemplo QUERY PLAN
incluye información como el tiempo que tardó, la cantidad de filas analizadas o devueltas y los recursos utilizados.
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my-scann-index on my-table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
Consulta las métricas del índice de vectores
Puedes usar las métricas del índice de vectores para revisar el rendimiento de tu índice de vectores, identificar áreas de mejora y ajustar tu índice según las métricas, si es necesario.
Para ver todas las métricas del índice de vectores, ejecuta la siguiente consulta en SQL, que usa la vista pg_stat_ann_indexes
:
SELECT * FROM pg_stat_ann_indexes;
Para obtener más información sobre la lista completa de métricas, consulta Métricas del índice de vectores.