En este documento, se describe cómo ajustar tus índices para lograr un rendimiento de consultas más rápido y una mejor recuperación en AlloyDB Omni.
Antes de comenzar
Antes de compilar un índice de ScaNN
, completa los siguientes pasos:
- Asegúrate de que ya se haya creado una tabla con tus datos.
- Para evitar problemas durante la generación del índice, asegúrate de que el valor que establezcas para la marca
maintenance_work_mem
yshared_buffers
sea inferior a la memoria total de la máquina.
Ajusta un índice de ScaNN
Usa la siguiente guía para elegir entre un índice de ScaNN de dos y tres niveles:
- Elige un índice de dos niveles si la cantidad de filas de vectores es inferior a 10 millones.
- Elige un índice de tres niveles si la cantidad de filas de vectores supera los 100 millones.
- Elige un índice de tres niveles para optimizar el tiempo de compilación del índice o un índice de dos niveles para optimizar la recuperación de la búsqueda si la cantidad de filas de vectores se encuentra entre 10 y 100 millones.
Considera los siguientes ejemplos para los índices ScaNN
de dos y tres niveles que muestran cómo se configuran los parámetros de ajuste para una tabla con 1,000,000 de filas:
Índice de dos niveles
SET LOCAL scann.num_leaves_to_search = 1;
SET LOCAL scann.pre_reordering_num_neighbors=50;
CREATE INDEX my-scann-index ON my-table
USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 1/2)]);
Índice de tres niveles
SET LOCAL scann.num_leaves_to_search = 10;
SET LOCAL scann.pre_reordering_num_neighbors=50;
CREATE INDEX my-scann-index ON my-table
USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 2/3)], max_num_levels = 2);
Analiza tus búsquedas
Usa el comando EXPLAIN ANALYZE
para analizar tus estadísticas de consultas, como se muestra en el siguiente ejemplo de consulta en SQL.
EXPLAIN ANALYZE SELECT result-column
FROM my-table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
La respuesta de ejemplo QUERY PLAN
incluye información como el tiempo que tardó, la cantidad de filas analizadas o devueltas y los recursos utilizados.
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my-scann-index on my-table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
Consulta las métricas del índice de vectores
Puedes usar las métricas del índice de vectores para revisar el rendimiento de tu índice de vectores, identificar áreas de mejora y ajustar tu índice según las métricas, si es necesario.
Para ver todas las métricas del índice de vectores, ejecuta la siguiente consulta en SQL, que usa la vista pg_stat_ann_indexes
:
SELECT * FROM pg_stat_ann_indexes;
Para obtener más información sobre la lista completa de métricas, consulta Métricas del índice de vectores.