En esta página, se describe cómo ajustar tus índices para lograr un rendimiento de las consultas más rápido y una mejor recuperación en AlloyDB para PostgreSQL.
Ajusta un índice de IVF
Ajustar los valores que estableces para los parámetros lists, ivf.probes y quantizer puede ayudarte a optimizar el rendimiento de tu aplicación:
| Parámetro de ajuste | Descripción | Tipo de parámetro |
|---|---|---|
lists |
Es la cantidad de listas creadas durante la compilación del índice. El punto de partida para establecer este valor es (rows)/1000 para hasta un millón de filas y sqrt(rows) para más de un millón de filas. |
Creación de índices |
quantizer |
Es el tipo de cuantificador que deseas usar para el árbol de K-means. El valor predeterminado es SQ8 para mejorar el rendimiento de las consultas. Establécelo en FLAT para obtener una mejor recuperación. |
Creación de índices |
ivf.probes |
Es la cantidad de listas de vecinos más cercanos que se explorarán durante la búsqueda. El punto de partida para este valor es sqrt(lists). |
Tiempo de ejecución de la consulta |
Considera el siguiente ejemplo que muestra un índice IVF con los parámetros de ajuste establecidos:
SET LOCAL ivf.probes = 10;
CREATE INDEX my-ivf-index ON my-table
USING ivf (vector_column cosine)
WITH (lists = 100, quantizer = 'SQ8');
Analiza tus búsquedas
Usa el comando EXPLAIN ANALYZE para analizar tus estadísticas de consultas, como se muestra en el siguiente ejemplo de consulta en SQL.
EXPLAIN ANALYZE SELECT result-column
FROM my-table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
La respuesta de ejemplo QUERY PLAN incluye información como el tiempo que tardó, la cantidad de filas analizadas o devueltas y los recursos utilizados.
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my-scann-index on my-table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
Consulta las métricas del índice de vectores
Puedes usar las métricas del índice de vectores para revisar el rendimiento de tu índice de vectores, identificar áreas de mejora y ajustar el índice según las métricas, si es necesario. La vista pg_stat_ann_indexes te ayuda a comprender el estado de la utilización del índice, mientras que la vista pg_stat_ann_index_creation proporciona información sobre las filas creadas en el momento de la creación del índice.
Para ver las métricas de utilización del índice, ejecuta el siguiente comando:
SELECT * FROM pg_stat_ann_indexes;
Verás un resultado similar al siguiente:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
indextype | scann
indexconfig | {num_leaves=100,quantizer=SQ8}
indexsize | 832 kB
indexscan | 0
insertcount | 250
deletecount | 0
updatecount | 0
partitioncount | 100
distribution | {"average": 3.54, "maximum": 37, "minimum": 0, "outliers": [37, 12, 11, 10, 10, 9, 9, 9, 9, 9]}
distributionpercentile |{"10": { "num_vectors": 0, "num_partitions": 0 }, "25": { "num_vectors": 0, "num_partitions": 30 }, "50": { "num_vectors": 3, "num_partitions": 30 }, "75": { "num_vectors": 5, "num_partitions": 19 }, "90": { "num_vectors": 7, "num_partitions": 11 }, "95": { "num_vectors": 9, "num_partitions": 5 }, "99": { "num_vectors": 12, "num_partitions": 4 }, "100": { "num_vectors": 37, "num_partitions": 1 }}
Para ver la cantidad de filas creadas en el momento de la creación del índice, ejecuta el siguiente comando:
SELECT * FROM pg_stat_ann_index_creation;
Verás un resultado similar al siguiente:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
index_rows_at_creation_time | 262144
Para obtener más información sobre la lista completa de métricas, consulta Métricas del índice de vectores.
¿Qué sigue?
- Mantén los índices de vectores.
- Obtén información sobre un ejemplo de flujo de trabajo de embedding.