En esta página, se describe cómo ajustar tus índices para lograr un rendimiento de las consultas más rápido y una mejor recuperación en AlloyDB para PostgreSQL.
Antes de comenzar
Antes de compilar un índice de ScaNN, completa los siguientes pasos:
Crea una tabla con tus datos.
Para evitar problemas de memoria insuficiente cuando crees el índice de ScaNN, asegúrate de que las marcas de base de datos
maintenance_work_memyshared_buffersestén configuradas en un valor inferior a la memoria total de la máquina.Para usar índices de cuatro niveles, primero debes habilitar la función de versión preliminar para tu instancia de AlloyDB. Para habilitar la función de vista previa, elige uno de los siguientes dos métodos:
Habilita la marca de base de datos
scann.enable_preview_features.Para obtener más información sobre cómo configurar marcas de bases de datos, consulta Configura marcas de bases de datos.
Establece la marca de base de datos
scann.max_allowed_num_levelsa nivel de la sesión en3.SET scann.max_allowed_num_levels = 3;
Ajusta un índice de ScaNN
Para determinar la cantidad de niveles que necesitas para tu índice de ScaNN, consulta la siguiente tabla.
| Cantidad de filas vectoriales en tu tabla | Cantidad de niveles para tu índice de ScaNN |
|---|---|
| [0..10 millones] | Dos |
| [10 millones..100 millones] |
Elige una de las siguientes métricas para priorizar:
|
| [100 millones…1,000 millones] |
Elige una de las siguientes métricas para priorizar:
|
| [1,000 millones..10,000 millones] | Cuatro (en vista previa) |
Usa los siguientes índices de ScaNN como ejemplos para ajustar los parámetros de una tabla con 1 millón de filas.
Índice de árbol de dos niveles
SET LOCAL scann.num_leaves_to_search = 1; SET LOCAL scann.pre_reordering_num_neighbors=50; CREATE INDEX my_scann_index ON my_table USING scann (vector_column cosine) WITH (num_leaves = [power(1000000, 1/2)]);
Índice de árbol de tres niveles
SET LOCAL scann.num_leaves_to_search = 10; SET LOCAL scann.pre_reordering_num_neighbors=50; CREATE INDEX my_scann_index ON my_table USING scann (vector_column cosine) WITH (num_leaves = [power(1000000, 2/3)], max_num_levels = 2);
Índice de árbol de cuatro niveles
SET LOCAL scann.num_leaves_to_search = 100; SET LOCAL scann.pre_reordering_num_neighbors=50; CREATE INDEX my-scann-index ON my-table USING scann (vector_column cosine) WITH (num_leaves = [power(1000000, 3/4)], max_num_levels = 3);
Para obtener más información sobre los índices de ScaNN, consulta las siguientes páginas:
Cómo controlar las invalidaciones de DML debido a la aceleración con el motor de columnas
Si elegiste acelerar tus búsquedas de vectores con el motor de columnas, ten en cuenta que las invalidaciones de DML y DDL en las tablas base pueden afectar el rendimiento de las consultas vectoriales. En caso de una alta capacidad de procesamiento de DML, considera ajustar la marca de base de datos google_columnar_engine.refresh_threshold_percentage o actualizar manualmente el índice con el comando google_columnar_engine_refresh_index.
Analiza tus búsquedas
Usa el comando EXPLAIN ANALYZE para analizar tus estadísticas de consultas, como se muestra en el siguiente ejemplo de consulta en SQL.
EXPLAIN ANALYZE SELECT result-column
FROM my_table
ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
LIMIT 1;
La respuesta de ejemplo QUERY PLAN incluye información como el tiempo que tardó, la cantidad de filas analizadas o devueltas y los recursos utilizados.
Limit (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
-> Index Scan using my_scann_index on my_table (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms
Consulta las métricas del índice vectorial
Puedes usar las métricas del índice de vectores para revisar el rendimiento de tu índice de vectores, identificar áreas de mejora y ajustar tu índice según las métricas, si es necesario. La vista pg_stat_ann_indexes te ayuda a comprender el estado de la utilización del índice, mientras que la vista pg_stat_ann_index_creation proporciona información sobre las filas creadas en el momento de la creación del índice.
Para ver las métricas de utilización del índice, ejecuta el siguiente comando:
SELECT * FROM pg_stat_ann_indexes;
Verás un resultado similar al siguiente:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
indextype | scann
indexconfig | {num_leaves=100,max_num_levels=1,quantizer=SQ8}
indexsize | 832 kB
indexscan | 0
insertcount | 250
deletecount | 0
updatecount | 0
partitioncount | 100
distribution | {"average": 3.54, "maximum": 37, "minimum": 0, "outliers": [37, 12, 11, 10, 10, 9, 9, 9, 9, 9]}
distributionpercentile |{"10": { "num_vectors": 0, "num_partitions": 0 }, "25": { "num_vectors": 0, "num_partitions": 30 }, "50": { "num_vectors": 3, "num_partitions": 30 }, "75": { "num_vectors": 5, "num_partitions": 19 }, "90": { "num_vectors": 7, "num_partitions": 11 }, "95": { "num_vectors": 9, "num_partitions": 5 }, "99": { "num_vectors": 12, "num_partitions": 4 }, "100": { "num_vectors": 37, "num_partitions": 1 }}
Para ver la cantidad de filas creadas en el momento de la creación del índice, ejecuta el siguiente comando:
SELECT * FROM pg_stat_ann_index_creation;
Verás un resultado similar al siguiente:
-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid | 271236
indexrelid | 271242
schemaname | public
relname | t1
indexrelname | t1_ix1
index_rows_at_creation_time | 262144
Para obtener más información sobre la lista completa de métricas, consulta Métricas del índice de vectores.
¿Qué sigue?
- Mantén los índices de vectores.
- Obtén información sobre un ejemplo de flujo de trabajo de embedding.