Ajusta el rendimiento de las consultas vectoriales en AlloyDB para PostgreSQL

En esta página, se describe cómo ajustar tus índices para lograr un rendimiento de las consultas más rápido y una mejor recuperación en AlloyDB para PostgreSQL.

Antes de comenzar

Antes de compilar un índice de ScaNN, completa los siguientes pasos:

  • Crea una tabla con tus datos.

  • Para evitar problemas de memoria insuficiente cuando crees el índice de ScaNN, asegúrate de que las marcas de base de datos maintenance_work_mem y shared_buffers estén configuradas en un valor inferior a la memoria total de la máquina.

  • Para usar índices de cuatro niveles, primero debes habilitar la función de versión preliminar para tu instancia de AlloyDB. Para habilitar la función de vista previa, elige uno de los siguientes dos métodos:

Ajusta un índice de ScaNN

Para determinar la cantidad de niveles que necesitas para tu índice de ScaNN, consulta la siguiente tabla.

Cantidad de filas vectoriales en tu tabla Cantidad de niveles para tu índice de ScaNN
[0..10 millones] Dos
[10 millones..100 millones]

Elige una de las siguientes métricas para priorizar:

  • Recuperación de la búsqueda: dos
  • Tiempo de compilación del índice: tres
[100 millones…1,000 millones]

Elige una de las siguientes métricas para priorizar:

  • Recuperación de la búsqueda: Tres
  • Tiempo de compilación de índices: Cuatro (en versión preliminar)
[1,000 millones..10,000 millones] Cuatro (en vista previa)

Usa los siguientes índices de ScaNN como ejemplos para ajustar los parámetros de una tabla con 1 millón de filas.

Índice de árbol de dos niveles

SET LOCAL scann.num_leaves_to_search = 1;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my_scann_index ON my_table
       USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 1/2)]);

Índice de árbol de tres niveles

SET LOCAL scann.num_leaves_to_search = 10;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my_scann_index ON my_table
       USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 2/3)], max_num_levels = 2);

Índice de árbol de cuatro niveles

SET LOCAL scann.num_leaves_to_search = 100;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my-scann-index ON my-table
       USING scann (vector_column cosine)
WITH (num_leaves = [power(1000000, 3/4)], max_num_levels = 3);

Para obtener más información sobre los índices de ScaNN, consulta las siguientes páginas:

Cómo controlar las invalidaciones de DML debido a la aceleración con el motor de columnas

Si elegiste acelerar tus búsquedas de vectores con el motor de columnas, ten en cuenta que las invalidaciones de DML y DDL en las tablas base pueden afectar el rendimiento de las consultas vectoriales. En caso de una alta capacidad de procesamiento de DML, considera ajustar la marca de base de datos google_columnar_engine.refresh_threshold_percentage o actualizar manualmente el índice con el comando google_columnar_engine_refresh_index.

Analiza tus búsquedas

Usa el comando EXPLAIN ANALYZE para analizar tus estadísticas de consultas, como se muestra en el siguiente ejemplo de consulta en SQL.

  EXPLAIN ANALYZE SELECT result-column
  FROM my_table
  ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
  LIMIT 1;

La respuesta de ejemplo QUERY PLAN incluye información como el tiempo que tardó, la cantidad de filas analizadas o devueltas y los recursos utilizados.

Limit  (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
  ->  Index Scan using my_scann_index on my_table  (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
        Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
        Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms

Consulta las métricas del índice vectorial

Puedes usar las métricas del índice de vectores para revisar el rendimiento de tu índice de vectores, identificar áreas de mejora y ajustar tu índice según las métricas, si es necesario. La vista pg_stat_ann_indexes te ayuda a comprender el estado de la utilización del índice, mientras que la vista pg_stat_ann_index_creation proporciona información sobre las filas creadas en el momento de la creación del índice.

Para ver las métricas de utilización del índice, ejecuta el siguiente comando:

SELECT * FROM pg_stat_ann_indexes;

Verás un resultado similar al siguiente:

-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid                  | 271236
indexrelid             | 271242
schemaname             | public
relname                | t1
indexrelname           | t1_ix1
indextype              | scann
indexconfig            | {num_leaves=100,max_num_levels=1,quantizer=SQ8}
indexsize              | 832 kB
indexscan              | 0
insertcount            | 250
deletecount            | 0
updatecount            | 0
partitioncount         | 100
distribution           | {"average": 3.54, "maximum": 37, "minimum": 0, "outliers": [37, 12, 11, 10, 10, 9, 9, 9, 9, 9]}
distributionpercentile |{"10": { "num_vectors": 0, "num_partitions": 0 }, "25": { "num_vectors": 0, "num_partitions": 30 }, "50": { "num_vectors": 3, "num_partitions": 30 }, "75": { "num_vectors": 5, "num_partitions": 19 }, "90": { "num_vectors": 7, "num_partitions": 11 }, "95": { "num_vectors": 9, "num_partitions": 5 }, "99": { "num_vectors": 12, "num_partitions": 4 }, "100": { "num_vectors": 37, "num_partitions": 1 }}

Para ver la cantidad de filas creadas en el momento de la creación del índice, ejecuta el siguiente comando:

SELECT * FROM pg_stat_ann_index_creation;

Verás un resultado similar al siguiente:

-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid                         | 271236
indexrelid                    | 271242
schemaname                    | public
relname                       | t1
indexrelname                  | t1_ix1
index_rows_at_creation_time   | 262144

Para obtener más información sobre la lista completa de métricas, consulta Métricas del índice de vectores.

¿Qué sigue?