Crear un índice de ScaNN

En esta página se describe cómo usar inserciones almacenadas para generar índices y consultar inserciones mediante el índice ScaNN con AlloyDB para PostgreSQL. Para obtener más información sobre cómo almacenar incrustaciones, consulta Almacenar incrustaciones de vectores.

AlloyDB alloydb_scann, una extensión de PostgreSQL desarrollada por Google que implementa un índice de vecinos más cercanos muy eficiente basado en el algoritmo ScaNN.

El índice ScaNN es un índice de cuantificación basado en árboles para la búsqueda aproximada de vecinos más cercanos. Ofrece un tiempo de creación de índices más corto y un menor uso de memoria en comparación con HNSW. Además, ofrece un QPS más rápido en comparación con HNSW en función de la carga de trabajo.

Antes de empezar

Antes de empezar a crear índices, debes completar los siguientes requisitos previos.

Los vectores de inserción se añaden a una tabla de tu base de datos de AlloyDB.
Se instalan la extensión vector, que se basa en pgvector y que Google ha ampliado para AlloyDB, y la extensión alloydb_scann:
```
CREATE EXTENSION IF NOT EXISTS alloydb_scann CASCADE;
```
Nota: Puedes usar la extensión alloydb_scann con bases de datos compatibles con PostgreSQL 14, 15, 16 y 17.
Si quieres crear índices de ScaNN optimizados automáticamente, asegúrate de que la marca scann.enable_preview_features esté habilitada. Si no quieres habilitar las funciones de vista previa o si se trata de instancias de producción, puedes crear un índice de ScaNN con parámetros específicos.

Nota: No recomendamos habilitar las funciones de vista previa en las instancias de producción.

Crear un índice de ScaNN ajustado automáticamente

Con la función de indexación automática, puede simplificar la creación de índices para crear automáticamente índices optimizados para el rendimiento de la búsqueda o para equilibrar los tiempos de compilación de los índices y el rendimiento de la búsqueda.

Cuando usas el modo AUTO, solo tienes que especificar el nombre de la tabla y la columna de inserción, así como la función de distancia que quieras usar. Puedes optimizar el índice para mejorar el rendimiento de la búsqueda o encontrar un equilibrio entre los tiempos de compilación del índice y el rendimiento de la búsqueda.

También puedes usar el modo MANUAL para crear índices con un control granular sobre otros parámetros de ajuste de índices.

Crear un índice ScaNN en modo AUTO

A continuación, se indican algunos aspectos que debes tener en cuenta antes de crear índices en el modo AUTO:

AlloyDB no puede crear un índice ScaNN para tablas con datos insuficientes.
No puedes definir parámetros de creación de índices, como num_leaves, cuando creas índices en el modo AUTO.
La función de mantenimiento automático está habilitada de forma predeterminada en todos los índices creados en el modo AUTO.

Para crear un índice en el modo AUTO, habilita la marca de función scann.enable_zero_knob_index_creation. De esta forma, se habilita el mantenimiento automático. Después de habilitar la marca, ejecuta el siguiente comando:

  CREATE INDEX INDEX_NAME ON TABLE
  USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (mode='AUTO');

Haz los cambios siguientes:

INDEX_NAME: el nombre del índice que quieras crear. Por ejemplo, my-scann-index. Los nombres de los índices se comparten en toda la base de datos. Verifique que el nombre de cada índice sea único para cada tabla de su base de datos.
TABLE: la tabla a la que se va a añadir el índice.
EMBEDDING_COLUMN: columna que almacena datos de vector.
DISTANCE_FUNCTION: la función de distancia que se va a usar con este índice. Elige una de estas opciones:
- Distancia L2: l2
- Producto escalar: dot_product
- Distancia del coseno: cosine
OPTIMIZATION (Opcional): De forma predeterminada, se crea un índice optimizado para la búsqueda. Se debe configurar como uno de los siguientes valores:
- SEARCH_OPTIMIZED (Predeterminado): optimiza tanto el recuerdo de la búsqueda vectorial como la latencia de la búsqueda vectorial, pero el tiempo de compilación del índice es mayor.
- BALANCED: para crear un índice que equilibre el tiempo de creación del índice y el rendimiento de la búsqueda.

Crear un índice `ScaNN` en el modo MANUAL

Si has habilitado la marca scann.enable_preview_features y quieres tener un control granular sobre los parámetros de ajuste, puedes crear el índice en modo MANUAL.

Para crear un índice ScaNN en modo MANUAL, ejecuta el siguiente comando:

  CREATE INDEX INDEX_NAME ON TABLE
  USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (mode='MANUAL', num_leaves=NUM_LEAVES_VALUE, quantizer =QUANTIZER, max_num_levels=MAX_NUM_LEVELS);

Haz los cambios siguientes:

INDEX_NAME: el nombre del índice que quieras crear (por ejemplo, my-scann-index). Los nombres de los índices se comparten en toda la base de datos. Verifique que el nombre de cada índice sea único para cada tabla de su base de datos.
TABLE: la tabla a la que se va a añadir el índice.
EMBEDDING_COLUMN: columna que almacena datos de vector.
DISTANCE_FUNCTION: la función de distancia que se va a usar con este índice. Elige una de estas opciones:
- Distancia L2: l2
- Producto escalar: dot_product
- Distancia del coseno: cosine
NUM_LEAVES_VALUE: número de particiones que se aplicarán a este índice. Puede ser cualquier valor entre 1 y 10 millones. Para obtener más información sobre cómo elegir este valor, consulta Ajustar un índice ScaNN.
QUANTIZER: el tipo de cuantificador que se va a usar. Ten en cuenta que el índice ScaNN se puede cargar en el motor de columnas para acelerar aún más la búsqueda de vectores. Estas son las opciones disponibles:
- SQ8: ofrece un equilibrio entre el rendimiento de las consultas y la pérdida mínima de recuerdo, que suele ser inferior al 1-2%. Este es el valor predeterminado.
- AH: AH se comprime hasta 4 veces en comparación con SQ8. Ten en cuenta esta opción para mejorar el rendimiento de las consultas cuando el motor columnar esté habilitado y los datos de tu índice y tabla se hayan introducido en el motor columnar, en función del tamaño configurado. Para obtener más información, consulta Prácticas recomendadas para optimizar ScaNN.
- FLAT: ofrece el mayor recuerdo, del 99% o más, a costa del rendimiento de la búsqueda.
MAX_NUM_LEVELS: número máximo de niveles del árbol de clústeres de k-means. El valor predeterminado es 1, que corresponde a la cuantización basada en un árbol de dos niveles, y 2, que corresponde a la cuantización basada en un árbol de tres niveles.

Puede añadir otros parámetros de creación de índices o de tiempo de ejecución de consultas para optimizar su índice. Para obtener más información, consulta Ajustar un índice de ScaNN.

Crear un índice `ScaNN` con parámetros específicos

Si tu aplicación tiene requisitos específicos para los tiempos de recuperación y de compilación de índices, puedes crear el índice manualmente. Puedes crear un índice de árbol de dos o tres niveles en función de tu carga de trabajo. Para obtener más información sobre cómo ajustar los parámetros, consulta Ajustar un índice ScaNN.

Índice de árbol de dos niveles

Para aplicar un índice de árbol de dos niveles con el algoritmo ScaNN a una columna que contenga inserciones de vectores almacenadas, ejecuta la siguiente consulta DDL:

CREATE INDEX INDEX_NAME ON TABLE
USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
WITH (num_leaves=NUM_LEAVES_VALUE, quantizer =QUANTIZER);

Haz los cambios siguientes:

INDEX_NAME: el nombre del índice que quieras crear (por ejemplo, my-scann-index). Los nombres de los índices se comparten en toda la base de datos. Asegúrate de que cada nombre de índice sea único para cada tabla de tu base de datos.
TABLE: la tabla a la que se va a añadir el índice.
EMBEDDING_COLUMN: columna que almacena vector datos.
DISTANCE_FUNCTION: la función de distancia que se va a usar con este índice. Elige una de estas opciones:
- Distancia L2: l2
- Producto escalar: dot_product
- Distancia del coseno: cosine
NUM_LEAVES_VALUE: el número de particiones que se aplicarán a este índice. Puede ser cualquier valor entre 1 y 10 millones. Para obtener más información sobre cómo elegir este valor, consulte el artículo Ajustar un índice ScaNN.
QUANTIZER: el tipo de cuantificador que se va a usar. Ten en cuenta que el índice ScaNN se puede cargar en el motor de columnas para acelerar aún más la búsqueda de vectores. Estas son las opciones disponibles:
- SQ8: ofrece un equilibrio entre el rendimiento de las consultas y la pérdida mínima de recuerdo, que suele ser inferior al 1-2%. Este es el valor predeterminado.
- AH: AH se comprime hasta 4 veces en comparación con SQ8. Ten en cuenta esta opción para mejorar el rendimiento de las consultas cuando el motor columnar esté habilitado y los datos de tu índice y tabla se hayan introducido en el motor columnar, en función del tamaño configurado. Para obtener más información, consulta Prácticas recomendadas para optimizar ScaNN.
- FLAT: ofrece el mayor recuerdo, del 99% o más, a costa del rendimiento de la búsqueda.

Índice de árbol de tres niveles

Para crear un índice de árbol de tres niveles con el algoritmo ScaNN en una columna que contenga las inserciones de vectores almacenadas, ejecuta la siguiente consulta DDL:

CREATE INDEX INDEX_NAME ON TABLE
  USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (num_leaves=NUM_LEAVES_VALUE, max_num_levels = 2);

Una vez que hayas creado el índice, podrás ejecutar consultas de búsqueda de vecinos más cercanos que utilicen el índice siguiendo las instrucciones de Hacer una consulta de vecinos más cercanos con un texto determinado.

Los parámetros de índice deben configurarse para lograr un equilibrio adecuado entre las consultas por segundo y la recuperación. Para obtener más información sobre cómo optimizar el índice ScaNN, consulta Optimizar un índice ScaNN.

Para crear este índice en una columna de inserciones que use el tipo de datos real[] en lugar de vector, convierte la columna al tipo de datos vector:

CREATE INDEX INDEX_NAME ON TABLE
USING scann (CAST(EMBEDDING_COLUMN AS vector(DIMENSIONS)) DISTANCE_FUNCTION)
WITH (num_leaves=NUM_LEAVES_VALUE, max_num_levels = MAX_NUM_LEVELS);

Sustituye DIMENSIONS por el ancho dimensional de la columna de inserción. Para obtener más información sobre cómo encontrar las dimensiones, consulta la función vector_dims en Funciones de vector.

Para ofrecer una experiencia de búsqueda coherente, habilita el mantenimiento automático al crear un índice de ScaNN. Para obtener más información, consulta Mantener índices vectoriales. Esta función está disponible en versión preliminar.

Para ver el progreso de la indexación, usa la vista pg_stat_progress_create_index:

SELECT * FROM pg_stat_progress_create_index;

En la columna phase se muestra el estado actual de la creación del índice. Una vez completada la fase de creación del índice, la fila del índice no se muestra.

Para ajustar el índice para obtener un equilibrio entre la media de la recuperación y las consultas por segundo, consulta Ajustar un índice ScaNN.

Forzar la creación de índices en tablas vacías o pequeñas

AlloyDB incluye validaciones para evitar la creación de un índice ScaNN en una tabla vacía o con muy pocas filas, ya que esto podría provocar un rendimiento poco óptimo. Sin embargo, en algunos casos de desarrollo o pruebas, es posible que tengas que crear un índice en una tabla vacía o pequeña. En estos casos, puedes forzar la creación de índices.

Para forzar la generación del índice, sigue estos pasos:

Asigna el valor true al parámetro scann.allow_blocked_operations creation a nivel de sesión en la base de datos:
```
SET scann.allow_blocked_operations = true;
```
Asigna el privilegio SUPERUSER al usuario que ejecuta estas consultas en la base de datos:
```
CREATE USER USER_NAME WITH SUPERUSER PASSWORD PASSWORD;
```
Haz los cambios siguientes:
- USER_NAME: el nombre del usuario al que quieres conceder el privilegio.
- PASSWORD: la contraseña del usuario.

Crear índices en paralelo

Para crear el índice más rápido, AlloyDB puede generar automáticamente varios procesos paralelos, en función de tu conjunto de datos y del tipo de índice que elijas.

La creación de índices paralela se suele activar si creas un índice ScaNN de tres niveles o si tu conjunto de datos supera los 100 millones de filas.

Aunque AlloyDB optimiza automáticamente el número de trabajadores paralelos, puedes ajustar los trabajadores paralelos mediante los parámetros de planificación de consultas de PostgreSQL max_parallel_maintenance_workers, max_parallel_workers y min_parallel_table_scan_size.

Ejecutar una consulta

Una vez que hayas almacenado e indexado las inserciones en tu base de datos, podrás empezar a consultar tus datos. No puedes ejecutar consultas de búsqueda masivas con la extensión alloydb_scann.

Para encontrar los vecinos semánticos más cercanos de un vector de inserción, puedes ejecutar la siguiente consulta de ejemplo, en la que se define la misma función de distancia que se usó durante la creación del índice.

  SELECT * FROM TABLE
  ORDER BY EMBEDDING_COLUMN DISTANCE_FUNCTION_QUERY 'EMBEDDING'
  LIMIT ROW_COUNT

Haz los cambios siguientes:

TABLE: la tabla que contiene la inserción con la que se va a comparar el texto.
INDEX_NAME: el nombre del índice que quieras usar. Por ejemplo, my-scann-index.
EMBEDDING_COLUMN: la columna que contiene las inserciones almacenadas.
DISTANCE_FUNCTION_QUERY: la función de distancia que se va a usar con esta consulta. Elige una de las siguientes opciones en función de la función de distancia utilizada al crear el índice:
- Distancia L2: <->
- Producto interior: <#>
- Distancia del coseno: <=>
EMBEDDING: el vector de inserción del que quieres encontrar los vecinos semánticos almacenados más cercanos.
ROW_COUNT: número de filas que se van a devolver.

Especifica 1 si solo quieres la mejor coincidencia.

También puedes usar la función embedding() para traducir el texto a un vector. Como embedding() devuelve una matriz real, debes convertir explícitamente la llamada embedding() a vector antes de aplicarla a uno de los operadores de vecino más cercano (por ejemplo, <-> para la distancia L2). Estos operadores pueden usar el índice de ScaNN para encontrar las filas de la base de datos con las inserciones semánticamente más similares.

Crear un índice de ScaNN Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Antes de empezar

Crear un índice de ScaNN ajustado automáticamente

Crear un índice ScaNN en modo AUTO

Crear un índice ScaNN en el modo MANUAL

Crear un índice ScaNN con parámetros específicos

Índice de árbol de dos niveles

Índice de árbol de tres niveles

Forzar la creación de índices en tablas vacías o pequeñas

Crear índices en paralelo

Ejecutar una consulta

Siguientes pasos

Crear un índice de ScaNN

Crear un índice `ScaNN` en el modo MANUAL

Crear un índice `ScaNN` con parámetros específicos