Descripción general de la búsqueda de vectores de Spanner

En esta página, se describe la búsqueda de vectores y cómo funciona en Spanner.

La búsqueda de vectores es una capacidad integrada de alto rendimiento que permite la búsqueda semántica y la coincidencia de similitud en datos vectoriales de alta dimensión. Al almacenar y, también, indexar embeddings de vectores directamente en tu base de datos transaccional, Spanner elimina la necesidad de bases de datos vectoriales separadas y canalizaciones de ETL complejas.

Conceptos clave

En esta sección, se presentan los siguientes conceptos clave de la búsqueda de vectores:

  • Embeddings de vector
  • Métodos de búsqueda (KNN y ANN)
  • Funciones de distancia

Embeddings de vector

Los embeddings de vectores son representaciones numéricas de alta dimensión de datos no estructurados. Se generan a partir de los datos no estructurados con modelos de aprendizaje automático. Por ejemplo, puedes usar la API de incorporaciones de texto de Agent Platform de Gemini Enterprise para generar, almacenar y actualizar incorporaciones de texto para los datos almacenados en Spanner.

Métodos de búsqueda

Spanner admite dos métodos para encontrar vectores similares:

Funciones clave

  • Escalabilidad: Admite miles de millones de vectores para la búsqueda ANN sin particionar, o billones de vectores para cargas de trabajo KNN particionadas.

  • Base de datos y motor de IA unificados: Usa la función ML.PREDICTde GoogleSQL o de PostgreSQL spanner.ML_PREDICT_ROW para generar embeddings a partir de modelos de Agent Platform directamente en tu flujo de consultas.

  • Filtrado intercalado: Combina de manera eficiente la búsqueda de vectores con filtros de metadatos estructurados (por ejemplo, "Buscar imágenes similares en las que la categoría sea 'zapatos' y el precio sea inferior a 100") sin perder rendimiento.

  • Integración de LangChain: La compatibilidad integrada con LangChain te permite compilar aplicaciones de generación mejorada por recuperación (RAG) con Spanner como el almacén de vectores.

Capacidades de búsqueda híbrida

La búsqueda de vectores es más potente cuando se combina con las otras funciones de datos de Spanner:

Combinación Beneficio
Búsqueda de vectores con filtrado de SQL Combina de manera eficiente la búsqueda de vectores con filtros (por ejemplo, "Buscar imágenes similares en las que la categoría sea 'zapatos' y el precio sea inferior a 100").
Búsqueda de vectores + búsqueda de texto completo Combina la similitud semántica con la precisión de las palabras clave mediante la fusión de clasificación recíproca (RRF) para obtener una relevancia de búsqueda superior.
Vector + gráfico Usa la búsqueda de vectores para encontrar puntos de entrada (nodos) relevantes en un gráfico de propiedades y, luego, atraviesa relaciones complejas.

¿Qué sigue?