Introducción a los índices vectoriales

Un índice de vectores es una estructura de datos diseñada para permitir que la función VECTOR_SEARCH y la función AI.SEARCH se ejecuten de manera más eficiente, en especial en conjuntos de datos grandes.

Casos de uso

Los índices de vectores mejoran la eficiencia de la búsqueda de vectores, que suele realizarse en embeddings de texto o multimodales de tus datos. Los índices vectoriales de BigQuery te ayudan a realizar las siguientes tareas de manera más eficiente:

  • Realiza una búsqueda semántica
  • Detectar imágenes, audios o videos similares o duplicados
  • Realizar agrupamiento en clústeres, segmentación o clasificación
  • Crea sistemas de recomendación
  • Encuentra las K imágenes o reseñas más similares a una entrada determinada

Para obtener más información, consulta la Introducción a la búsqueda vectorial.

Precios

La sentencia CREATE VECTOR INDEX usa los precios de procesamiento de BigQuery. No se aplican cargos por el procesamiento necesario para compilar y actualizar tus índices vectoriales siempre que el tamaño total de los datos de tablas indexadas esté por debajo del límite por organización. Para admitir la indexación más allá de este límite, debes proporcionar tu propia reserva para controlar los trabajos de administración de índices.

El almacenamiento también es un factor a tener en cuenta para los índices. La cantidad de bytes almacenados como índice está sujeta a costos de almacenamiento activo.

  • Los índices vectoriales generan costos de almacenamiento cuando están activos.
  • Puedes encontrar el tamaño del almacenamiento de índices en la vista INFORMATION_SCHEMA.VECTOR_INDEXES. Si el índice vectorial aún no tiene una cobertura del 100%, se te cobra por todo lo que se haya indexado. Puedes verificar la cobertura del índice con la vista INFORMATION_SCHEMA.VECTOR_INDEXES.

Cuotas y límites

Para obtener más información, consulta Límites de los índices vectoriales.

¿Qué sigue?