Introdução aos índices vetoriais

Um índice vetorial é uma estrutura de dados projetada para permitir que a função VECTOR_SEARCH e a função AI.SEARCH sejam executadas com mais eficiência, principalmente em grandes conjuntos de dados.

Casos de uso

Os índices vetoriais melhoram a eficiência da pesquisa vetorial, que normalmente é realizada em embeddings de texto ou multimodais dos seus dados. Os índices vetoriais do BigQuery ajudam você a realizar as seguintes tarefas com mais eficiência:

  • Realizar a pesquisa semântica
  • Detectar imagens, áudios ou vídeos semelhantes ou duplicados
  • Realizar clustering, segmentação ou classificação
  • Criar sistemas de recomendação
  • Encontrar as K imagens ou avaliações mais semelhantes a uma determinada entrada

Para mais informações, consulte a Introdução à pesquisa de vetor.

Preços

A instrução CREATE VECTOR INDEX usa os preços de computação do BigQuery. Não há cobrança pelo processamento necessário para criar e atualizar seus índices vetoriais, desde que o tamanho total dos dados da tabela indexada esteja abaixo do limite por organização. Para permitir a indexação além desse limite, é preciso fornecer sua própria reserva para processar os jobs de gerenciamento de índice.

O armazenamento também é uma consideração para os índices. A quantidade de bytes armazenada como um índice está sujeita a custos de armazenamento ativo.

  • Os índices vetoriais geram custos de armazenamento quando estão ativos.
  • É possível encontrar o tamanho de armazenamento do índice usando a visualização INFORMATION_SCHEMA.VECTOR_INDEXES. Se o índice vetorial ainda não tiver 100% de cobertura, você ainda vai receber cobranças pelo que foi indexado. Use a visualização INFORMATION_SCHEMA.VECTOR_INDEXES para verificar a cobertura do índice.

Cotas e limites

Para mais informações, consulte Limites de índice vetorial.

A seguir