Introdução aos índices vetoriais
Um índice vetorial é uma estrutura de dados projetada para permitir que a função VECTOR_SEARCH e a função AI.SEARCH sejam executadas com mais eficiência, principalmente em grandes conjuntos de dados.
Casos de uso
Os índices vetoriais melhoram a eficiência da pesquisa vetorial, que normalmente é realizada em embeddings de texto ou multimodais dos seus dados. Os índices vetoriais do BigQuery ajudam você a realizar as seguintes tarefas com mais eficiência:
- Realizar a pesquisa semântica
- Detectar imagens, áudios ou vídeos semelhantes ou duplicados
- Realizar clustering, segmentação ou classificação
- Criar sistemas de recomendação
- Encontrar as K imagens ou avaliações mais semelhantes a uma determinada entrada
Para mais informações, consulte a Introdução à pesquisa de vetor.
Preços
A instrução CREATE VECTOR INDEX usa os preços de computação do BigQuery.
Não há cobrança pelo processamento
necessário para criar e atualizar seus índices vetoriais, desde que o tamanho
total dos dados da tabela indexada esteja abaixo do limite
por organização. Para
permitir a indexação além desse limite, é preciso
fornecer sua própria reserva
para processar os jobs de gerenciamento de índice.
O armazenamento também é uma consideração para os índices. A quantidade de bytes armazenada como um índice está sujeita a custos de armazenamento ativo.
- Os índices vetoriais geram custos de armazenamento quando estão ativos.
- É possível encontrar o tamanho de armazenamento do índice usando a
visualização
INFORMATION_SCHEMA.VECTOR_INDEXES. Se o índice vetorial ainda não tiver 100% de cobertura, você ainda vai receber cobranças pelo que foi indexado. Use a visualizaçãoINFORMATION_SCHEMA.VECTOR_INDEXESpara verificar a cobertura do índice.
Cotas e limites
Para mais informações, consulte Limites de índice vetorial.
A seguir
- Saiba mais sobre como criar e gerenciar índices vetoriais.
- Saiba mais sobre embeddings e pesquisa vetorial.