- Simplificando a declaração de intenção: os requisitos (como tabela, coluna de texto ou recall de destino) são declarados usando funções SQL.
- Automatizando as práticas recomendadas: gera comandos SQL otimizados, também conhecidos como recomendações, para configurar a carga de trabalho vetorial usando a especificação de vetor definida e um algoritmo de ajuste automático otimizado que calcula a configuração ideal do índice.
- Oferecendo transparência e controle: fornece explicações claras para cada recomendação ao automatizar tarefas que permitem revisar, modificar e aplicar recomendações no seu ritmo.
- Permitindo a prototipagem rápida: permite implantar rapidamente uma configuração de pesquisa vetorial bem ajustada, reduzindo o tempo do conceito à produção.
- Concentrando-se na facilidade de uso: simplifica a complexidade da pesquisa semântica, diminuindo a distância entre os requisitos de negócios e de engenharia.
Com o Vector Assist, é possível criar aplicativos completos com recursos de pesquisa semântica e uma configuração simplificada.
Como o Vector Assist funciona
O Vector Assist exige que você defina as especificações do vetor. O framework usa essas especificações, também conhecidas como especificação de vetor, para gerar as etapas necessárias para criar um índice vetorial. O Vector Assist gera as etapas necessárias para implantar a carga de trabalho vetorial como recomendações. Sempre que você modifica a especificação do vetor, o Vector Assist regenera as recomendações.
Depois de gerar o índice vetorial usando essas etapas recomendadas, você pode usar o Vector Assist para gerar consultas de pesquisa otimizadas.
Especificação do Vector Assist
A primeira etapa para usar o Vector Assist é configurar a especificação do índice vetorial, ou especificação de vetor. Uma especificação de vetor é um objeto em que você define a intenção e os requisitos da carga de trabalho vetorial. Ela inclui todas as informações necessárias, incluindo o seguinte:
- Tabelas e colunas relevantes (texto ou vetor)
- Preferências do modelo de embedding (se estiver usando a geração de embedding)
- Tipo de índice preferido:
HNSWouIVFFlat.ScaNNnão é compatível. - Recall de destino para consultas de pesquisa
- Limitações de memória
Você define a especificação de vetor usando a
vector_assist.define_spec
função e pode modificá-la a qualquer momento. O sistema atribui um ID exclusivo a cada especificação e a armazena em uma tabela chamada vector_assist.VECTOR_SPECS.
O Vector Assist infere as entradas de especificação e um algoritmo de ajuste automático otimizado que calcula a configuração ideal do índice. Embora o Vector Assist use esses valores para simplificar o processo de desenvolvimento, ainda é possível personalizá-los de acordo com suas preferências.
Recomendações do Vector Assist
Depois de definir a especificação de vetor, o Vector Assist processa a entrada e gera recomendações. Essas recomendações são uma lista ordenada de etapas úteis, normalmente comandos SQL, que você precisa executar para implantar a carga de trabalho vetorial de acordo com as especificações. Cada recomendação inclui o seguinte:
- A consulta SQL a ser executada.
- Uma explicação detalhada do que a consulta faz e por que ela é recomendada.
- Informações sobre possíveis compensações ou custos, como o tamanho estimado do índice ou o tempo de build.
O Vector Assist armazena recomendações em uma tabela chamada vector_assist.RECOMMENDATIONS, e você pode revisar, modificar e aplicar as recomendações individualmente ou como um todo.
Sempre que você modifica a especificação de vetor da carga de trabalho, o Vector Assist regenera as recomendações para obedecer às especificações atualizadas.
Limitações
Ao usar o Vector Assist com as instâncias do AlloyDB Omni, considere as seguintes limitações:
- O Vector Assist só oferece suporte às versões 17 e mais recentes do PostgreSQL.
- Embora o Vector Assist ofereça suporte a todas as versões do
pgvector, recomendamos usar a versão mais recente para otimizar a performance e o suporte a recursos. Para mais informações, consulte opgvectorregistro de alterações. - Se a instância usar a extensão
google_ml_integrationpara gerar embeddings, as restrições dela também serão aplicadas quando você usar o Vector Assist. Para mais informações, consulte Visão geral do registro e da chamada de modelos de IA remotos no AlloyDB Omni. - O Vector Assist só oferece suporte aos tipos de índice
HNSWeIVFFlat. Os tipos de índiceScaNNnão são compatíveis. - O Vector Assist só oferece suporte a modelos de embedding de texto para gerar embeddings automaticamente e usa o
text_column_namecomo parâmetro de entrada. Se a carga de trabalho vetorial exigir um modelo de embedding multimodal, use a extensãogoogle_ml_integrationou outra extensão para gerar esses embeddings manualmente antes de usar o Vector Assist para ativar a pesquisa semântica neles.