Visão geral da assistência de vetor

Selecione uma versão da documentação:

O Vector Assist é uma extensão do AlloyDB Omni que simplifica a implantação e o gerenciamento das cargas de trabalho vetoriais. Ele oferece um framework SQL declarativo que ajuda a configurar recursos de pesquisa vetorial prontos para produção, como geração de embeddings, otimização de consultas e criação de índices. Esse framework reduz a complexidade das cargas de trabalho vetoriais das seguintes maneiras:

  • Simplificando a declaração de intenção: os requisitos (como tabela, coluna de texto ou recall de destino) são declarados usando funções SQL.
  • Automatizando as práticas recomendadas: gera comandos SQL otimizados, também conhecidos como recomendações, para configurar a carga de trabalho vetorial usando a especificação de vetor definida e um algoritmo de ajuste automático otimizado que calcula a configuração ideal do índice.
  • Oferecendo transparência e controle: fornece explicações claras para cada recomendação ao automatizar tarefas que permitem revisar, modificar e aplicar recomendações no seu ritmo.
  • Permitindo a prototipagem rápida: permite implantar rapidamente uma configuração de pesquisa vetorial bem ajustada, reduzindo o tempo do conceito à produção.
  • Concentrando-se na facilidade de uso: simplifica a complexidade da pesquisa semântica, diminuindo a distância entre os requisitos de negócios e de engenharia.

Com o Vector Assist, é possível criar aplicativos completos com recursos de pesquisa semântica e uma configuração simplificada.

Como o Vector Assist funciona

O Vector Assist exige que você defina as especificações do vetor. O framework usa essas especificações, também conhecidas como especificação de vetor, para gerar as etapas necessárias para criar um índice vetorial. O Vector Assist gera as etapas necessárias para implantar a carga de trabalho vetorial como recomendações. Sempre que você modifica a especificação do vetor, o Vector Assist regenera as recomendações.

Depois de gerar o índice vetorial usando essas etapas recomendadas, você pode usar o Vector Assist para gerar consultas de pesquisa otimizadas.

Especificação do Vector Assist

A primeira etapa para usar o Vector Assist é configurar a especificação do índice vetorial, ou especificação de vetor. Uma especificação de vetor é um objeto em que você define a intenção e os requisitos da carga de trabalho vetorial. Ela inclui todas as informações necessárias, incluindo o seguinte:

  • Tabelas e colunas relevantes (texto ou vetor)
  • Preferências do modelo de embedding (se estiver usando a geração de embedding)
  • Tipo de índice preferido: HNSW ou IVFFlat. ScaNN não é compatível.
  • Recall de destino para consultas de pesquisa
  • Limitações de memória

Você define a especificação de vetor usando a vector_assist.define_spec função e pode modificá-la a qualquer momento. O sistema atribui um ID exclusivo a cada especificação e a armazena em uma tabela chamada vector_assist.VECTOR_SPECS.

O Vector Assist infere as entradas de especificação e um algoritmo de ajuste automático otimizado que calcula a configuração ideal do índice. Embora o Vector Assist use esses valores para simplificar o processo de desenvolvimento, ainda é possível personalizá-los de acordo com suas preferências.

Recomendações do Vector Assist

Depois de definir a especificação de vetor, o Vector Assist processa a entrada e gera recomendações. Essas recomendações são uma lista ordenada de etapas úteis, normalmente comandos SQL, que você precisa executar para implantar a carga de trabalho vetorial de acordo com as especificações. Cada recomendação inclui o seguinte:

  • A consulta SQL a ser executada.
  • Uma explicação detalhada do que a consulta faz e por que ela é recomendada.
  • Informações sobre possíveis compensações ou custos, como o tamanho estimado do índice ou o tempo de build.

O Vector Assist armazena recomendações em uma tabela chamada vector_assist.RECOMMENDATIONS, e você pode revisar, modificar e aplicar as recomendações individualmente ou como um todo.

Sempre que você modifica a especificação de vetor da carga de trabalho, o Vector Assist regenera as recomendações para obedecer às especificações atualizadas.

Limitações

Ao usar o Vector Assist com as instâncias do AlloyDB Omni, considere as seguintes limitações:

  • O Vector Assist só oferece suporte às versões 17 e mais recentes do PostgreSQL.
  • Embora o Vector Assist ofereça suporte a todas as versões do pgvector, recomendamos usar a versão mais recente para otimizar a performance e o suporte a recursos. Para mais informações, consulte o pgvector registro de alterações.
  • Se a instância usar a extensão google_ml_integration para gerar embeddings, as restrições dela também serão aplicadas quando você usar o Vector Assist. Para mais informações, consulte Visão geral do registro e da chamada de modelos de IA remotos no AlloyDB Omni.
  • O Vector Assist só oferece suporte aos tipos de índice HNSW e IVFFlat. Os tipos de índice ScaNN não são compatíveis.
  • O Vector Assist só oferece suporte a modelos de embedding de texto para gerar embeddings automaticamente e usa o text_column_name como parâmetro de entrada. Se a carga de trabalho vetorial exigir um modelo de embedding multimodal, use a extensão google_ml_integration ou outra extensão para gerar esses embeddings manualmente antes de usar o Vector Assist para ativar a pesquisa semântica neles.

A seguir