Opções de banco de dados vetorial no mecanismo RAG da plataforma de agentes do Gemini Enterprise

Esta página apresenta os bancos de dados de vetores com suporte no mecanismo RAG da plataforma do agente do Gemini Enterprise. Você também pode conferir como conectar um banco de dados de vetores (armazenamento de vetores) ao seu corpus RAG.

Os bancos de dados de vetores desempenham um papel crucial na ativação da recuperação para aplicativos RAG. Bancos de dados vetoriais oferecem uma maneira especializada de armazenar e consultar embeddings de vetores, que são representações matemáticas de texto ou outros dados que capturam o significado semântico e os relacionamentos. Os embeddings de vetores permitem que os sistemas RAG encontrem de forma rápida e precisa as informações mais relevantes em uma vasta base de conhecimento, mesmo ao lidar com consultas complexas ou sutis. Quando combinados com um modelo de embedding, os bancos de dados de vetores podem ajudar a superar as limitações dos LLMs e fornecer respostas mais precisas, relevantes e abrangentes.

Bancos de dados de vetores com suporte

Ao criar um corpus RAG, o mecanismo RAG da plataforma do agente do Gemini Enterprise oferece o RagManagedDb pronto para empresas como o banco de dados de vetores padrão, que não exige provisionamento ou gerenciamento adicional. O RagManagedDb oferece opções de pesquisa KNN e ANN e permite a mudança para um nível básico para alguns protótipos e experimentos rápidos. Para saber mais sobre como escolher uma estratégia de recuperação no RagManagedDb ou para atualizar o nível, consulte Usar RagManagedDb com RAG. Para que o mecanismo RAG da plataforma do agente do Gemini Enterprise crie e gerencie automaticamente o banco de dados de vetores, consulte Recurso REST: projects.locations.ragCorpora .

Além do RagManagedDb padrão, o mecanismo RAG da plataforma do agente do Gemini Enterprise permite provisionar e usar o banco de dados de vetores no corpus RAG. Nesse caso, você é responsável pelo ciclo de vida e pela escalonabilidade do banco de dados de vetores.

Comparar opções de banco de dados de vetores

Esta tabela lista as opções de bancos de dados de vetores com suporte no mecanismo RAG da plataforma do agente do Gemini Enterprise e fornece links para páginas que explicam como usar os bancos de dados de vetores no corpus RAG.

Banco de dados de vetores Benefícios Ideal para Desvantagens Métricas de distância com suporte Tipo de pesquisa Etapa do lançamento
RagManagedDb (padrão) é um serviço de banco de dados escalonável distribuído regionalmente que oferece consistência e alta disponibilidade e pode ser usado para uma pesquisa vetorial. fácil simples rápido
  • Nenhuma configuração necessária.
  • Bom para casos de uso em pequena e grande escala.
  • Consistência muito alta.
  • Alta disponibilidade.
  • Baixa latência.
  • Excelente para cargas de trabalho transacionais.
  • CMEK ativada.
  • Gerar documentos de alto volume.
  • Criar RAG em escala empresarial.
  • Desenvolver uma prova de conceito rápida.
  • Fornecer baixa sobrecarga de provisionamento e manutenção.
  • Usar com chatbots.
  • Criar aplicativos RAG.
  • Para uma recuperação ideal, o recurso ANN exige que o índice seja recriado após mudanças importantes nos dados.
cosine KNN (padrão) e ANN Disponibilidade geral
A pesquisa vetorial é o serviço de banco de dados de vetores na plataforma do agente otimizado para tarefas de machine learning.
  • Integra-se a outros Google Cloud serviços.
  • A escalonabilidade e a confiabilidade são compatíveis com a Google Cloud infraestrutura.
  • Usa preços de pagamento por uso.
  • Gerar documentos de alto volume.
  • Criar RAG em escala empresarial.
  • Gerenciar a infraestrutura do banco de dados de vetores.
  • Clientes atuais ou qualquer pessoa que queira usar vários serviços. Google Cloud Google Cloud
  • As atualizações não são refletidas imediatamente.
  • Dependência de um só fornecedor com Google Cloud.
  • Pode ser mais caro dependendo dos casos de uso.
cosine

dot-product
ANN Disponibilidade geral
O Vertex AI Feature Store é um serviço gerenciado para organizar, armazenar e disponibilizar recursos de machine learning.
  • Integra-se à plataforma do agente do Gemini Enterprise e a outros Google Cloud serviços.
  • A escalonabilidade e a confiabilidade são compatíveis com a Google Cloud infraestrutura.
  • Aproveita a infraestrutura do BigQuery.
  • Gerar documentos de alto volume.
  • Criar RAG em escala empresarial.
  • Gerenciar a infraestrutura do banco de dados de vetores.
  • Clientes atuais Google Cloud ou clientes que querem usar vários Google Cloud serviços.
  • As mudanças só ficam disponíveis na loja on-line depois que uma sincronização manual é realizada.
  • Dependência de um só fornecedor com Google Cloud.
cosine

dot-product

L2 squared
ANN Visualizar
Weaviate é um banco de dados de vetores de código aberto flexível e modular.
  • Oferece suporte a vários tipos de dados e recursos de gráficos integrados.
  • Fornece código aberto e uma comunidade vibrante.
  • Altamente flexível e personalizável.
  • Oferece suporte a diversos tipos de dados e módulos para diferentes modalidades, como texto e imagens.
  • É possível escolher entre provedores de nuvem, como Google CloudAWS e Azure.
  • Gerar documentos de alto volume.
  • Criar RAG em escala empresarial.
  • Gerenciar a infraestrutura do banco de dados de vetores.
  • Clientes atuais do Weaviate.
  • As atualizações não são refletidas imediatamente.
  • Pode ser mais complexo de configurar e gerenciar.
  • A performance pode variar dependendo da configuração.
cosine

dot-product

L2 squared

hamming

manhattan
Suporte a pesquisa híbrida e ANN Visualizar
Pinecone é um banco de dados de vetores nativo da nuvem totalmente gerenciado, projetado para uma pesquisa de similaridade de alta performance.
  • Comece rapidamente.
  • Excelente escalonabilidade e performance.
  • Foco na pesquisa vetorial com recursos avançados, como filtragem e pesquisa de metadados.
  • É possível escolher entre provedores de nuvem, como Google CloudAWS e Azure.
  • Gerar documentos de alto volume.
  • Criar RAG em escala empresarial.
  • Gerenciar a infraestrutura do banco de dados de vetores.
  • Clientes atuais do Pinecone.
  • As atualizações não são refletidas imediatamente.
  • Pode ser mais caro que outras opções.
  • Cotas e limites restringem a escala e a performance.
  • Controle limitado sobre a infraestrutura subjacente.
cosine

euclidean

dot-product
ANN Disponibilidade geral

A seguir