Esta página apresenta os bancos de dados de vetores compatíveis com o mecanismo RAG. Você também pode conferir como conectar um banco de dados vetorial (repositório de vetores) ao seu corpus de RAG.
Os bancos de dados vetoriais desempenham um papel crucial na recuperação de aplicativos RAG. Eles oferecem uma maneira especializada de armazenar e consultar embeddings de vetor, que são representações matemáticas de texto ou outros dados que capturam significado e relações semânticas. Os embeddings de vetor permitem que os sistemas RAG encontrem rapidamente e com precisão as informações mais relevantes em uma vasta base de conhecimento, mesmo ao lidar com consultas complexas ou sutis. Quando combinados com um modelo de embedding, os bancos de dados vetoriais podem ajudar a superar as limitações dos LLMs e fornecer respostas mais precisas, relevantes e abrangentes.
Bancos de dados de vetores compatíveis
Ao criar um corpus de RAG, o mecanismo RAG oferece o RagManagedDb pronto para empresas como o banco de dados vetorial padrão, que não exige provisionamento ou gerenciamento adicional. O RagManagedDb oferece opções de pesquisa KNN e ANN e permite mudar para um nível básico para prototipagem e experimentação rápidas. Para saber mais sobre como escolher uma estratégia de recuperação no
RagManagedDb ou atualizar o nível, consulte Usar o RagManagedDb com
RAG. Para que o mecanismo de RAG crie e gerencie automaticamente o banco de dados vetorial para você, consulte Recurso REST: projects.locations.ragCorpora
.
Além do RagManagedDb padrão, o mecanismo RAG permite provisionar e usar seu banco de dados vetorial no corpus de RAG. Nesse caso, você é responsável pelo ciclo de vida e pela escalonabilidade do banco de dados vetorial.
Comparar opções de banco de dados de vetores
Esta tabela lista as opções de bancos de dados de vetores compatíveis com o mecanismo RAG e fornece links para páginas que explicam como usar os bancos de dados de vetores no seu corpus RAG.
| Banco de dados de vetores | Benefícios | Ideal para | Desvantagens | Métricas de distância aceitas | Tipo de pesquisa | Etapa do lançamento |
|---|---|---|---|---|---|---|
O RagManagedDb (padrão) é um serviço de banco de dados escalonável distribuído regionalmente que oferece consistência e alta disponibilidade e pode ser usado para uma pesquisa vetorial.
fácil simples rápido rápido |
|
|
|
cosine |
KNN (padrão) e ANN | Disponibilidade geral |
| A Pesquisa vetorial é o serviço de banco de dados de vetores na Agent Platform otimizado para tarefas de aprendizado de máquina. |
|
|
|
cosinedot-product |
ANN | Disponibilidade geral |
| O Vertex AI Feature Store é um serviço gerenciado para organizar, armazenar e disponibilizar atributos de machine learning. |
|
|
|
cosinedot-productL2 squared |
ANN | Visualizar |
| O Weaviate é um banco de dados vetorial de código aberto flexível e modular. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
Suporte para pesquisa híbrida e ANN | Visualizar |
| O Pinecone é um banco de dados de vetores nativo da nuvem totalmente gerenciado, projetado para uma pesquisa de similaridade de alto desempenho. |
|
|
|
cosineeuclideandot-product |
ANN | Disponibilidade geral |
A seguir
Para criar um corpus RAG, consulte Método: ragCorpora.create
Para listar o corpus RAG, consulte Método: ragCorpora.list