Esta página apresenta os bancos de dados de vetores com suporte no mecanismo RAG da plataforma do agente do Gemini Enterprise. Você também pode conferir como conectar um banco de dados de vetores (armazenamento de vetores) ao seu corpus RAG.
Os bancos de dados de vetores desempenham um papel crucial na ativação da recuperação para aplicativos RAG. Bancos de dados vetoriais oferecem uma maneira especializada de armazenar e consultar embeddings de vetores, que são representações matemáticas de texto ou outros dados que capturam o significado semântico e os relacionamentos. Os embeddings de vetores permitem que os sistemas RAG encontrem de forma rápida e precisa as informações mais relevantes em uma vasta base de conhecimento, mesmo ao lidar com consultas complexas ou sutis. Quando combinados com um modelo de embedding, os bancos de dados de vetores podem ajudar a superar as limitações dos LLMs e fornecer respostas mais precisas, relevantes e abrangentes.
Bancos de dados de vetores com suporte
Ao criar um corpus RAG, o mecanismo RAG da plataforma do agente do Gemini Enterprise oferece o RagManagedDb pronto para empresas como o banco de dados de vetores padrão, que não exige provisionamento ou gerenciamento adicional. O RagManagedDb oferece opções de pesquisa KNN e ANN e permite a mudança para um nível básico para alguns protótipos e experimentos rápidos. Para saber mais sobre como escolher uma estratégia de recuperação no
RagManagedDb ou para atualizar o nível, consulte Usar RagManagedDb com
RAG. Para que o mecanismo RAG da plataforma do agente do Gemini Enterprise
crie e gerencie automaticamente o banco de dados de vetores, consulte Recurso REST:
projects.locations.ragCorpora
.
Além do RagManagedDb padrão, o mecanismo RAG da plataforma do agente do Gemini Enterprise permite provisionar e usar o banco de dados de vetores no corpus RAG. Nesse caso, você é responsável pelo ciclo de vida e pela escalonabilidade do banco de dados de vetores.
Comparar opções de banco de dados de vetores
Esta tabela lista as opções de bancos de dados de vetores com suporte no mecanismo RAG da plataforma do agente do Gemini Enterprise e fornece links para páginas que explicam como usar os bancos de dados de vetores no corpus RAG.
| Banco de dados de vetores | Benefícios | Ideal para | Desvantagens | Métricas de distância com suporte | Tipo de pesquisa | Etapa do lançamento |
|---|---|---|---|---|---|---|
RagManagedDb (padrão) é um serviço de banco de dados escalonável distribuído regionalmente que oferece consistência e alta disponibilidade e pode ser usado para uma pesquisa vetorial.
fácil simples rápido |
|
|
|
cosine |
KNN (padrão) e ANN | Disponibilidade geral |
| A pesquisa vetorial é o serviço de banco de dados de vetores na plataforma do agente otimizado para tarefas de machine learning. |
|
|
|
cosinedot-product |
ANN | Disponibilidade geral |
| O Vertex AI Feature Store é um serviço gerenciado para organizar, armazenar e disponibilizar recursos de machine learning. |
|
|
|
cosinedot-productL2 squared |
ANN | Visualizar |
| Weaviate é um banco de dados de vetores de código aberto flexível e modular. |
|
|
|
cosinedot-productL2 squaredhammingmanhattan |
Suporte a pesquisa híbrida e ANN | Visualizar |
| Pinecone é um banco de dados de vetores nativo da nuvem totalmente gerenciado, projetado para uma pesquisa de similaridade de alta performance. |
|
|
|
cosineeuclideandot-product |
ANN | Disponibilidade geral |
A seguir
Para criar um corpus RAG, consulte Método: ragCorpora.create
Para listar o corpus RAG, consulte Método: ragCorpora.list