Compreender o RagManagedDb

Esta página apresenta o RagManagedDb, a sua tecnologia subjacente e como o RagManagedDb é usado no Vertex AI RAG Engine. Além disso, esta página descreve os diferentes níveis disponíveis para otimizar o desempenho, que podem afetar os seus custos, e fornece instruções para eliminar os dados do Vertex AI RAG Engine, o que interrompe a faturação.

Vista geral

O motor RAG do Vertex AI usa o RagManagedDb, que é uma instância do Google Spanner totalmente gerida e pronta para empresas, usada para o armazenamento de recursos pelo motor RAG do Vertex AI e está opcionalmente disponível para ser usada como a base de dados vetorial de escolha para os seus corpora RAG.

Através do Spanner, o Vertex AI RAG Engine oferece uma base de dados consistente, altamente disponível e altamente escalável para suportar a sua aplicação. Para saber mais sobre o Google Spanner, consulte o artigo Spanner.

O motor RAG da Vertex AI armazena os metadados do corpus RAG e do recurso de ficheiro RAG em RagManagedDb, independentemente da sua escolha de base de dados vetorial. As bases de dados vetoriais só são usadas para armazenamento e obtenção de incorporações. Além do armazenamento de recursos, o RagManagedDb também pode ser usado para armazenar e gerir representações vetoriais dos seus documentos. Em seguida, a base de dados vetorial é usada para obter documentos relevantes com base na semelhança semântica do documento com uma determinada consulta.

Faça a gestão dos níveis

O Vertex AI RAG Engine permite-lhe dimensionar a sua instância RagManagedDb com base nos seus requisitos de utilização e desempenho através de uma escolha de dois níveis e, opcionalmente, permite-lhe eliminar os seus dados do Vertex AI RAG Engine através de um terceiro nível.

O nível é uma definição ao nível do projeto disponível no RagEngineConfig recurso que afeta os conjuntos de dados RAG através da RagManagedDb. Os seguintes níveis estão disponíveis em RagEngineConfig:

Nível dimensionado: este nível oferece desempenho à escala de produção juntamente com a funcionalidade de dimensionamento automático. É adequado para clientes com grandes quantidades de dados ou cargas de trabalho sensíveis ao desempenho. Internamente, este nível define a instância do Spanner para a configuração de dimensionamento automático com um mínimo de 1 nó (1000 unidades de processamento) e um máximo de 10 nós (10 000 unidades de processamento).
Nível básico (predefinição): este nível oferece um nível económico e de computação reduzida, que pode ser adequado para alguns dos seguintes casos:
- A fazer experiências com RagManagedDb.
- Tamanho de dados pequeno.
- Carga de trabalho insensível à latência.
- Use o motor RAG do Vertex AI apenas com outras bases de dados vetoriais.
Para oferecer o nível Básico, o RagManagedDb define a instância do Spanner subjacente para uma configuração fixa de 100 unidades de processamento, o que equivale a 0,1 nós.
Nível não aprovisionado: este nível elimina o RagManagedDb e a respetiva instância subjacente do Spanner. O nível não aprovisionado desativa o serviço Vertex AI RAG Engine e elimina os seus dados mantidos neste serviço, independentemente da base de dados vetorial usada para o seu RagCorpora. Esta ação interrompe a faturação do serviço. Para mais informações sobre a faturação, consulte o artigo Faturação do Vertex AI RAG Engine.

Após a eliminação, não é possível recuperar os dados. Para voltar a usar o Vertex AI RAG Engine, tem de atualizar o nível chamando a API UpdateRagEngineConfig.

Obtenha a configuração do projeto

Os exemplos de código seguintes demonstram como usar a API GetRagEngineConfig para cada tipo de nível:

Versão 1 (v1) da API exemplos de código.
Exemplos de código da API v1beta1.

Atualize a configuração do projeto

Os exemplos de código seguintes demonstram como usar a UpdateRagEngineConfigAPI para cada tipo de nível:

Versão 1 (v1) Exemplos de código da API.
v1beta1 Exemplos de código da API.

O que se segue?

Para saber como usar a API RAG v1, a predefinição, consulte o artigo API RAG v1.
Para saber como usar a API RAG v1beta1, consulte o artigo API RAG v1beta1.
Para saber mais sobre o RagManagedDb e como gerir a configuração do seu nível, bem como a estratégia de obtenção ao nível do corpus de RAG, consulte o artigo Use RagManagedDb with Vertex AI RAG Engine.