Esta página apresenta o RagManagedDb, a tecnologia subjacente e como o RagManagedDb é usado no mecanismo RAG na Gemini Enterprise Agent Platform. Além disso, esta página descreve os diferentes níveis disponíveis para ajustar o desempenho, o que pode afetar seus custos, e fornece instruções para excluir os dados do mecanismo RAG, o que interrompe o faturamento.
Visão geral
O mecanismo RAG na plataforma de agentes do Gemini Enterprise usa RagManagedDb, que é uma instância do Google Spanner totalmente gerenciada e pronta para empresas usada para armazenamento de recursos
pelo mecanismo RAG e disponível opcionalmente para ser usada como
o banco de dados de vetores de
sua escolha para seus corpora RAG.
Com o Spanner, o mecanismo RAG oferece um banco de dados consistente, altamente disponível e escalonável para oferecer suporte ao seu aplicativo. Para saber mais sobre o Google Spanner, consulte Spanner.
O mecanismo RAG armazena os metadados de recursos do corpus e do arquivo RAG no RagManagedDb, independentemente da sua escolha de banco de dados de vetores. Os bancos de dados de vetores são usados apenas para armazenamento e recuperação de embeddings. Além do armazenamento de recursos, o RagManagedDb também pode ser usado para armazenar e gerenciar representações vetoriais dos seus documentos. O banco de dados de vetores é usado para recuperar documentos relevantes com base na similaridade semântica do documento com uma determinada consulta.
Gerenciar níveis
O mecanismo RAG na plataforma de agentes do Gemini Enterprise permite escalonar a instância RagManagedDb com base nos requisitos de uso e desempenho usando uma escolha de dois níveis e, opcionalmente, permite excluir os dados do mecanismo RAG usando um terceiro nível.
O nível é uma configuração para envolvidos no projeto disponível no recurso RagEngineConfig que afeta os corpora RAG que usam RagManagedDb. Os seguintes níveis estão disponíveis no RagEngineConfig:
Nível escalonado: esse nível oferece desempenho de escala de produção e funcionalidade de escalonamento automático. Ele é adequado para clientes com grandes quantidades de dados ou cargas de trabalho sensíveis ao desempenho. Internamente, esse nível define a instância do Spanner para a configuração de escalonamento automático com um mínimo de 1 nó (1.000 unidades de processamento) e um máximo de 10 nós (10.000 unidades de processamento).
Nível básico (padrão): esse nível oferece um nível de computação econômico e baixo, que pode ser adequado para alguns dos seguintes casos:
- Testar o
RagManagedDb. - Tamanho de dados pequeno.
- Carga de trabalho sem diferenciação de latência.
- Usar o mecanismo RAG apenas com outros bancos de dados de vetores.
Para oferecer o nível básico, o
RagManagedDbdefine a instância subjacente do Spanner para uma configuração fixa de 100 unidades de processamento, o que equivale a 0,1 nós.- Testar o
Nível não provisionado: esse nível exclui o
RagManagedDbe a instância subjacente do Spanner. O nível não provisionado desativa o serviço do mecanismo RAG e exclui os dados mantidos nesse serviço, independentemente do banco de dados de vetores usado para oRagCorpora. Isso interrompe o faturamento do serviço. Para mais informações sobre faturamento, consulte [Faturamento do mecanismo RAG na plataforma de agentes do Gemini Enterprise]rag-engine-billing).Depois que os dados são excluídos, eles não podem ser recuperados. Para começar a usar o mecanismo RAG novamente, atualize o nível chamando a API
UpdateRagEngineConfig.
Receber a configuração do projeto
Os exemplos de código a seguir demonstram como usar a API GetRagEngineConfig para cada tipo de nível:
v1beta1 Exemplos de código da API.
Atualizar a configuração do projeto
Os exemplos de código a seguir demonstram como usar a API UpdateRagEngineConfig para cada tipo de nível:
v1beta1 Exemplos de código da API.
A seguir
Para saber como usar a API RAG v1, a padrão, consulte API RAG v1.
Para saber como usar a API RAG v1beta1, consulte API RAG v1beta1.
Para saber mais sobre
RagManagedDbe como gerenciar a configuração de nível e a estratégia de recuperação no nível do corpus RAG, consulte Usar o RagManagedDb com o mecanismo RAG na Gemini Enterprise Agent Platform.