Esta página apresenta o RagManagedDb
, a sua tecnologia subjacente e como o RagManagedDb
é usado no Vertex AI RAG Engine. Além disso, esta página descreve os diferentes níveis disponíveis para otimizar o desempenho, que podem afetar os seus custos, e fornece instruções para eliminar os dados do Vertex AI RAG Engine, o que interrompe a faturação.
Vista geral
O motor RAG do Vertex AI usa o RagManagedDb
, que é uma instância do Google Spanner totalmente gerida e pronta para empresas, usada para o armazenamento de recursos pelo motor RAG do Vertex AI e está opcionalmente disponível para ser usada como a base de dados vetorial de
escolha para os seus corpora RAG.
Através do Spanner, o Vertex AI RAG Engine oferece uma base de dados consistente, altamente disponível e altamente escalável para suportar a sua aplicação. Para saber mais sobre o Google Spanner, consulte o artigo Spanner.
O motor RAG da Vertex AI armazena os metadados do corpus RAG e do recurso de ficheiro RAG em RagManagedDb
, independentemente da sua escolha de base de dados vetorial. As bases de dados vetoriais só são usadas para armazenamento e obtenção de incorporações. Além do armazenamento de recursos, o RagManagedDb
também pode ser usado para armazenar e gerir representações vetoriais dos seus documentos. Em seguida, a base de dados vetorial é usada para obter documentos relevantes com base na semelhança semântica do documento com uma determinada consulta.
Faça a gestão dos níveis
O Vertex AI RAG Engine permite-lhe dimensionar a sua instância RagManagedDb
com base nos seus requisitos de utilização e desempenho através de uma escolha de dois níveis e, opcionalmente, permite-lhe eliminar os seus dados do Vertex AI RAG Engine através de um terceiro nível.
O nível é uma definição ao nível do projeto disponível no RagEngineConfig
recurso que afeta os conjuntos de dados RAG através da RagManagedDb
. Os seguintes níveis
estão disponíveis em RagEngineConfig
:
Nível dimensionado: este nível oferece desempenho à escala de produção juntamente com a funcionalidade de dimensionamento automático. É adequado para clientes com grandes quantidades de dados ou cargas de trabalho sensíveis ao desempenho. Internamente, este nível define a instância do Spanner para a configuração de dimensionamento automático com um mínimo de 1 nó (1000 unidades de processamento) e um máximo de 10 nós (10 000 unidades de processamento).
Nível básico (predefinição): este nível oferece um nível económico e de computação reduzida, que pode ser adequado para alguns dos seguintes casos:
- A fazer experiências com
RagManagedDb
. - Tamanho de dados pequeno.
- Carga de trabalho insensível à latência.
- Use o motor RAG do Vertex AI apenas com outras bases de dados vetoriais.
Para oferecer o nível Básico, o
RagManagedDb
define a instância do Spanner subjacente para uma configuração fixa de 100 unidades de processamento, o que equivale a 0,1 nós.- A fazer experiências com
Nível não aprovisionado: este nível elimina o
RagManagedDb
e a respetiva instância subjacente do Spanner. O nível não aprovisionado desativa o serviço Vertex AI RAG Engine e elimina os seus dados mantidos neste serviço, independentemente da base de dados vetorial usada para o seuRagCorpora
. Esta ação interrompe a faturação do serviço. Para mais informações sobre a faturação, consulte o artigo Faturação do Vertex AI RAG Engine.Após a eliminação, não é possível recuperar os dados. Para voltar a usar o Vertex AI RAG Engine, tem de atualizar o nível chamando a API
UpdateRagEngineConfig
.
Obtenha a configuração do projeto
Os exemplos de código seguintes demonstram como usar a API GetRagEngineConfig
para cada tipo de nível:
Versão 1 (v1) da API exemplos de código.
Exemplos de código da API v1beta1.
Atualize a configuração do projeto
Os exemplos de código seguintes demonstram como usar a UpdateRagEngineConfig
API para cada tipo de nível:
Versão 1 (v1) Exemplos de código da API.
v1beta1 Exemplos de código da API.
O que se segue?
- Para saber como usar a API RAG v1, a predefinição, consulte o artigo API RAG v1.
- Para saber como usar a API RAG v1beta1, consulte o artigo API RAG v1beta1.
- Para saber mais sobre o
RagManagedDb
e como gerir a configuração do seu nível, bem como a estratégia de obtenção ao nível do corpus de RAG, consulte o artigo Use RagManagedDb with Vertex AI RAG Engine.