Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Como gerenciar o modo Spanner

No modo de implantação do Spanner, o mecanismo RAG da Vertex AI usa RagManagedDb, que é uma instância do Spanner Google Cloud totalmente gerenciada e pronta para uso empresarial, usada para armazenamento de recursos pelo mecanismo RAG da Vertex AI. Também é possível usá-lo como o banco de dados vetorial de sua escolha para os corpora de RAG.

Com o Spanner, o mecanismo RAG da Vertex AI oferece um banco de dados consistente, altamente disponível e escalonável para oferecer suporte ao seu aplicativo. Para saber mais sobre o Google Cloud Spanner, consulte Spanner.

Armazenamento de dados e pesquisa vetorial

O Mecanismo RAG da Vertex AI armazena os metadados de recursos do corpus e do arquivo de RAG em RagManagedDb, independente do banco de dados vetorial escolhido. Os bancos de dados de vetores são usados apenas para armazenamento e recuperação de embeddings. Além do armazenamento de recursos, o RagManagedDb também pode ser usado para armazenar e gerenciar representações vetoriais dos seus documentos. Em seguida, o banco de dados de vetores é usado para recuperar documentos relevantes com base na semelhança semântica do documento a uma determinada consulta.

Níveis disponíveis

Com o mecanismo de RAG da Vertex AI, é possível escalonar sua instância RagManagedDb com base nos requisitos de uso e desempenho usando dois níveis. Você também pode usar esse recurso para excluir seus dados do mecanismo de RAG da Vertex AI com um terceiro nível.

O nível é uma configuração no nível do projeto disponível no recurso RagEngineConfig que afeta os corpus de RAG usando RagManagedDb. Os seguintes níveis estão disponíveis no RagEngineConfig:

Nível escalonado:oferece desempenho em escala de produção e funcionalidade de escalonamento automático. Ele é adequado para clientes com grandes quantidades de dados ou cargas de trabalho sensíveis ao desempenho. Internamente, esse nível define a instância do Spanner para a configuração de escalonamento automático com um mínimo de 1 nó (1.000 unidades de processamento) e um máximo de 10 nós (10.000 unidades de processamento).
Nível básico (padrão): esse nível oferece uma opção econômica e de baixa computação, que pode ser adequada para alguns dos seguintes casos:
- Fazendo experimentos com RagManagedDb
- Tamanhos de dados pequenos
- Cargas de trabalho sem diferenciação de latência
- Usar o mecanismo RAG da Vertex AI apenas com outros bancos de dados de vetores

Para oferecer o nível Básico, o RagManagedDb define a instância do Spanner subjacente para uma configuração fixa de 100 unidades de processamento, o que equivale a 0,1 nós.

Nível não provisionado:esse nível exclui o RagManagedDb e a instância do Spanner subjacente. O nível não provisionado desativa o serviço do mecanismo RAG da Vertex AI e exclui os dados mantidos nele, independente do banco de dados de vetores usado para seu RagCorpora. Isso interrompe a cobrança do serviço. Para mais informações sobre faturamento, consulte Faturamento do Mecanismo RAG da Vertex AI.

Depois que os dados são excluídos, não é possível recuperá-los. Para voltar a usar o mecanismo RAG da Vertex AI, atualize a camada chamando a API UpdateRagEngineConfig ou mude o modo para sem servidor.

Como gerenciar níveis

Para ler e atualizar seus níveis, use as APIs GetRagEngineConfig e UpdateRagEngineConfig. Consulte a página Como alternar entre modos para ver exemplos de código sobre como usar essas APIs.

Como gerenciar o modo Spanner Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Armazenamento de dados e pesquisa vetorial

Níveis disponíveis

Como gerenciar níveis

Como gerenciar o modo Spanner