O modo sem servidor é a maneira recomendada de começar a usar o mecanismo RAG da Vertex AI. Ele oferece um banco de dados totalmente gerenciado e altamente escalonável para apoiar seus recursos do RAG Engine da Vertex AI, sem o trabalho de provisionar ou gerenciar configurações de infraestrutura. Ele oferece integração rápida e é adequado para a maioria dos usuários, incluindo empresas de grande porte.
O modo sem servidor é um recurso de prévia e está disponível apenas em us-central1. Ele está disponível para todos e não requer lista de permissões.
No modo sem servidor, seu CUJ do mecanismo RAG da Vertex AI permanece idêntico ao do modo Spanner, exceto pelas seguintes diferenças principais:
- O
RagManagedDbnão está disponível como opção de banco de dados vetorial ao usar o modo sem servidor. Em vez disso, o novo banco de dados vetorial padrão é oRagManagedVertexVectorSearchtotalmente gerenciado e altamente escalonável. Para saber mais sobre esse banco de dados de vetores, consulte Usar a pesquisa vetorial 2.0 com RAG. - As chaves de criptografia gerenciadas pelo cliente (CMEK) não são compatíveis com o modo sem servidor.
Mudando para o modo sem servidor
Para mudar para o modo sem servidor como opção de modo de implantação, consulte a página Como mudar de modo.
Excluir seus dados
Para excluir seus dados do modo de implantação sem servidor, siga estas etapas:
- Verifique se o modo ativo está definido como "Sem servidor".
- Chame a API
ListRagCorporapara ver seus recursos nesse modo. - Exclua cada corpus usando a API
DeleteRagCorpus.
Preços
Não há cobrança adicional ao usar o modo de implantação sem servidor. No entanto, se você tiver um modo do Spanner ativo, ainda poderá receber cobranças por ele. Além disso, você pode receber cobranças pela escolha de modelos, reclassificação e armazenamento de vetores no Mecanismo RAG da Vertex AI. Para mais informações, consulte a página Faturamento do Mecanismo RAG da Vertex AI.