Esta página descreve os preços e o faturamento do mecanismo RAG na Gemini Enterprise Agent Platform com base nos componentes que você usa, como modelos, reclassificação e armazenamento de vetores.
Para mais informações, consulte a página de visão geral do mecanismo RAG na plataforma de agentes do Gemini Enterprise.
Preços e faturamento
Esta tabela explica como funciona o faturamento ao usar os componentes de RAG.
| Componente | Como funciona o faturamento com o mecanismo RAG |
|---|---|
| Ingestão de dados | O mecanismo RAG é compatível com a ingestão de dados de diferentes fontes. Por exemplo, fazer upload de arquivos locais, do Cloud Storage e do Google Drive. O acesso a arquivos nessas fontes de dados do RAG Engine é sem custo financeiro, mas elas podem cobrar pela transferência de dados. Por exemplo, custos de saída de dados. |
| Transformação de dados (análise de arquivos) |
|
| Transformação de dados (divisão de arquivos em partes) | Aceita o chunking de tamanho fixo, que é sem custo financeiro. |
| Geração de embeddings |
O mecanismo RAG orquestra a geração de embeddings usando o modelo especificado, e seu projeto é cobrado pelos custos associados a esse modelo. Para mais informações sobre preços, consulte Custo de criação e implantação de modelos de IA na Gemini Enterprise Agent Platform. |
| Indexação e recuperação de dados |
O mecanismo RAG é compatível com duas categorias de bancos de dados de vetores para pesquisa vetorial:
Um banco de dados gerenciado por RAG tem duas finalidades:
Um banco de dados gerenciado por RAG usa uma instância do Spanner como back-end. Para cada um dos seus projetos, o Mecanismo RAG provisiona um projeto Google Cloud específico do cliente e gerencia recursos gerenciados pelo RAG armazenados no Mecanismo RAG, para que seus dados sejam isolados fisicamente.
Se você escolher o nível
Se algum corpus RAG no seu projeto usar um banco de dados gerenciado por RAG para a pesquisa vetorial, você vai receber cobranças pela instância do Spanner gerenciada por RAG. O Mecanismo RAG mostra os custos do Spanner do projeto gerenciado por RAG correspondente no seu projeto Google Cloud, para que você possa ver e pagar os custos da instância do Spanner. Para mais detalhes sobre os preços do Spanner, consulte Preços do Spanner. |
| Reclassificação para o mecanismo RAG na Gemini Enterprise Agent Platform |
As seguintes ferramentas de classificação são compatíveis após a recuperação:
|
Excluir mecanismo RAG
Os exemplos de código a seguir demonstram como excluir um mecanismo RAG para o console Google Cloud , Python e REST:
Parâmetros e exemplos de código da API versão 1 (v1).
parâmetros e exemplos de código da API v1beta1.
A seguir
Para saber como usar o SDK da Vertex AI para executar o mecanismo de RAG em tarefas da Gemini Enterprise Agent Platform, consulte o guia de início rápido da RAG para Python.
Para saber mais sobre o embasamento, consulte Visão geral do embasamento.
Para saber mais sobre as respostas da RAG, consulte Recuperação e geração de saída do mecanismo RAG.
Para saber mais sobre a arquitetura RAG: