Esta página descreve os preços e o faturamento do mecanismo RAG na Gemini Enterprise Agent Platform com base nos componentes que você usa, como modelos, reclassificação e armazenamento de vetores.
Para mais informações, consulte a página de visão geral do mecanismo RAG na plataforma de agentes do Gemini Enterprise.
Preços e faturamento
Esta tabela explica como o faturamento funciona quando você usa os componentes RAG.
| Componente | Como o faturamento funciona com o mecanismo RAG |
|---|---|
| Ingestão de dados | O mecanismo RAG oferece suporte à ingestão de dados de diferentes fontes. Por exemplo, fazer upload de arquivos locais, Cloud Storage e do Google Drive. O acesso a arquivos nessas fontes de dados pelo mecanismo RAG é sem custo financeiro, mas elas podem cobrar pela transferência de dados. Por exemplo, custos de saída de dados. |
| Transformação de dados (análise de arquivos) |
|
| Transformação de dados (fragmentação de arquivos) | Oferece suporte à fragmentação de tamanho fixo, que é sem custo financeiro. |
| Geração de embeddings |
O mecanismo RAG orquestra a geração de embeddings usando o modelo especificado, e seu projeto é faturado pelos custos associados a esse modelo. Para mais informações sobre preços, consulte Custo de criação e implantação de modelos de IA na Gemini Enterprise Agent Platform. |
| Indexação e recuperação de dados |
O mecanismo RAG oferece suporte a duas categorias de bancos de dados de vetores para pesquisa vetorial:
Um banco de dados gerenciado por RAG tem duas finalidades:
Um banco de dados gerenciado por RAG usa uma instância do Spanner como back-end. Para cada um dos seus projetos, o mecanismo RAG provisiona um projeto específico do cliente Google Cloud e gerencia recursos gerenciados por RAG armazenados no mecanismo RAG, para que seus dados sejam isolados fisicamente. isolados.
Se você escolher o nível básico ou escalonado do
Se qualquer corpus RAG no seu projeto escolher usar um banco de dados gerenciado por RAG para a pesquisa vetorial, você vai receber cobranças pela instância do Spanner gerenciada por RAG. O mecanismo RAG mostra os custos do Spanner do projeto gerenciado por RAG correspondente ao seu Google Cloud projeto para que você possa ver e pagar os custos da instância do Spanner. Para mais detalhes sobre os preços do Spanner, consulte os preços do Spanner. |
| Reclassificação para o mecanismo RAG na Gemini Enterprise Agent Platform |
As seguintes ferramentas de classificação são compatíveis após a recuperação:
|
Excluir mecanismo RAG
Os exemplos de código a seguir demonstram como excluir um mecanismo RAG para o Google Cloud console, o Python e a API REST:
Parâmetros e exemplos de código da API versão 1 (v1).
Parâmetros e exemplos de código da API v1beta1.
A seguir
Para saber como usar o SDK da Vertex AI para executar tarefas do mecanismo RAG na Gemini Enterprise Agent Platform, consulte Início rápido do RAG para Python.
Para saber mais sobre embasamento, consulte Embasamento visão geral.
Para saber mais sobre as respostas do RAG, consulte Saída de recuperação e geração do mecanismo RAG.
Para saber mais sobre a arquitetura RAG: