Faturamento do mecanismo RAG na plataforma de agentes do Gemini Enterprise

Esta página descreve os preços e o faturamento do mecanismo RAG na Gemini Enterprise Agent Platform com base nos componentes que você usa, como modelos, reclassificação e armazenamento de vetores.

Para mais informações, consulte a página de visão geral do mecanismo RAG na plataforma de agentes do Gemini Enterprise.

Preços e faturamento

Esta tabela explica como o faturamento funciona quando você usa os componentes RAG.

Componente Como o faturamento funciona com o mecanismo RAG
Ingestão de dados O mecanismo RAG oferece suporte à ingestão de dados de diferentes fontes. Por exemplo, fazer upload de arquivos locais, Cloud Storage e do Google Drive. O acesso a arquivos nessas fontes de dados pelo mecanismo RAG é sem custo financeiro, mas elas podem cobrar pela transferência de dados. Por exemplo, custos de saída de dados.
Transformação de dados (análise de arquivos)
  • Analisador padrão: sem custo financeiro.
  • Analisador de LLM: o mecanismo RAG usa o modelo de LLM especificado para analisar o arquivo, e você verá e pagará os custos do modelo de LLM diretamente do seu projeto.
  • Document AI analisador de layout: o mecanismo RAG usa o analisador de layout da Document AI especificado para processar o arquivo, e você verá e pagará pelo uso do analisador de layout da Document AI diretamente do seu projeto.
Transformação de dados (fragmentação de arquivos) Oferece suporte à fragmentação de tamanho fixo, que é sem custo financeiro.
Geração de embeddings

O mecanismo RAG orquestra a geração de embeddings usando o modelo especificado, e seu projeto é faturado pelos custos associados a esse modelo.

Para mais informações sobre preços, consulte Custo de criação e implantação de modelos de IA na Gemini Enterprise Agent Platform.

Indexação e recuperação de dados

O mecanismo RAG oferece suporte a duas categorias de bancos de dados de vetores para pesquisa vetorial:

  • Banco de dados gerenciado por RAG
  • Banco de dados de vetores próprio

Um banco de dados gerenciado por RAG tem duas finalidades:

  • Um banco de dados gerenciado por RAG armazena recursos de RAG, como corpora e arquivos. O conteúdo dos arquivos é excluído.
  • De acordo com sua escolha, indexação e recuperação de embeddings para pesquisa vetorial.

Um banco de dados gerenciado por RAG usa uma instância do Spanner como back-end.

Para cada um dos seus projetos, o mecanismo RAG provisiona um projeto específico do cliente Google Cloud e gerencia recursos gerenciados por RAG armazenados no mecanismo RAG, para que seus dados sejam isolados fisicamente. isolados.

Se você escolher o nível básico ou escalonado do RagManagedDB, o mecanismo RAG vai provisionar uma instância da edição empresarial do Spanner no projeto correspondente:

  • Nível básico: 100 unidades de processamento com backup
  • Nível escalonado: a partir de 1 nó (1.000 unidades de processamento) e escalonamento automático de até 10 nós com backup

Se qualquer corpus RAG no seu projeto escolher usar um banco de dados gerenciado por RAG para a pesquisa vetorial, você vai receber cobranças pela instância do Spanner gerenciada por RAG.

O mecanismo RAG mostra os custos do Spanner do projeto gerenciado por RAG correspondente ao seu Google Cloud projeto para que você possa ver e pagar os custos da instância do Spanner.

Para mais detalhes sobre os preços do Spanner, consulte os preços do Spanner.

Reclassificação para o mecanismo RAG na Gemini Enterprise Agent Platform

As seguintes ferramentas de classificação são compatíveis após a recuperação:

  • Reclassificador de LLM: o mecanismo RAG usa o modelo de LLM especificado para reclassificar os resultados da recuperação, e você verá e pagará os custos do modelo de LLM diretamente do seu projeto.
  • API de classificação da Pesquisa de agentes: o mecanismo RAG usa a API de classificação da Pesquisa de agentes para reclassificar os resultados da recuperação, e você verá e pagará pela API de classificação diretamente do seu projeto.

Excluir mecanismo RAG

Os exemplos de código a seguir demonstram como excluir um mecanismo RAG para o Google Cloud console, o Python e a API REST:

A seguir