Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Facturación del motor RAG en Gemini Enterprise Agent Platform

En esta página, se describen los precios y la facturación del motor RAG en Gemini Enterprise Agent Platform según los componentes que uses, como modelos, clasificación y almacenamiento de vectores.

Para obtener más información, consulta la página de descripción general del motor RAG en Gemini Enterprise Agent Platform.

Precios y facturación

En esta tabla, se explica cómo funciona la facturación cuando usas los componentes de RAG.

Componente	Cómo funciona la facturación con RAG Engine
Transferencia de datos	El motor de RAG admite la transferencia de datos de diferentes fuentes de datos. Por ejemplo, subir archivos locales, Cloud Storage y Google Drive. El acceso a los archivos de estas fuentes de datos desde RAG Engine es gratuito, pero es posible que estas fuentes de datos cobren por la transferencia de datos. Por ejemplo, los costos de salida de datos.
Transformación de datos (análisis de archivos)	Analizador predeterminado: Gratis. LLM Parser: El motor de RAG usa el modelo de LLM que especificaste para analizar tu archivo, y verás y pagarás los costos del modelo de LLM directamente desde tu proyecto. Analizador de diseño de Document AI: El motor de RAG usa el analizador de diseño de Document AI que especificaste para procesar tu archivo, y verás y pagarás el uso del analizador de diseño de Document AI directamente desde tu proyecto.
Transformación de datos (división de archivos en fragmentos)	Admite la fragmentación de tamaño fijo, que es gratuita.
Generación de embeddings	RAG Engine coordina la generación de embeddings con el modelo de embedding que especificaste, y se te facturan los costos asociados a ese modelo. Para obtener más información sobre los precios, consulta Costo de crear y, luego, implementar modelos de IA en Gemini Enterprise Agent Platform.
Indexación y recuperación de datos	Nota: El motor RAG de Gemini Enterprise Agent Platform usa Spanner como backend para sus operaciones de indexación y recuperación de datos. El uso de Spanner genera cargos de facturación asociados. Para obtener más información, consulta Precios de Spanner. RAG Engine admite dos categorías de bases de datos vectoriales para la búsqueda de vectores: Base de datos administrada por RAG Base de datos de vectores externa Una base de datos administrada por RAG tiene dos propósitos: Una base de datos administrada por RAG almacena recursos de RAG, como corpus y archivos de RAG. Se excluye el contenido del archivo. Indexación y recuperación de embeddings para la búsqueda de vectores, según tu elección. Una base de datos administrada por RAG usa una instancia de Spanner como backend. Para cada uno de tus proyectos, RAG Engine aprovisiona un proyecto Google Cloud específico del cliente y administra los recursos administrados por RAG que se almacenan en RAG Engine, de modo que tus datos estén aislados físicamente. Si eliges el nivel `RagManagedDB` Básico o el nivel Escalado, el motor de RAG aprovisiona una instancia de la edición Enterprise de Spanner en el proyecto correspondiente: Nivel básico: 100 unidades de procesamiento con copia de seguridad Nivel escalado: A partir de 1 nodo (1,000 unidades de procesamiento) y escalado automático de hasta 10 nodos con copia de seguridad Si algún corpus de RAG en tu proyecto elige usar una base de datos administrada por RAG para la búsqueda de vectores, se te cobrará por la instancia de Spanner administrada por RAG. RAG Engine muestra los costos de Spanner de tu proyecto administrado por RAG correspondiente en tu proyecto de Google Cloud, de modo que puedas ver y pagar los costos de la instancia de Spanner. Para obtener más detalles sobre los precios de Spanner, consulta Precios de Spanner.
Clasificación de nuevo para el motor RAG en Gemini Enterprise Agent Platform	Se admiten las siguientes herramientas de clasificación después de la recuperación: LLM Reranker: El motor de RAG usa el modelo de LLM que especificaste para volver a clasificar los resultados de la recuperación, y verás y pagarás los costos del modelo de LLM directamente desde tu proyecto. API de clasificación de Agent Search: El motor de RAG usa la API de clasificación de Agent Search para volver a clasificar los resultados de recuperación, y verás y pagarás la API de clasificación directamente desde tu proyecto.

Borrar RAG Engine

En las siguientes muestras de código, se explica cómo borrar un motor de RAG para la Google Cloud consola, Python y REST:

Parámetros de la API de la versión 1 (v1) y muestras de código.
Parámetros y muestras de código de la API de v1beta1

¿Qué sigue?

Si deseas obtener información para usar el SDK de Vertex AI para ejecutar el motor de RAG en tareas de la plataforma de agentes de Gemini Enterprise, consulta la guía de inicio rápido de RAG para Python.
Para obtener más información sobre la fundamentación, consulta Descripción general de la fundamentación.
Para obtener más información sobre las respuestas de RAG, consulta Recuperación y generación de resultados del motor de RAG.
Para obtener más información sobre la arquitectura RAG, haz lo siguiente:
- Infraestructura para una aplicación de IA generativa compatible con RAG que usa Agent Platform y Vector Search
- Infraestructura para una aplicación de IA generativa compatible con RAG que usa Agent Platform y AlloyDB para PostgreSQL.