En esta página se describen los precios y la facturación de Vertex AI RAG Engine en función de los componentes que uses, como los modelos, la reclasificación y el almacenamiento de vectores.
Para obtener más información, consulta la página Descripción general de Vertex AI RAG Engine.
Precios y facturación
Vertex AI RAG Engine es de uso gratuito. Sin embargo, si configuras los componentes de Vertex AI RAG Engine, la facturación podría verse afectada.
En esta tabla se explica cómo funciona la facturación cuando usas los componentes de RAG.
| Componente | Cómo funciona la facturación de Vertex AI RAG Engine |
|---|---|
| Ingestión de datos | Vertex AI RAG Engine admite la ingestión de datos de diferentes fuentes de datos. Por ejemplo, subir archivos locales, de Cloud Storage y de Google Drive. El acceso a los archivos de estas fuentes de datos desde Vertex AI RAG Engine es gratuito, pero es posible que estas fuentes de datos cobren por la transferencia de datos. Por ejemplo, los costes de salida de datos. |
| Transformación de datos (análisis de archivos) |
|
| Transformación de datos (división de archivos en fragmentos) | Admite la fragmentación de tamaño fijo, que es gratuita. |
| Generación de inserciones | Vertex AI RAG Engine orquesta la generación de inserciones mediante el modelo de inserciones que hayas especificado, y se te facturan los costes asociados a ese modelo. Para obtener más información sobre los precios, consulta Coste de crear y desplegar modelos de IA en Vertex AI. |
| Indexación y obtención de datos |
RAG Engine admite dos categorías de bases de datos de vectores para la búsqueda de vectores:
Una base de datos gestionada por RAG tiene dos finalidades:
Una base de datos gestionada por RAG usa una instancia de Spanner como backend. En cada uno de tus proyectos, Vertex AI RAG Engine aprovisiona un proyecto específico para el cliente y gestiona los recursos gestionados por RAG que se almacenan en Vertex AI RAG Engine, de forma que tus datos estén aislados físicamente. Google Cloud Si eliges el
Si algún corpus de RAG de tu proyecto elige usar una base de datos gestionada por RAG para la búsqueda de vectores, se te cobrará por la instancia de Spanner gestionada por RAG. Vertex AI RAG Engine muestra los costes de Spanner de tu proyecto gestionado por RAG correspondiente en tu proyecto de Google Cloud , de forma que puedas ver y pagar los costes de las instancias de Spanner. Para obtener más información sobre los precios de Spanner, consulta la página de precios de Spanner. |
| Reclasificación para Vertex AI RAG Engine | Después de la recuperación, se admiten las siguientes herramientas de clasificación:
|
Eliminar Vertex AI RAG Engine
En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI para la Google Cloud consola, Python y REST:
Parámetros de la API versión 1 (v1) y ejemplos de código.
Parámetros y ejemplos de código de la API v1beta1.
Siguientes pasos
- Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.
- Para obtener información sobre el grounding, consulta la introducción al grounding.
- Para obtener más información sobre las respuestas de RAG, consulta Resultados de extracción y generación de Vertex AI RAG Engine.
- Para obtener información sobre la arquitectura RAG, sigue estos pasos: