Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Facturación de Vertex AI RAG Engine

En esta página se describen los precios y la facturación de Vertex AI RAG Engine en función de los componentes que uses, como los modelos, la reordenación y el almacenamiento de vectores.

Para obtener más información, consulta la página Descripción general de Vertex AI RAG Engine.

Precios y facturación

En esta tabla se explica cómo funciona la facturación cuando usas los componentes de RAG.

Componente	Cómo funciona la facturación de Vertex AI RAG Engine
Ingestión de datos	Vertex AI RAG Engine admite la ingestión de datos de diferentes fuentes de datos. Por ejemplo, subir archivos locales, de Cloud Storage y de Google Drive. El acceso a los archivos de estas fuentes de datos desde Vertex AI RAG Engine es sin coste económico, pero es posible que estas fuentes de datos cobren por la transferencia de datos. Por ejemplo, los costes de salida de datos.
Transformación de datos (análisis de archivos)	Analizador predeterminado: sin coste económico. Analizador de LLMs: Vertex AI RAG Engine usa el modelo de LLM que has especificado para analizar tu archivo. Verás los costes del modelo de LLM y los pagarás directamente desde tu proyecto. Analizador de diseño de Document AI: Vertex AI RAG Engine usa el analizador de diseño de Document AI que hayas especificado para procesar tu archivo. Verás y pagarás por el uso del analizador de diseño de Document AI directamente desde tu proyecto.
Transformación de datos (división de archivos en fragmentos)	Admite la fragmentación de tamaño fijo, que es sin coste económico.
Generación de inserciones	Vertex AI RAG Engine coordina la generación de inserciones mediante el modelo de inserciones que hayas especificado, y se te facturan los costes asociados a ese modelo. Para obtener más información sobre los precios, consulta Coste de crear y desplegar modelos de IA en Vertex AI.
Indexación y obtención de datos	Nota: Vertex AI RAG Engine usa Spanner como backend para sus operaciones de indexación y extracción de datos. El uso de Spanner conlleva cargos de facturación asociados. Para obtener más información, consulta la página de precios de Spanner. RAG Engine admite dos categorías de bases de datos de vectores para la búsqueda de vectores: Base de datos gestionada por RAG Bases de datos vectoriales propias Una base de datos gestionada por RAG tiene dos finalidades: Una base de datos gestionada por RAG almacena recursos de RAG, como corpus y archivos de RAG. No se incluye el contenido de los archivos. Según tu elección, indexación de inserciones y recuperación para la búsqueda de vectores. Una base de datos gestionada por RAG usa una instancia de Spanner como backend. En cada uno de tus proyectos, Vertex AI RAG Engine aprovisiona un proyecto específico para el cliente y gestiona los recursos gestionados por RAG que se almacenan en Vertex AI RAG Engine, de forma que tus datos estén aislados físicamente. Google Cloud Si eliges el `RagManagedDB` nivel básico o el nivel escalado, Vertex AI RAG Engine aprovisiona una instancia de la edición Enterprise de Spanner en el proyecto correspondiente: Nivel básico: 100 unidades de procesamiento con copia de seguridad Nivel escalado: empieza con 1 nodo (1000 unidades de procesamiento) y se escala automáticamente hasta 10 nodos con copia de seguridad. Si algún corpus de RAG de tu proyecto elige usar una base de datos gestionada por RAG para la búsqueda de vectores, se te cobrará por la instancia de Spanner gestionada por RAG. Vertex AI RAG Engine muestra los costes de Spanner de tu proyecto gestionado por RAG correspondiente en tu proyecto de Google Cloud para que puedas ver y pagar los costes de las instancias de Spanner. Para obtener más información sobre los precios de Spanner, consulta la página de precios de Spanner.
Reclasificación para Vertex AI RAG Engine	Después de la recuperación, se admiten las siguientes herramientas de clasificación: Reclasificador de LLM: Vertex AI RAG Engine usa el modelo de LLM que hayas especificado para reclasificar los resultados de la extracción. Verás los costes del modelo de LLM y los pagarás directamente desde tu proyecto. API de clasificación de Vertex AI Search: Vertex AI RAG Engine usa la API de clasificación de Vertex AI Search para volver a clasificar los resultados de la extracción. Verás y pagarás la API de clasificación directamente desde tu proyecto.

Eliminar Vertex AI RAG Engine

En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI para la consola, Python y REST: Google Cloud

Parámetros de la API versión 1 (v1) y ejemplos de código.
Parámetros y ejemplos de código de la API v1beta1.

Siguientes pasos

Para saber cómo usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.
Para obtener información sobre el grounding, consulta la introducción al grounding.
Para obtener más información sobre las respuestas de RAG, consulta Resultados de extracción y generación de Vertex AI RAG Engine.
Para obtener información sobre la arquitectura RAG, sigue estos pasos:
- Infraestructura para una aplicación de IA generativa compatible con RAG que use Vertex AI y Vector Search
- Infraestructura para una aplicación de IA generativa compatible con RAG que use Vertex AI y AlloyDB para PostgreSQL.