Facturación de Vertex AI RAG Engine

En esta página se describen los precios y la facturación de Vertex AI RAG Engine en función de los componentes que uses, como los modelos, la reclasificación y el almacenamiento de vectores.

Para obtener más información, consulta la página Descripción general de Vertex AI RAG Engine.

Precios y facturación

Vertex AI RAG Engine es de uso gratuito. Sin embargo, si configuras los componentes de Vertex AI RAG Engine, la facturación podría verse afectada.

En esta tabla se explica cómo funciona la facturación cuando usas los componentes de RAG.

Componente Cómo funciona la facturación de Vertex AI RAG Engine
Ingestión de datos Vertex AI RAG Engine admite la ingestión de datos de diferentes fuentes de datos. Por ejemplo, subir archivos locales, de Cloud Storage y de Google Drive. El acceso a los archivos de estas fuentes de datos desde Vertex AI RAG Engine es gratuito, pero es posible que estas fuentes de datos cobren por la transferencia de datos. Por ejemplo, los costes de salida de datos.
Transformación de datos (análisis de archivos)
  • Analizador predeterminado: gratuito.
  • Analizador de LLMs: Vertex AI RAG Engine usa el modelo de LLM que has especificado para analizar tu archivo. Verás los costes del modelo de LLM y los pagarás directamente desde tu proyecto.
  • Analizador de diseño de Document AI: Vertex AI RAG Engine usa el analizador de diseño de Document AI que hayas especificado para procesar tu archivo. Verás y pagarás por el uso del analizador de diseño de Document AI directamente desde tu proyecto.
Transformación de datos (división de archivos en fragmentos) Admite la fragmentación de tamaño fijo, que es gratuita.
Generación de inserciones Vertex AI RAG Engine orquesta la generación de inserciones mediante el modelo de inserciones que hayas especificado, y se te facturan los costes asociados a ese modelo.

Para obtener más información sobre los precios, consulta Coste de crear y desplegar modelos de IA en Vertex AI.

Indexación y obtención de datos RAG Engine admite dos categorías de bases de datos de vectores para la búsqueda de vectores:
  • Base de datos gestionada por RAG
  • Base de datos de vectores Bring-Your-Own

Una base de datos gestionada por RAG tiene dos finalidades:
  • Una base de datos gestionada por RAG almacena recursos de RAG, como corpus y archivos de RAG. No se incluye el contenido de los archivos.
  • Si lo decides, indexación de incrustaciones y recuperación para la búsqueda de vectores.

Una base de datos gestionada por RAG usa una instancia de Spanner como backend.

En cada uno de tus proyectos, Vertex AI RAG Engine aprovisiona un proyecto específico para el cliente y gestiona los recursos gestionados por RAG que se almacenan en Vertex AI RAG Engine, de forma que tus datos estén aislados físicamente. Google Cloud

Si eliges el RagManagedDB nivel básico o el nivel escalado, Vertex AI RAG Engine aprovisiona una instancia de la edición Enterprise de Spanner en el proyecto correspondiente:

  • Nivel básico: 100 unidades de procesamiento con copia de seguridad
  • Nivel escalado: empieza con 1 nodo (1000 unidades de procesamiento) y se escala automáticamente hasta 10 nodos con copia de seguridad.

Si algún corpus de RAG de tu proyecto elige usar una base de datos gestionada por RAG para la búsqueda de vectores, se te cobrará por la instancia de Spanner gestionada por RAG.

Vertex AI RAG Engine muestra los costes de Spanner de tu proyecto gestionado por RAG correspondiente en tu proyecto de Google Cloud , de forma que puedas ver y pagar los costes de las instancias de Spanner.

Para obtener más información sobre los precios de Spanner, consulta la página de precios de Spanner.

Reclasificación para Vertex AI RAG Engine Después de la recuperación, se admiten las siguientes herramientas de clasificación:
  • Reclasificador de LLM: Vertex AI RAG Engine usa el modelo de LLM que hayas especificado para reclasificar los resultados de la extracción. Verás los costes del modelo de LLM y los pagarás directamente desde tu proyecto.
  • API de clasificación de Vertex AI Search: Vertex AI RAG Engine usa la API de clasificación de Vertex AI Search para volver a clasificar los resultados de la extracción. Verás y pagarás la API de clasificación directamente desde tu proyecto.

Eliminar Vertex AI RAG Engine

En los siguientes ejemplos de código se muestra cómo eliminar un motor RAG de Vertex AI para la Google Cloud consola, Python y REST:

Siguientes pasos