Información sobre RagManagedDb

En esta página, se presenta RagManagedDb, su tecnología subyacente y cómo se usa RagManagedDb en el motor de RAG de Vertex AI. Además, en esta página, se describen los diferentes niveles disponibles para ajustar el rendimiento, lo que podría afectar tus costos, y se proporcionan instrucciones para borrar tus datos del motor de RAG de Vertex AI, lo que detiene la facturación.

Descripción general

El motor de RAG de Vertex AI usa RagManagedDb, que es una instancia de Google Spanner completamente administrada y lista para la empresa que usa el motor de RAG de Vertex AI para el almacenamiento de recursos y que está disponible de forma opcional para usarse como la base de datos de vectores de elección para tus corpus de RAG.

A través de Spanner, el motor de RAG de Vertex AI ofrece una base de datos coherente, altamente disponible y altamente escalable para admitir tu aplicación. Para obtener más información sobre Google Spanner, consulta Spanner.

El motor de RAG de Vertex AI almacena tu corpus de RAG y los metadatos de recursos de archivos de RAG en RagManagedDb, independientemente de la base de datos de vectores que elijas. Las bases de datos de vectores solo se usan para el almacenamiento y la recuperación de embeddings. Además del almacenamiento de recursos, RagManagedDb también se puede usar para almacenar y administrar representaciones vectoriales de tus documentos. Luego, la base de datos de vectores se usa para recuperar documentos relevantes en función de su similitud semántica con una consulta determinada.

Administra niveles

El motor de RAG de Vertex AI te permite escalar tu instancia de RagManagedDb según tus requisitos de uso y rendimiento con una opción de dos niveles y, de manera opcional, te permite borrar tus datos del motor de RAG de Vertex AI con un tercer nivel.

El nivel es una configuración a nivel del proyecto que está disponible en el recurso RagEngineConfig que afecta a los corpus de RAG que usan RagManagedDb. Los siguientes niveles están disponibles en RagEngineConfig:

  • Nivel escalado: Este nivel ofrece un rendimiento a escala de producción junto con la funcionalidad de ajuste de escala automático. Es adecuado para clientes con grandes cantidades de datos o cargas de trabajo sensibles al rendimiento. De forma interna, este nivel establece la instancia de Spanner en la configuración de ajuste de escala automático con un mínimo de 1 nodo (1,000 unidades de procesamiento) y un máximo de 10 nodos (10,000 unidades de procesamiento).

  • Nivel básico (predeterminado): Este nivel ofrece un nivel rentable y de bajo procesamiento que podría ser adecuado para algunos de los siguientes casos:

    • Experimentar con RagManagedDb.
    • Tamaño de datos pequeño.
    • Carga de trabajo no sensible a la latencia.
    • Usar el motor de RAG de Vertex AI solo con otras bases de datos de vectores.

    Para ofrecer el nivel Básico, RagManagedDb establece la instancia subyacente de Spanner en una configuración fija de 100 unidades de procesamiento, lo que equivale a 0.1 nodos.

  • Nivel no aprovisionado: Este nivel borra el RagManagedDb y su instancia subyacente de Spanner. El nivel No aprovisionado inhabilita el servicio del motor de RAG de Vertex AI y borra tus datos almacenados en este servicio, independientemente de la base de datos de vectores que se use para tu RagCorpora. Esto detiene la facturación del servicio. Para obtener más información sobre la facturación, consulta [Facturación del motor de RAG de Vertex AI]rag-engine-billing).

    Una vez que se borran los datos, no se pueden recuperar. Para volver a usar el motor de RAG de Vertex AI, debes actualizar el nivel llamando a la API de UpdateRagEngineConfig.

Obtén la configuración del proyecto

En los siguientes ejemplos de código, se muestra cómo usar la API de GetRagEngineConfig para cada tipo de nivel:

Actualiza la configuración del proyecto

En los siguientes ejemplos de código, se muestra cómo usar la API de UpdateRagEngineConfig para cada tipo de nivel:

¿Qué sigue?

  • Para obtener información sobre cómo usar la API de RAG v1, la predeterminada, consulta API de RAG v1.

  • Para obtener información sobre cómo usar la API de RAG v1beta1, consulta API de RAG v1beta1.

  • Para obtener más información sobre RagManagedDb y cómo administrar la configuración de tu nivel así como la estrategia de recuperación a nivel del corpus de RAG, consulta Usa RagManagedDb con el motor de RAG de Vertex AI.