Administra el modo de Spanner

En el modo de implementación de Spanner, Vertex AI RAG Engine usa RagManagedDb, que es una instancia de Spanner completamente administrada y lista para la empresa que usa Vertex AI RAG Engine para el almacenamiento de recursos. Google Cloud De manera opcional, puedes usarla como la base de datos de vectores de tu elección para tus corpus de RAG.

A través de Spanner, Vertex AI RAG Engine ofrece una base de datos coherente, altamente disponible y altamente escalable para admitir tu aplicación. Para obtener más información sobre Google Cloud Spanner, consulta Spanner.

Vertex AI RAG Engine almacena tu corpus de RAG y los metadatos de recursos de archivos de RAG en RagManagedDb, independientemente de la base de datos de vectores que elijas. Las bases de datos de vectores solo se usan para almacenar y recuperar incorporaciones. Además del almacenamiento de recursos, RagManagedDb también se puede usar para almacenar y administrar representaciones vectoriales de tus documentos. Luego, la base de datos de vectores se usa para recuperar documentos relevantes en función de su similitud semántica con una consulta determinada.

Niveles disponibles

Vertex AI RAG Engine te permite escalar tu instancia de RagManagedDb según tus requisitos de uso y rendimiento con dos niveles. También puedes usarlo para borrar tus datos de Vertex AI RAG Engine con un tercer nivel.

El nivel es una configuración a nivel del proyecto que está disponible en el recurso RagEngineConfig que afecta a los corpus de RAG que usan RagManagedDb. Los siguientes niveles están disponibles en RagEngineConfig:

  • Nivel escalado: Este nivel ofrece un rendimiento a escala de producción junto con la funcionalidad de ajuste de escala automático. Es adecuado para clientes con grandes cantidades de datos o cargas de trabajo sensibles al rendimiento. Internamente, este nivel establece la instancia de Spanner en la configuración de ajuste de escala automático con un mínimo de 1 nodo (1,000 unidades de procesamiento) y un máximo de 10 nodos (10,000 unidades de procesamiento).

  • Nivel básico (predeterminado): Este nivel ofrece un nivel rentable y de bajo procesamiento, que podría ser adecuado para algunos de los siguientes casos:

    • Experimentar con RagManagedDb
    • Tamaños de datos pequeños
    • Cargas de trabajo insensibles a la latencia
    • Usar Vertex AI RAG Engine solo con otras bases de datos de vectores

Para ofrecer el nivel Básico, RagManagedDb establece la instancia subyacente de Spanner en una configuración fija de 100 unidades de procesamiento, lo que equivale a 0.1 nodos.

  • Nivel no aprovisionado: Este nivel borra el RagManagedDb y su instancia subyacente de Spanner. El nivel No aprovisionado inhabilita el servicio Vertex AI RAG Engine y borra los datos que contiene este servicio, independientemente de la base de datos de vectores que se use para tu RagCorpora. Esto detiene la facturación del servicio. Para obtener más información sobre la facturación, consulta Facturación de Vertex AI RAG Engine.

Una vez que se borran los datos, no se pueden recuperar. Para volver a usar Vertex AI RAG Engine, debes actualizar el nivel llamando a la API de UpdateRagEngineConfig o cambiar el modo a Serverless.

Administra niveles

Para leer y actualizar tus niveles, usa la API de GetRagEngineConfig y UpdateRagEngineConfig. Consulta la página Cambio entre modos para obtener muestras de código sobre cómo usar estas APIs.