RAG de IA generativa con Cloud SQL

Crea una aplicación de chat con IA generativa que use la generación mejorada por recuperación (RAG) para proporcionar respuestas fundamentadas y precisas basadas en los datos de tu organización. En esta guía, se describe la plantilla de aplicación RAG de IA generativa con Cloud SQL, que puedes personalizar para que se adapte a tus necesidades únicas y, luego, implementar como una aplicación.

Por ejemplo, puedes implementar esta plantilla para satisfacer las siguientes necesidades comerciales:

Ejemplo Necesidad empresarial Implementación
Chatbot de asistencia al cliente Las empresas deben brindar asistencia al cliente instantánea. Aloja la interfaz de chat en Cloud Run. Vertex AI procesa los embeddings y genera respuestas basadas en la documentación técnica almacenada como vectores en Cloud SQL.
Asistente interno de RR.HH. Los empleados necesitan encontrar información sobre los beneficios, las políticas de la empresa y los procedimientos internos. Aloja el asistente de RR.HH. en Cloud Run. Cuando los empleados consultan la herramienta, Vertex AI recupera información de políticas pertinente de Cloud SQL para generar respuestas precisas y fundamentadas en la fuente.
Investigador de documentos legales Los equipos legales necesitan encontrar rápidamente jurisprudencia o cláusulas contractuales pertinentes en grandes repositorios de documentos. Aloja el portal de investigación en Cloud Run. Vertex AI resume los precedentes pertinentes y, luego, identifica el lenguaje específico en los contratos usando documentos legales almacenados como vectores en Cloud SQL.
Búsqueda semántica de productos Las empresas de comercio electrónico desean facilitar las búsquedas de productos con descripciones en lenguaje natural en lugar de palabras clave exactas. Aloja la interfaz de búsqueda en Cloud Run. Vertex AI procesa las descripciones de los usuarios para devolver los productos más relevantes semánticamente de los catálogos de productos almacenados como vectores en Cloud SQL.

Arquitectura

En la siguiente imagen, se muestran los componentes y las conexiones de la aplicación:

Una aplicación de IA generativa basada en RAG en el lienzo de diseño. La aplicación incluye componentes de frontend, recuperación, IA, administración de secretos y bases de datos.

A continuación, se muestra el flujo de procesamiento de solicitudes de la aplicación:

  1. Carga datos en una base de datos de PostgreSQL en Cloud SQL.
  2. Vertex AI crea embeddings de campos de texto y los almacena como vectores en la base de datos.
  3. Un frontend de Cloud Load Balancing recibe solicitudes externas y distribuye el tráfico al backend de Cloud Load Balancing.
  4. El backend de Cloud Load Balancing distribuye el tráfico al servicio de frontend de Cloud Run.
  5. El servicio de frontend se comunica con un servicio de recuperación para una llamada de IA generativa.
  6. El servicio de recuperación usa Secret Manager para acceder de forma segura a las claves de API y las credenciales que se requieren para acceder a Vertex AI y Cloud SQL.
  7. El servicio de recuperación convierte la solicitud en un embedding y busca vectores similares en la base de datos de Cloud SQL.
  8. El servicio de recuperación envía los resultados de la búsqueda, junto con la instrucción original, a Vertex AI para crear una respuesta.

¿Qué sigue?