IA generativa con RAG

Usa las siguientes guías de arquitectura para diseñar y desplegar aplicaciones de IA generativa con generación aumentada por recuperación (RAG) en Google Cloud.

Guía de arquitectura Descripción
Infraestructura de RAG para IA generativa con Gemini Enterprise y Vertex AI Una arquitectura basada en agentes que usa Gemini Enterprise como plataforma unificada para orquestar un flujo de datos de RAG integral para aplicaciones empresariales que requieren disponibilidad de datos en tiempo real y búsquedas contextuales enriquecidas.
Infraestructura de RAG para IA generativa con Vertex AI y Vector Search Una arquitectura sin servidor totalmente gestionada que proporciona una búsqueda de vectores optimizada y de alto rendimiento para aplicaciones a gran escala.
Infraestructura de RAG para IA generativa con Vertex AI y AlloyDB para PostgreSQL Una arquitectura que almacena incrustaciones de vectores junto con tus datos operativos en una base de datos totalmente gestionada, como AlloyDB para PostgreSQL.
Solución Jump Start: RAG de IA generativa con Vertex AI y Cloud SQL Una arquitectura que almacena embeddings de vectores junto con tus datos operativos en una base de datos totalmente gestionada, como Cloud SQL.
Infraestructura de RAG para IA generativa con GKE y Cloud SQL Una arquitectura flexible basada en contenedores que proporciona el máximo control para crear aplicaciones personalizadas con herramientas de código abierto como Ray, Hugging Face y LangChain.
Infraestructura de GraphRAG para IA generativa con Vertex AI y Spanner Graph Una arquitectura de RAG avanzada que combina la búsqueda vectorial con consultas de grafos de conocimiento para recuperar datos interconectados y contextuales, lo que da como resultado respuestas de IA generativa más detalladas y relevantes.
Aprovechar el flujo de procesamiento de CI/CD para aplicaciones RAG Una arquitectura para un flujo de procesamiento de integración continua (CI) y despliegue continuo (CD) de una aplicación RAG en Google Cloud.