Usa las siguientes guías de arquitectura para diseñar e implementar aplicaciones de IA generativa con generación mejorada por recuperación (RAG) en Google Cloud.
| Guía de arquitectura | Descripción |
|---|---|
| Infraestructura de RAG para la IA generativa con Gemini Enterprise y Vertex AI | Una arquitectura basada en agentes que usa Gemini Enterprise como una plataforma unificada para coordinar un flujo de datos de RAG de extremo a extremo para aplicaciones empresariales que requieren disponibilidad de datos en tiempo real y búsqueda contextual enriquecida. |
| Infraestructura de RAG para la IA generativa con Vertex AI y Vector Search | Es una arquitectura sin servidores completamente administrada que proporciona una búsqueda vectorial optimizada y de alto rendimiento para aplicaciones a gran escala. |
| Infraestructura de RAG para IA generativa con Vertex AI y AlloyDB para PostgreSQL | Una arquitectura que almacena embeddings de vectores junto con tus datos operativos en una base de datos completamente administrada, como AlloyDB para PostgreSQL. |
| Solución de inicio rápido: RAG de IA generativa con Vertex AI y Cloud SQL | Una arquitectura que almacena incorporaciones vectoriales junto con tus datos operativos en una base de datos completamente administrada, como Cloud SQL. |
| Infraestructura de RAG para IA generativa con GKE y Cloud SQL | Una arquitectura flexible basada en contenedores que proporciona el máximo control para compilar aplicaciones personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain. |
| Infraestructura de GraphRAG para IA generativa con Vertex AI y Spanner Graph | Una arquitectura de RAG avanzada que combina la búsqueda de vectores con las consultas del gráfico de conocimiento para recuperar datos interconectados y contextuales, lo que genera respuestas más detalladas y pertinentes de la IA generativa. |
| Aprovecha la canalización de CI/CD para aplicaciones de RAG | Arquitectura para una canalización de integración continua (CI) y de implementación continua (CD) para una aplicación de RAG en Google Cloud. |