Este documento del Centro de Arquitectura proporciona guías de arquitectura para ayudarte a crear y desplegar cargas de trabajo de IA generativa en Google Cloud.
Para obtener información sobre cómo configurar, desplegar, evaluar y operar aplicaciones de IA generativa en modelos básicos, consulta Desplegar y operar aplicaciones de IA generativa.
Arquitecturas de alto nivel
En las siguientes guías se proporcionan arquitecturas de alto nivel para casos prácticos empresariales y técnicos específicos de la IA generativa:
| Guía | Descripción |
|---|---|
| Generar campañas de marketing personalizadas | Genera recursos multimedia para campañas de marketing personalizadas. |
| Generar recomendaciones de productos personalizadas | Generar recomendaciones de productos personalizadas basadas en las preferencias de los usuarios para aplicaciones de comercio. |
| Generar pódcasts a partir de archivos de audio | Generar pódcasts a partir de archivos multimedia, como comentarios en directo de un evento deportivo. |
| Generar soluciones para las solicitudes de asistencia de los clientes | Generar respuestas a preguntas de los clientes, como solicitudes de asistencia tecnológica. |
Arquitecturas de referencia
En las siguientes guías se proporcionan ejemplos de arquitectura detallados y recomendaciones de diseño para implementar cargas de trabajo e infraestructura de IA generativa en casos prácticos específicos:
| Guía | Descripción |
|---|---|
| Automatizar la revisión de la utilización de las reclamaciones de seguros | Mejorar el proceso de autorización previa y revisión de la utilización de las reclamaciones de seguros médicos. |
| Infraestructura de RAG con Gemini Enterprise y Vertex AI | Orquesta un flujo de trabajo de RAG con agentes con disponibilidad de datos en tiempo real y búsqueda contextual enriquecida. |
| Infraestructura de RAG con Vertex AI y Vector Search | Proporciona una búsqueda vectorial optimizada y de alto rendimiento para aplicaciones a gran escala. |
| Infraestructura de RAG con Vertex AI y AlloyDB para PostgreSQL | Almacena incrustaciones de vectores junto con datos operativos en una base de datos AlloyDB para PostgreSQL totalmente gestionada. |
| Infraestructura de RAG con Vertex AI y Cloud SQL | Almacena embeddings vectoriales junto con datos operativos en una base de datos de Cloud SQL totalmente gestionada. |
| Infraestructura de RAG con GKE y Cloud SQL | Crea aplicaciones RAG personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain. |
| Infraestructura de GraphRAG con Vertex AI y Spanner Graph | Combina la búsqueda de vectores con consultas de gráficos de conocimiento para recuperar datos contextuales interconectados. |
| Conectividad privada para aplicaciones de IA generativa compatibles con RAG | Protege la infraestructura de red de las aplicaciones de IA generativa compatibles con RAG mediante la VPC compartida. |
| Aprovechar el flujo de procesamiento de CI/CD para aplicaciones RAG | Configura un flujo de procesamiento de integración continua (CI) y despliegue continuo (CD) para aplicaciones RAG. |