Guías de arquitectura de IA generativa

Last reviewed 2025-01-06 UTC

Este documento del Centro de Arquitectura proporciona guías de arquitectura para ayudarte a crear y desplegar cargas de trabajo de IA generativa en Google Cloud.

Para obtener información sobre cómo configurar, desplegar, evaluar y operar aplicaciones de IA generativa en modelos básicos, consulta Desplegar y operar aplicaciones de IA generativa.

Arquitecturas de alto nivel

En las siguientes guías se proporcionan arquitecturas de alto nivel para casos prácticos empresariales y técnicos específicos de la IA generativa:

Guía Descripción
Generar campañas de marketing personalizadas Genera recursos multimedia para campañas de marketing personalizadas.
Generar recomendaciones de productos personalizadas Generar recomendaciones de productos personalizadas basadas en las preferencias de los usuarios para aplicaciones de comercio.
Generar pódcasts a partir de archivos de audio Generar pódcasts a partir de archivos multimedia, como comentarios en directo de un evento deportivo.
Generar soluciones para las solicitudes de asistencia de los clientes Generar respuestas a preguntas de los clientes, como solicitudes de asistencia tecnológica.

Arquitecturas de referencia

En las siguientes guías se proporcionan ejemplos de arquitectura detallados y recomendaciones de diseño para implementar cargas de trabajo e infraestructura de IA generativa en casos prácticos específicos:

Guía Descripción
Automatizar la revisión de la utilización de las reclamaciones de seguros Mejorar el proceso de autorización previa y revisión de la utilización de las reclamaciones de seguros médicos.
Infraestructura de RAG con Gemini Enterprise y Vertex AI Orquesta un flujo de trabajo de RAG con agentes con disponibilidad de datos en tiempo real y búsqueda contextual enriquecida.
Infraestructura de RAG con Vertex AI y Vector Search Proporciona una búsqueda vectorial optimizada y de alto rendimiento para aplicaciones a gran escala.
Infraestructura de RAG con Vertex AI y AlloyDB para PostgreSQL Almacena incrustaciones de vectores junto con datos operativos en una base de datos AlloyDB para PostgreSQL totalmente gestionada.
Infraestructura de RAG con Vertex AI y Cloud SQL Almacena embeddings vectoriales junto con datos operativos en una base de datos de Cloud SQL totalmente gestionada.
Infraestructura de RAG con GKE y Cloud SQL Crea aplicaciones RAG personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain.
Infraestructura de GraphRAG con Vertex AI y Spanner Graph Combina la búsqueda de vectores con consultas de gráficos de conocimiento para recuperar datos contextuales interconectados.
Conectividad privada para aplicaciones de IA generativa compatibles con RAG Protege la infraestructura de red de las aplicaciones de IA generativa compatibles con RAG mediante la VPC compartida.
Aprovechar el flujo de procesamiento de CI/CD para aplicaciones RAG Configura un flujo de procesamiento de integración continua (CI) y despliegue continuo (CD) para aplicaciones RAG.