Guías de arquitectura de IA generativa

Last reviewed 2025-01-06 UTC

En este documento del Centro de arquitectura, se proporcionan guías de arquitectura para ayudarte a compilar e implementar cargas de trabajo de IA generativa en Google Cloud.

Para obtener información sobre cómo configurar, implementar, evaluar y operar aplicaciones de IA generativa en modelos básicos, consulta Implementa y opera aplicaciones de IA generativa.

Arquitecturas de alto nivel

En las siguientes guías, se proporcionan arquitecturas de alto nivel para casos de uso técnicos y comerciales específicos de la IA generativa:

Guía Descripción
Genera campañas de marketing personalizadas Genera recursos de medios para campañas de marketing personalizadas.
Genera recomendaciones de productos personalizadas Generar recomendaciones de productos personalizadas según las preferencias del usuario para aplicaciones de venta minorista
Generar podcasts a partir de archivos de audio Generar podcasts basados en archivos multimedia, como comentarios en vivo de un evento deportivo
Genera soluciones para las solicitudes de asistencia al cliente Generar respuestas a las preguntas de los clientes, como las solicitudes de asistencia técnica

Arquitecturas de referencia

En las siguientes guías, se proporcionan ejemplos detallados de arquitectura y recomendaciones de diseño para implementar cargas de trabajo e infraestructura de IA generativa para casos de uso específicos:

Guía Descripción
Automatizar la revisión de utilización de reclamos de seguros Mejorar el proceso de autorización previa (AP) y revisión de uso (RU) de las reclamaciones de seguros médicos
Infraestructura de RAG con Gemini Enterprise y Vertex AI Orquesta un flujo de trabajo de RAG basado en agentes con disponibilidad de datos en tiempo real y búsqueda contextual enriquecida.
Infraestructura de RAG con Vertex AI y Vector Search Proporcionar una búsqueda de vectores optimizada y de alto rendimiento para aplicaciones a gran escala
Infraestructura de RAG con Vertex AI y AlloyDB para PostgreSQL Almacena embeddings de vectores junto con datos operativos en una base de datos de AlloyDB para PostgreSQL completamente administrada.
Infraestructura de RAG con Vertex AI y Cloud SQL Almacena incorporaciones vectoriales junto con datos operativos en una base de datos de Cloud SQL completamente administrada.
Infraestructura de RAG con GKE y Cloud SQL Compila aplicaciones de RAG personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain.
Infraestructura de GraphRAG con Vertex AI y Spanner Graph Combina la búsqueda de vectores con las consultas del gráfico de conocimiento para recuperar datos contextuales interconectados.
Conectividad privada para aplicaciones de IA generativa compatibles con RAG Protege la infraestructura de red para las aplicaciones de IA generativa compatibles con RAG con la VPC compartida.
Aprovecha la canalización de CI/CD para aplicaciones de RAG Configura una canalización de integración continua (CI) y de implementación continua (CD) para las aplicaciones de RAG.