Guías de arquitectura de IA generativa

Last reviewed 2025-01-06 UTC

En este documento del Centro de arquitectura, se proporcionan guías de arquitectura para ayudarte a compilar e implementar cargas de trabajo de IA generativa en Google Cloud.

Para obtener información sobre cómo configurar, implementar, evaluar y operar aplicaciones de IA generativa en modelos básicos, consulta Implementa y opera aplicaciones de IA generativa.

Arquitecturas de alto nivel

En las siguientes guías, se proporcionan arquitecturas de alto nivel para casos de uso técnicos y comerciales específicos de la IA generativa:

Guía	Descripción
Genera campañas de marketing personalizadas	Genera recursos de medios para campañas de marketing personalizadas.
Genera recomendaciones de productos personalizadas	Generar recomendaciones de productos personalizadas según las preferencias del usuario para aplicaciones de venta minorista
Generar podcasts a partir de archivos de audio	Generar podcasts basados en archivos multimedia, como comentarios en vivo de un evento deportivo
Genera soluciones para las solicitudes de asistencia al cliente	Generar respuestas a las preguntas de los clientes, como las solicitudes de asistencia técnica

Arquitecturas de referencia

En las siguientes guías, se proporcionan ejemplos detallados de arquitectura y recomendaciones de diseño para implementar cargas de trabajo e infraestructura de IA generativa para casos de uso específicos:

Guía	Descripción
Automatizar la revisión de utilización de reclamos de seguros	Mejorar el proceso de autorización previa (AP) y revisión de uso (RU) de las reclamaciones de seguros médicos
Infraestructura de RAG con Gemini Enterprise y Vertex AI	Orquesta un flujo de trabajo de RAG basado en agentes con disponibilidad de datos en tiempo real y búsqueda contextual enriquecida.
Infraestructura de RAG con Vertex AI y Vector Search	Proporcionar una búsqueda de vectores optimizada y de alto rendimiento para aplicaciones a gran escala
Infraestructura de RAG con Vertex AI y AlloyDB para PostgreSQL	Almacena embeddings de vectores junto con datos operativos en una base de datos de AlloyDB para PostgreSQL completamente administrada.
Infraestructura de RAG con Vertex AI y Cloud SQL	Almacena incorporaciones vectoriales junto con datos operativos en una base de datos de Cloud SQL completamente administrada.
Infraestructura de RAG con GKE y Cloud SQL	Compila aplicaciones de RAG personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain.
Infraestructura de GraphRAG con Vertex AI y Spanner Graph	Combina la búsqueda de vectores con las consultas del gráfico de conocimiento para recuperar datos contextuales interconectados.
Conectividad privada para aplicaciones de IA generativa compatibles con RAG	Protege la infraestructura de red para las aplicaciones de IA generativa compatibles con RAG con la VPC compartida.
Aprovecha la canalización de CI/CD para aplicaciones de RAG	Configura una canalización de integración continua (CI) y de implementación continua (CD) para las aplicaciones de RAG.

Guías de arquitectura de IA generativa Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Arquitecturas de alto nivel

Arquitecturas de referencia

Guías de arquitectura de IA generativa