En este documento del Centro de arquitectura, se proporcionan guías de arquitectura para ayudarte a compilar e implementar cargas de trabajo de IA generativa en Google Cloud.
Para obtener información sobre cómo configurar, implementar, evaluar y operar aplicaciones de IA generativa en modelos básicos, consulta Implementa y opera aplicaciones de IA generativa.
Arquitecturas de alto nivel
En las siguientes guías, se proporcionan arquitecturas de alto nivel para casos de uso técnicos y comerciales específicos de la IA generativa:
| Guía | Descripción |
|---|---|
| Genera campañas de marketing personalizadas | Genera recursos de medios para campañas de marketing personalizadas. |
| Genera recomendaciones de productos personalizadas | Generar recomendaciones de productos personalizadas según las preferencias del usuario para aplicaciones de venta minorista |
| Generar podcasts a partir de archivos de audio | Generar podcasts basados en archivos multimedia, como comentarios en vivo de un evento deportivo |
| Genera soluciones para las solicitudes de asistencia al cliente | Generar respuestas a las preguntas de los clientes, como las solicitudes de asistencia técnica |
Arquitecturas de referencia
En las siguientes guías, se proporcionan ejemplos detallados de arquitectura y recomendaciones de diseño para implementar cargas de trabajo e infraestructura de IA generativa para casos de uso específicos:
| Guía | Descripción |
|---|---|
| Automatizar la revisión de utilización de reclamos de seguros | Mejorar el proceso de autorización previa (AP) y revisión de uso (RU) de las reclamaciones de seguros médicos |
| Infraestructura de RAG con Gemini Enterprise y Vertex AI | Orquesta un flujo de trabajo de RAG basado en agentes con disponibilidad de datos en tiempo real y búsqueda contextual enriquecida. |
| Infraestructura de RAG con Vertex AI y Vector Search | Proporcionar una búsqueda de vectores optimizada y de alto rendimiento para aplicaciones a gran escala |
| Infraestructura de RAG con Vertex AI y AlloyDB para PostgreSQL | Almacena embeddings de vectores junto con datos operativos en una base de datos de AlloyDB para PostgreSQL completamente administrada. |
| Infraestructura de RAG con Vertex AI y Cloud SQL | Almacena incorporaciones vectoriales junto con datos operativos en una base de datos de Cloud SQL completamente administrada. |
| Infraestructura de RAG con GKE y Cloud SQL | Compila aplicaciones de RAG personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain. |
| Infraestructura de GraphRAG con Vertex AI y Spanner Graph | Combina la búsqueda de vectores con las consultas del gráfico de conocimiento para recuperar datos contextuales interconectados. |
| Conectividad privada para aplicaciones de IA generativa compatibles con RAG | Protege la infraestructura de red para las aplicaciones de IA generativa compatibles con RAG con la VPC compartida. |
| Aprovecha la canalización de CI/CD para aplicaciones de RAG | Configura una canalización de integración continua (CI) y de implementación continua (CD) para las aplicaciones de RAG. |