Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Guías de arquitectura de IA generativa

Last reviewed 2025-01-06 UTC

Este documento del Centro de Arquitectura proporciona guías de arquitectura para ayudarte a crear y desplegar cargas de trabajo de IA generativa en Google Cloud.

Para obtener información sobre cómo configurar, desplegar, evaluar y operar aplicaciones de IA generativa en modelos básicos, consulta Desplegar y operar aplicaciones de IA generativa.

Arquitecturas de alto nivel

En las siguientes guías se proporcionan arquitecturas de alto nivel para casos prácticos empresariales y técnicos específicos de la IA generativa:

Guía	Descripción
Generar campañas de marketing personalizadas	Genera recursos multimedia para campañas de marketing personalizadas.
Generar recomendaciones de productos personalizadas	Generar recomendaciones de productos personalizadas basadas en las preferencias de los usuarios para aplicaciones de comercio.
Generar pódcasts a partir de archivos de audio	Generar pódcasts a partir de archivos multimedia, como comentarios en directo de un evento deportivo.
Generar soluciones para las solicitudes de asistencia de los clientes	Generar respuestas a preguntas de los clientes, como solicitudes de asistencia tecnológica.

Arquitecturas de referencia

En las siguientes guías se proporcionan ejemplos de arquitectura detallados y recomendaciones de diseño para implementar cargas de trabajo e infraestructura de IA generativa en casos prácticos específicos:

Guía	Descripción
Automatizar la revisión de la utilización de las reclamaciones de seguros	Mejorar el proceso de autorización previa y revisión de la utilización de las reclamaciones de seguros médicos.
Infraestructura de RAG con Gemini Enterprise y Vertex AI	Orquesta un flujo de trabajo de RAG con agentes con disponibilidad de datos en tiempo real y búsqueda contextual enriquecida.
Infraestructura de RAG con Vertex AI y Vector Search	Proporciona una búsqueda vectorial optimizada y de alto rendimiento para aplicaciones a gran escala.
Infraestructura de RAG con Vertex AI y AlloyDB para PostgreSQL	Almacena incrustaciones de vectores junto con datos operativos en una base de datos AlloyDB para PostgreSQL totalmente gestionada.
Infraestructura de RAG con Vertex AI y Cloud SQL	Almacena embeddings vectoriales junto con datos operativos en una base de datos de Cloud SQL totalmente gestionada.
Infraestructura de RAG con GKE y Cloud SQL	Crea aplicaciones RAG personalizadas con herramientas de código abierto, como Ray, Hugging Face y LangChain.
Infraestructura de GraphRAG con Vertex AI y Spanner Graph	Combina la búsqueda de vectores con consultas de gráficos de conocimiento para recuperar datos contextuales interconectados.
Conectividad privada para aplicaciones de IA generativa compatibles con RAG	Protege la infraestructura de red de las aplicaciones de IA generativa compatibles con RAG mediante la VPC compartida.
Aprovechar el flujo de procesamiento de CI/CD para aplicaciones RAG	Configura un flujo de procesamiento de integración continua (CI) y despliegue continuo (CD) para aplicaciones RAG.

Guías de arquitectura de IA generativa Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Arquitecturas de alto nivel

Arquitecturas de referencia

Guías de arquitectura de IA generativa