En este documento se describe una arquitectura de alto nivel para usar la IA con el fin de generar recomendaciones de productos personalizadas para una aplicación de comercio en Google Cloud.
Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA generativa en la nube para el sector del comercio minorista. En este documento se presupone que tienes conocimientos básicos sobre la IA generativa.
Arquitectura
En el siguiente diagrama se muestra una arquitectura que usa un modelo de IA para generar recomendaciones de productos personalizadas basadas en las estadísticas de la secuencia de clics.
La arquitectura muestra los siguientes flujos:
- Ingerir y procesar datos de usuario:
- Los datos de secuencias de clics, como las vistas de página, los clics y las compras, se suben a una canalización de Dataflow.
- Dataflow procesa los datos y obtiene información valiosa, como los perfiles y las preferencias de los usuarios. A continuación, Dataflow almacena los datos, las estadísticas y las inserciones vectoriales en BigQuery.
- Generar y publicar recomendaciones de productos:
- Un cliente visita la tienda de la empresa, que es un servicio de Cloud Run en esta arquitectura.
- El servicio de escaparate envía los datos del visitante a un servicio de recomendaciones que se ejecuta en Cloud Run.
- El servicio de recomendaciones realiza una búsqueda por similitud de vectores en BigQuery y obtiene datos sobre el perfil y las preferencias del visitante.
- El servicio de recomendaciones envía el perfil y los datos de preferencias del visitante a la API de Gemini en Vertex AI, junto con una petición para generar recomendaciones de productos. Gemini genera recomendaciones de productos adaptadas al visitante.
- El servicio de recomendaciones envía las recomendaciones de productos al servicio de escaparate, que las muestra.
Para optimizar los costes y el rendimiento, añade una caché entre el servicio de escaparate y el servicio de recomendaciones. El servicio de recomendaciones comprueba la caché para obtener datos de visitantes. Si la caché no contiene datos relevantes, el servicio realiza una búsqueda de similitud vectorial en BigQuery. Para configurar la caché, puedes usar Memorystore o configurar un balanceador de carga con Cloud CDN.
Productos usados
Esta arquitectura de ejemplo usa los siguientes productos de Google Cloud :
- Cloud Run: una plataforma de computación sin servidor que te permite ejecutar contenedores directamente en la infraestructura escalable de Google.
- Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
- BigQuery: un almacén de datos empresariales que te ayuda a gestionar y analizar tus datos con funciones integradas como el aprendizaje automático, el análisis geoespacial y la inteligencia empresarial.
- Dataflow: un servicio que proporciona un procesamiento de datos unificado por lotes y en tiempo real a gran escala.
Implementación
Para experimentar con aplicaciones de IA generativa en Google Cloud para cargas de trabajo del comercio, usa los siguientes ejemplos de código:
- Recomendaciones multimodales para el comercio.
- Ejemplos de código de IA generativa para casos prácticos del sector retail.
Siguientes pasos
- Consulta más guías de arquitectura de IA generativa.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos de las cargas de trabajo de IA y aprendizaje automático en Google Cloud, consulta la sección Perspectiva de IA y aprendizaje automático del framework Well-Architected.
- Para ver más arquitecturas de referencia, diagramas y prácticas recomendadas, consulta el centro de arquitectura de Cloud.
Colaboradores
Autor: Kumar Dhanagopal | Desarrollador de soluciones multiproducto
Otros colaboradores:
- Amina Mansour | Responsable del equipo de evaluaciones de Cloud Platform
- Megan O'Keefe | Developer Advocate
- Samantha He | Redactora técnica
- Shir Meir Lador | Gestora de Ingeniería de Relaciones con Desarrolladores