En este documento, se describe una arquitectura de alto nivel para usar la IA y generar recomendaciones de productos personalizadas para una aplicación de comercio minorista en Google Cloud.
El público previsto para este documento incluye arquitectos, desarrolladores y administradores que compilan y administran aplicaciones de IA generativa en la nube para la industria minorista. En este documento, se supone que tienes conocimientos básicos sobre la IA generativa.
Arquitectura
En el siguiente diagrama, se muestra una arquitectura que usa un modelo de IA para generar recomendaciones de productos personalizadas basadas en estadísticas de las métricas de clickstream.
En la arquitectura, se muestran los siguientes flujos:
- Transfiere y procesa los datos del usuario:
- Los datos de flujo de clics, como las vistas de página, los clics y las compras, se suben a una canalización de Dataflow.
- Dataflow procesa los datos y deriva estadísticas, como perfiles y preferencias de los usuarios. Luego, Dataflow almacena los datos, las estadísticas y las incorporaciones de vectores en BigQuery.
- Generar y publicar recomendaciones de productos:
- Un cliente visita la tienda de la empresa, que es un servicio de Cloud Run en esta arquitectura.
- El servicio de la tienda envía los datos del visitante a un servicio de recomendaciones que se ejecuta en Cloud Run.
- El servicio de recomendaciones realiza una búsqueda de similitud de vectores en BigQuery y recupera datos sobre el perfil y las preferencias del visitante.
- El servicio de recomendación envía los datos del perfil y las preferencias del visitante a la API de Gemini en Vertex AI, con una instrucción para generar recomendaciones de productos. Gemini genera recomendaciones de productos personalizadas para el visitante.
- El servicio de recomendador envía las recomendaciones de productos al servicio de la tienda, que luego las muestra.
Para optimizar el costo y el rendimiento, agrega una caché entre el servicio de la tienda y el servicio de recomendador. El servicio de recomendaciones verifica la caché para obtener datos de los visitantes. Si la caché no contiene datos relevantes, el servicio realiza una búsqueda de similitud de vectores en BigQuery. Para configurar la caché, puedes usar Memorystore o configurar un balanceador de cargas con Cloud CDN.
Productos usados
En esta arquitectura de ejemplo, se usan los siguientes Google Cloud productos:
- Cloud Run es una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
- Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
- BigQuery: Un almacén de datos empresarial que te ayuda a administrar y analizar tus datos con funciones integradas como el análisis geoespacial de aprendizaje automático y la inteligencia empresarial.
- Dataflow: Es un servicio que proporciona procesamiento unificado de datos por lotes y de transmisión a gran escala.
Implementación
Para experimentar con aplicaciones de IA generativa en Google Cloud para cargas de trabajo de venta minorista, usa los siguientes ejemplos de código:
- Recomendaciones de venta minorista multimodales
- Muestras de código de IA generativa para casos de uso minoristas.
¿Qué sigue?
- Explora más guías de arquitectura de IA generativa.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos para las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
- Para obtener más información sobre las arquitecturas de referencia, los diagramas y las prácticas recomendadas, explora Cloud Architecture Center.
Colaboradores
Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
Otros colaboradores:
- Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
- Megan O'Keefe | Developer Advocate
- Samantha He | Escritora técnica
- Shir Meir Lador | Administrador de Ingeniería de Relaciones con Desarrolladores