Ce document décrit une architecture générale permettant d'utiliser l'IA pour générer des recommandations de produits personnalisées pour une application de vente au détail dans Google Cloud.
Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA générative dans le cloud pour le secteur du commerce. Dans ce document, nous partons du principe que vous disposez de connaissances de base sur l'IA générative.
Architecture
Le schéma suivant montre une architecture qui utilise un modèle d'IA pour générer des recommandations de produits personnalisées en fonction des insights issus des métriques de flux de clics.
L'architecture présente les flux suivants :
- Ingérer et traiter les données utilisateur :
- Les données de flux de clics, telles que les pages vues, les clics et les achats, sont importées dans un pipeline Dataflow.
- Dataflow traite les données et en tire des insights, comme les profils et les préférences des utilisateurs. Dataflow stocke ensuite les données, les insights et les embeddings vectoriels dans BigQuery.
- Générer et diffuser des recommandations de produits :
- Un client visite la vitrine de l'entreprise, qui est un service Cloud Run dans cette architecture.
- Le service de la boutique en ligne envoie les données du visiteur à un service de recommandation qui s'exécute sur Cloud Run.
- Le service de recommandation effectue une recherche de similarité vectorielle dans BigQuery et récupère des données sur le profil et les préférences du visiteur.
- Le service de recommandation envoie les données du profil et des préférences du visiteur à l'API Gemini dans Vertex AI, avec un prompt pour générer des recommandations de produits. Gemini génère des recommandations de produits adaptées au visiteur.
- Le service de recommandation envoie les recommandations de produits au service de vitrine, qui les affiche ensuite.
Pour optimiser les coûts et les performances, ajoutez un cache entre le service de la boutique et le service de recommandation. Le service de recommandation vérifie le cache pour les données des visiteurs. Si le cache ne contient pas de données pertinentes, le service effectue une recherche de similarité vectorielle dans BigQuery. Pour configurer le cache, vous pouvez utiliser Memorystore ou configurer un équilibreur de charge avec Cloud CDN.
Produits utilisés
Cette architecture d'exemple utilise les produits Google Cloud suivants :
- Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
- Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
- BigQuery : entrepôt de données d'entreprise qui vous aide à gérer et analyser vos données grâce à des fonctionnalités intégrées telles que l'analyse géospatiale du machine learning et l'informatique décisionnelle.
- Dataflow : service qui fournit un traitement unifié des données par flux et par lot à grande échelle.
Déploiement
Pour tester les applications d'IA générative dans les charges de travail Google Cloud pour le secteur de la vente au détail, utilisez les exemples de code suivants :
- Recommandations multimodales pour le commerce de détail :
- Exemples de code d'IA générative pour les cas d'utilisation dans le secteur du commerce
Étapes suivantes
- Découvrez d'autres guides sur l'architecture de l'IA générative.
- Pour obtenir une présentation des principes et des recommandations d'architecture spécifiques aux charges de travail d'IA et de ML dans Google Cloud, consultez la perspective de l'IA et du ML dans le framework Well-Architected.
- Pour découvrir d'autres architectures de référence, schémas et bonnes pratiques, consultez le Centre d'architecture cloud.
Contributeurs
Auteur : Kumar Dhanagopal | Cross-product solution developer
Autres contributeurs :
- Amina Mansour | Cadre chez Cloud Platform Evaluations
- Megan O'Keefe | Developer Advocate
- Samantha He | Rédactrice technique
- Shir Meir Lador | Responsable de l'ingénierie des relations avec les développeurs