Cas d'utilisation de l'IA générative : générer des recommandations de produits personnalisées

Ce document décrit une architecture générale permettant d'utiliser l'IA pour générer des recommandations de produits personnalisées pour une application de vente au détail dans Google Cloud.

Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA générative dans le cloud pour le secteur du commerce. Dans ce document, nous partons du principe que vous disposez de connaissances de base sur l'IA générative.

Architecture

Le schéma suivant montre une architecture qui utilise un modèle d'IA pour générer des recommandations de produits personnalisées en fonction des insights issus des métriques de flux de clics.

Architecture d'utilisation de l'IA pour générer des recommandations de produits personnalisées. Architecture d'utilisation de l'IA pour générer des recommandations de produits personnalisées}.

L'architecture présente les flux suivants :

  • Ingérer et traiter les données utilisateur :
    1. Les données de flux de clics, telles que les pages vues, les clics et les achats, sont importées dans un pipeline Dataflow.
    2. Dataflow traite les données et en tire des insights, comme les profils et les préférences des utilisateurs. Dataflow stocke ensuite les données, les insights et les embeddings vectoriels dans BigQuery.
  • Générer et diffuser des recommandations de produits :
    1. Un client visite la vitrine de l'entreprise, qui est un service Cloud Run dans cette architecture.
    2. Le service de la boutique en ligne envoie les données du visiteur à un service de recommandation qui s'exécute sur Cloud Run.
    3. Le service de recommandation effectue une recherche de similarité vectorielle dans BigQuery et récupère des données sur le profil et les préférences du visiteur.
    4. Le service de recommandation envoie les données du profil et des préférences du visiteur à l'API Gemini dans Vertex AI, avec un prompt pour générer des recommandations de produits. Gemini génère des recommandations de produits adaptées au visiteur.
    5. Le service de recommandation envoie les recommandations de produits au service de vitrine, qui les affiche ensuite.

Pour optimiser les coûts et les performances, ajoutez un cache entre le service de la boutique et le service de recommandation. Le service de recommandation vérifie le cache pour les données des visiteurs. Si le cache ne contient pas de données pertinentes, le service effectue une recherche de similarité vectorielle dans BigQuery. Pour configurer le cache, vous pouvez utiliser Memorystore ou configurer un équilibreur de charge avec Cloud CDN.

Produits utilisés

Cette architecture d'exemple utilise les produits Google Cloud suivants :

  • Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
  • Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
  • BigQuery : entrepôt de données d'entreprise qui vous aide à gérer et analyser vos données grâce à des fonctionnalités intégrées telles que l'analyse géospatiale du machine learning et l'informatique décisionnelle.
  • Dataflow : service qui fournit un traitement unifié des données par flux et par lot à grande échelle.

Déploiement

Pour tester les applications d'IA générative dans les charges de travail Google Cloud pour le secteur de la vente au détail, utilisez les exemples de code suivants :

Étapes suivantes

Contributeurs

Auteur : Kumar Dhanagopal | Cross-product solution developer

Autres contributeurs :