Cas d'utilisation de l'IA générative : générer des solutions pour les questions du service client

Last reviewed 2025-12-16 UTC

Ce document fournit une architecture de haut niveau pour une application qui utilise l'IA pour générer des solutions aux questions d'assistance des clients.

Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA générative dans le cloud. Ce document part du principe que vous disposez de connaissances de base sur l'IA générative.

La section Déploiement de ce document fournit des exemples de code pour les cas d'utilisation de l'assistance client assistée par l'IA.

Architecture

Le schéma suivant illustre une architecture pour une application de centre d'assistance assistée par l'IA dans Google Cloud. L'application reçoit les questions des clients, récupère les ressources pertinentes d'une base de connaissances, puis génère des solutions pour les questions. L'architecture est une implémentation de l'approche de génération augmentée par récupération (RAG).

Architecture d'une application qui utilise l'IA pour générer des réponses aux demandes d'assistance des clients. Architecture d'une application qui utilise l'IA pour générer des réponses aux demandes d'assistance des clients.

L'application de cette architecture se compose de services conteneurisés déployés dans un cluster Google Kubernetes Engine (GKE). L'architecture présente le flux suivant :

  1. Un client envoie une question à l'application du service d'assistance.
  2. L'application du centre d'assistance transmet la question du client au service de récupération des connaissances.
  3. Le service de récupération des connaissances crée et envoie une requête à l'API Gemini dans Vertex AI pour récupérer les ressources pertinentes pour la question du client.
  4. Gemini identifie les ressources pertinentes d'une base de connaissances d'assistance stockée dans Cloud Storage.
  5. Gemini renvoie les ID des ressources pertinentes au service de récupération des connaissances.
  6. Le service de récupération des connaissances récupère les ressources pertinentes à partir de Cloud Storage.
  7. Le service de récupération des connaissances envoie la question du client et les ressources pertinentes au service de génération de solutions.
  8. Le service de génération de solutions envoie les ressources à l'API Gemini dans Vertex AI, avec une invite pour générer une solution détaillée à la question du client.
  9. Gemini génère une solution, comme des instructions détaillées ou un tutoriel vidéo.
  10. Le service de génération de solutions fournit la solution au client via l'application du centre d'assistance.

Produits utilisés

Cette architecture d'exemple utilise les produits Google Cloud suivants :

  • Google Kubernetes Engine (GKE) : service Kubernetes que vous pouvez utiliser pour déployer et exploiter des applications conteneurisées à grande échelle, à l'aide de l'infrastructure de Google.
  • Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
  • Cloud Storage : store d'objets économique et sans limite pour tout type de données. Les données sont accessibles depuis et en dehors de Google Cloud, et sont répliquées sur plusieurs emplacements à des fins de redondance.

Déploiement

Pour tester les applications d'assistance client assistée par l'IA dansGoogle Cloud, utilisez les exemples de code suivants :

Étapes suivantes

Contributeurs

Auteur : Kumar Dhanagopal | Cross-product solution developer

Autres contributeurs :