Caso práctico de IA generativa: generar soluciones para preguntas de asistencia

En este documento se proporciona una arquitectura de alto nivel para una aplicación que usa la IA para generar soluciones a las preguntas de asistencia de los clientes.

Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA generativa en la nube. En este documento se presupone que tienes conocimientos básicos sobre la IA generativa.

En la sección Implementación de este documento se proporcionan ejemplos de código para casos prácticos de asistencia al cliente con IA.

Arquitectura

En el siguiente diagrama se muestra una arquitectura para una aplicación de asistencia técnica con IA en Google Cloud. La aplicación recibe preguntas de los clientes, busca recursos relevantes en una base de conocimientos y, a continuación, genera soluciones para las preguntas. La arquitectura es una implementación de la estrategia de generación aumentada por recuperación (RAG).

Arquitectura de una aplicación que usa la IA para generar respuestas a las solicitudes de asistencia de los clientes. Arquitectura de una aplicación que usa la IA para generar respuestas a las solicitudes de asistencia de los clientes.

La aplicación de esta arquitectura consta de servicios contenerizados que se despliegan en un clúster de Google Kubernetes Engine (GKE). La arquitectura muestra el siguiente flujo:

  1. Un cliente envía una pregunta a la aplicación del servicio de asistencia.
  2. La aplicación del servicio de asistencia envía la pregunta del cliente al servicio de recuperación de conocimientos.
  3. El servicio de recuperación de conocimientos crea y envía una petición a la API de Gemini en Vertex AI para recuperar recursos relevantes para la pregunta del cliente.
  4. Gemini identifica los recursos relevantes de una base de conocimientos de asistencia almacenada en Cloud Storage.
  5. Gemini devuelve los IDs de los recursos pertinentes al servicio de recuperación de conocimientos.
  6. El servicio de recuperación de conocimientos recupera los recursos pertinentes de Cloud Storage.
  7. El servicio de recuperación de conocimientos envía la pregunta del cliente y los recursos pertinentes al servicio de generación de soluciones.
  8. El servicio de generación de soluciones envía los recursos a la API de Gemini en Vertex AI, con una petición para generar una solución detallada a la pregunta del cliente.
  9. Gemini genera una solución, como instrucciones paso a paso o un vídeo explicativo.
  10. El servicio de generación de soluciones proporciona la solución al cliente a través de la aplicación del servicio de asistencia.

Productos usados

Esta arquitectura de ejemplo usa los siguientes productos de Google Cloud :

  • Google Kubernetes Engine (GKE): un servicio de Kubernetes que puedes usar para desplegar y operar aplicaciones en contenedores a gran escala con la infraestructura de Google.
  • Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
  • Cloud Storage: un almacén de objetos ilimitado y a un coste bajo para diversos tipos de datos. Se puede acceder a los datos desde dentro y fuera de Google Cloud, y se replican en varias ubicaciones para ofrecer redundancia.

Implementación

Para experimentar con aplicaciones de asistencia al cliente basadas en IA enGoogle Cloud, usa los siguientes ejemplos de código:

Siguientes pasos

Colaboradores

Autor: Kumar Dhanagopal | Desarrollador de soluciones multiproducto

Otros colaboradores: