En este documento se proporciona una arquitectura de alto nivel para una aplicación que usa la IA para generar soluciones a las preguntas de asistencia de los clientes.
Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA generativa en la nube. En este documento se presupone que tienes conocimientos básicos sobre la IA generativa.
En la sección Implementación de este documento se proporcionan ejemplos de código para casos prácticos de asistencia al cliente con IA.
Arquitectura
En el siguiente diagrama se muestra una arquitectura para una aplicación de asistencia técnica con IA en Google Cloud. La aplicación recibe preguntas de los clientes, busca recursos relevantes en una base de conocimientos y, a continuación, genera soluciones para las preguntas. La arquitectura es una implementación de la estrategia de generación aumentada por recuperación (RAG).
La aplicación de esta arquitectura consta de servicios contenerizados que se despliegan en un clúster de Google Kubernetes Engine (GKE). La arquitectura muestra el siguiente flujo:
- Un cliente envía una pregunta a la aplicación del servicio de asistencia.
- La aplicación del servicio de asistencia envía la pregunta del cliente al servicio de recuperación de conocimientos.
- El servicio de recuperación de conocimientos crea y envía una petición a la API de Gemini en Vertex AI para recuperar recursos relevantes para la pregunta del cliente.
- Gemini identifica los recursos relevantes de una base de conocimientos de asistencia almacenada en Cloud Storage.
- Gemini devuelve los IDs de los recursos pertinentes al servicio de recuperación de conocimientos.
- El servicio de recuperación de conocimientos recupera los recursos pertinentes de Cloud Storage.
- El servicio de recuperación de conocimientos envía la pregunta del cliente y los recursos pertinentes al servicio de generación de soluciones.
- El servicio de generación de soluciones envía los recursos a la API de Gemini en Vertex AI, con una petición para generar una solución detallada a la pregunta del cliente.
- Gemini genera una solución, como instrucciones paso a paso o un vídeo explicativo.
- El servicio de generación de soluciones proporciona la solución al cliente a través de la aplicación del servicio de asistencia.
Productos usados
Esta arquitectura de ejemplo usa los siguientes productos de Google Cloud :
- Google Kubernetes Engine (GKE): un servicio de Kubernetes que puedes usar para desplegar y operar aplicaciones en contenedores a gran escala con la infraestructura de Google.
- Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
- Cloud Storage: un almacén de objetos ilimitado y a un coste bajo para diversos tipos de datos. Se puede acceder a los datos desde dentro y fuera de Google Cloud, y se replican en varias ubicaciones para ofrecer redundancia.
Implementación
Para experimentar con aplicaciones de asistencia al cliente basadas en IA enGoogle Cloud, usa los siguientes ejemplos de código:
- Crea una aplicación de asistencia que use IA generativa.
- Petición de ejemplo para casos prácticos de atención al cliente asistida por IA.
Siguientes pasos
- Crea un agente de asistencia con Gemini.
- Crea agentes de IA para casos prácticos de asistencia al cliente usando guías, flujos y almacenes de datos en Dialogflow CX.
- Consulta más guías de arquitectura de IA generativa.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos de las cargas de trabajo de IA y aprendizaje automático en Google Cloud, consulta la sección Perspectiva de IA y aprendizaje automático del framework Well-Architected.
- Para ver más arquitecturas de referencia, diagramas y prácticas recomendadas, consulta el centro de arquitectura de Cloud.
Colaboradores
Autor: Kumar Dhanagopal | Desarrollador de soluciones multiproducto
Otros colaboradores:
- Amina Mansour | Responsable del equipo de evaluaciones de Cloud Platform
- Megan O'Keefe | Developer Advocate
- Samantha He | Redactora técnica
- Shir Meir Lador | Gestora de Ingeniería de Relaciones con Desarrolladores