En este documento, se proporciona una arquitectura de alto nivel para una aplicación que usa IA para generar soluciones a las preguntas de asistencia al cliente.
El público objetivo de este documento incluye arquitectos, desarrolladores y administradores que compilan y administran aplicaciones de IA generativa en la nube. En este documento, se supone que tienes una comprensión básica de la IA generativa.
En la sección Implementación de este documento, se proporcionan muestras de código para casos de uso de asistencia al cliente asistida por IA.
Arquitectura
En el siguiente diagrama, se muestra una arquitectura para una aplicación de mesa de ayuda asistida por IA en Google Cloud. La aplicación recibe preguntas de los clientes, recupera recursos pertinentes de una base de conocimiento y, luego, genera soluciones para las preguntas. La arquitectura es una implementación del enfoque de generación mejorada por recuperación (RAG).
La aplicación en esta arquitectura consta de servicios en contenedores que se implementan en un clúster de Google Kubernetes Engine (GKE). La arquitectura muestra el siguiente flujo:
- Un cliente envía una pregunta a la aplicación de la mesa de ayuda.
- La aplicación de la mesa de ayuda pasa la pregunta del cliente al servicio de recuperación de conocimiento.
- El servicio de recuperación de conocimiento crea y envía una instrucción a la API de Gemini en Vertex AI para recuperar recursos pertinentes para la pregunta del cliente.
- Gemini identifica los recursos pertinentes de una base de conocimiento de asistencia almacenada en Cloud Storage.
- Gemini devuelve los IDs de los recursos pertinentes al servicio de recuperación de conocimiento.
- El servicio de recuperación de conocimiento recupera los recursos pertinentes de Cloud Storage.
- El servicio de recuperación de conocimiento envía la pregunta del cliente y los recursos pertinentes al servicio de generación de soluciones.
- El servicio de generador de soluciones envía los recursos a la API de Gemini en Vertex AI, con una instrucción para generar una solución detallada para la pregunta del cliente.
- Gemini genera una solución, como instrucciones paso a paso o un video explicativo.
- El servicio de generación de soluciones proporciona la solución al cliente a través de la aplicación de la mesa de ayuda.
Productos usados
En esta arquitectura de ejemplo, se usan los siguientes Google Cloud productos:
- Google Kubernetes Engine (GKE): Un servicio de Kubernetes que puedes usar para implementar y operar aplicaciones en contenedores a gran escala con la infraestructura de Google.
- Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
- Cloud Storage: Un depósito de objetos de bajo costo y sin límites para varios tipos de datos. Se puede acceder a los datos desde y hacia Google Cloud, y estos se replican en las ubicaciones para aumentar la redundancia.
Implementación
Para experimentar con aplicaciones de asistencia al cliente asistida por IA enGoogle Cloud, usa las siguientes muestras de código:
- Compila una aplicación de asistencia al cliente que use IA generativa.
- Ejemplo de instrucción para casos de uso de atención al cliente asistida por IA.
¿Qué sigue?
- Cómo compilar un agente de asistencia al cliente con Gemini
- Crea agentes de IA para casos de uso de asistencia al cliente con guías, flujos y almacenes de datos en Dialogflow CX.
- Explora más guías de arquitectura de IA generativa.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos para las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
- Para obtener más información sobre las arquitecturas de referencia, los diagramas y las prácticas recomendadas, explora Cloud Architecture Center.
Colaboradores
Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
Otros colaboradores:
- Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
- Megan O'Keefe | Developer Advocate
- Samantha He | Escritora técnica
- Shir Meir Lador | Administrador de Ingeniería de Relaciones con Desarrolladores