Instrumentar aplicaciones de IA generativa

En este documento se describe la ventaja de instrumentar tus aplicaciones de IA generativa. También se resume cómo puedes instrumentar una aplicación que use los frameworks LangGraph o Agent Development Kit (ADK). Ambos frameworks te permiten recoger peticiones de texto. Sin embargo, el framework ADK también te permite recoger y ver peticiones y respuestas multimodales.

Acerca de los agentes de IA generativa

Las aplicaciones que usan la IA generativa se basan en agentes para completar tareas o alcanzar objetivos. Los agentes son aplicaciones que completan tareas o persiguen objetivos en nombre de un usuario. Por ejemplo, un agente de IA generativa puede navegar por un sitio web y enviar comandos de API. Estos comandos de API pueden obtener información o realizar una acción.

Los agentes actúan de forma autónoma y usan el razonamiento para determinar cómo desglosar un objetivo o una tarea en subtareas y, a continuación, qué herramientas usar para llevar a cabo esas subtareas. En el contexto de la IA generativa, las herramientas determinan cómo puede interactuar el agente con su entorno. Por ejemplo, un agente puede tener una herramienta que le permita enviar comandos de API.

Para obtener más información sobre los agentes, consulta lo siguiente:

Por qué instrumentar tus aplicaciones de IA generativa

Instrumentar tus aplicaciones de IA generativa es la única forma de entender el razonamiento que usan los agentes autónomos. Este proceso de razonamiento no es determinista.

Cuando instrumentas una aplicación de IA generativa, los datos de telemetría incluyen las decisiones y las acciones de los agentes. Puede usar estos datos para validar o mejorar su aplicación.

Cómo instrumentar tus aplicaciones de IA generativa

Instrumentar una aplicación implica generar telemetría y enviarla a un lugar donde se puedan almacenar, consultar y analizar los datos. Por ejemplo, cuando tu instrumentación envía telemetría a tu Google Cloud proyecto Google Cloud , puedes usar Google Cloud Observability para ver y analizar esos datos.

Te recomendamos que instrumentes tu aplicación con OpenTelemetry, un proyecto de código abierto que proporciona un framework unificado para la instrumentación de aplicaciones. Los ejemplos que proporcionamos se basan en OpenTelemetry.

Para obtener información sobre la instrumentación, consulta los siguientes documentos:

  • En Recoger y ver peticiones y respuestas multimodales se describe cómo configurar un agente de IA generativa creado con ADK para recoger peticiones y respuestas multimodales. También se describe cómo hacer lo siguiente:

    • Consulta las peticiones y las respuestas en la página Explorador de trazas.
    • Analiza las peticiones y las respuestas con BigQuery.
    • Evalúa las peticiones y las respuestas con el SDK de Vertex AI para Python.
  • En Instrumentar un agente ReAct de LangGraph con OpenTelemetry se describe cómo usar OpenTelemetry para instrumentar una aplicación de IA generativa que usa el framework LangChain o LangGraph. También incluye un enlace a una aplicación de ejemplo que puedes cargar y ejecutar.

  • En Instrumentar aplicaciones ADK con OpenTelemetry se describe cómo habilitar la instrumentación integrada que recoge telemetría de las acciones clave del agente. La telemetría incluye peticiones de texto y respuestas de agentes. También incluye un enlace a una aplicación de ejemplo que puedes cargar y ejecutar.

Cómo ver tus peticiones y respuestas

Cloud Trace está configurado para extraer eventos de los intervalos escritos por aplicaciones de IA generativa, siempre que los intervalos cumplan las convenciones semánticas de OpenTelemetry para los intervalos de IA generativa e incluyan atributos o eventos que sigan las convenciones semánticas para los eventos de IA generativa.

Cloud Trace también puede mostrar peticiones y respuestas multimodales. En este caso, tus peticiones y respuestas no se adjuntan a tus datos de seguimiento. En su lugar, se almacenan en un segmento de Cloud Storage. Para obtener más información sobre esta configuración, consulta Recoger y ver peticiones y respuestas multimodales.