Instrumenter des applications d'IA générative

Ce document décrit l'intérêt d'instrumenter vos applications d'IA générative. Il résume également comment instrumenter une application qui utilise les frameworks LangGraph ou Agent Development Kit (ADK). Les deux frameworks vous permettent de collecter des requêtes textuelles. Toutefois, le framework ADK vous permet également de collecter et d'afficher des requêtes et des réponses multimodales.

À propos des agents d'IA générative

Les applications qui utilisent l'IA générative s'appuient sur des agents pour effectuer des tâches ou atteindre des objectifs. Les agents sont des applications qui effectuent des tâches ou poursuivent des objectifs pour le compte d'un utilisateur. Par exemple, un agent d'IA générative peut parcourir un site Web et émettre des commandes d'API. Ces commandes d'API peuvent récupérer des informations ou effectuer une action.

Les agents agissent de manière autonome et utilisent le raisonnement pour déterminer comment décomposer un objectif ou une tâche en sous-tâches, puis pour déterminer les outils à utiliser pour accomplir ces sous-tâches. Dans le contexte de l'IA générative, les outils déterminent la façon dont l'agent peut interagir avec son environnement. Par exemple, un agent peut disposer d'un outil lui permettant d'émettre des commandes d'API.

Pour en savoir plus sur les agents, consultez les ressources suivantes :

Pourquoi instrumenter vos applications d'IA générative ?

L'instrumentation de vos applications d'IA générative est le seul moyen de comprendre le raisonnement utilisé par les agents autonomes. Ce processus de raisonnement n'est pas déterministe.

Lorsque vous instrumentez une application d'IA générative, les données de télémétrie incluent les décisions et les actions des agents. Vous pouvez utiliser ces données pour valider ou améliorer votre application.

Instrumenter vos applications d'IA générative

Pour instrumenter votre application, vous devez générer des données de télémétrie et les envoyer à l'emplacement où les données peuvent être stockées, interrogées et analysées. Par exemple, lorsque votre instrumentation envoie des données de télémétrie à votre projet Google Cloud , vous pouvez utiliser Google Cloud Observability pour afficher et analyser ces données.

Nous vous recommandons d'instrumenter votre application avec OpenTelemetry, un projet Open Source qui fournit un framework unifié pour l'instrumentation d'applications. Les exemples que nous fournissons s'appuient sur OpenTelemetry.

Pour en savoir plus sur l'instrumentation, consultez les documents suivants :

  • Collecter et afficher des requêtes et des réponses multimodales explique comment configurer un agent d'IA générative créé avec l'ADK pour collecter des requêtes et des réponses multimodales. Il explique également comment effectuer les opérations suivantes :

    • Affichez les requêtes et les réponses sur la page Explorateur Trace.
    • Analysez les requêtes et les réponses avec BigQuery.
    • Évaluez les requêtes et les réponses avec le SDK Vertex AI pour Python.
  • Instrumenter un agent LangGraph ReAct avec OpenTelemetry explique comment utiliser OpenTelemetry pour instrumenter une application d'IA générative qui utilise le framework LangChain ou LangGraph. Il fournit également un lien vers un exemple d'application que vous pouvez charger et exécuter.

  • Instrumenter les applications ADK avec OpenTelemetry explique comment activer l'instrumentation intégrée qui collecte la télémétrie des actions clés de l'agent. La télémétrie inclut les requêtes textuelles et les réponses de l'agent. Il fournit également un lien vers un exemple d'application que vous pouvez charger et exécuter.

Afficher vos requêtes et vos réponses

Cloud Trace est configuré pour extraire les événements des spans écrits par les applications d'IA générative, à condition que les spans respectent les conventions sémantiques OpenTelemetry pour les spans d'IA générative et incluent des attributs ou des événements qui suivent les conventions sémantiques pour les événements d'IA générative.

Cloud Trace peut également afficher les requêtes et les réponses multimodales. Dans ce scénario, vos requêtes et vos réponses ne sont pas associées à vos données de trace. Au lieu de cela, ils sont stockés dans un bucket Cloud Storage. Pour en savoir plus sur cette configuration, consultez Collecter et afficher les requêtes et réponses multimodales.