Cas d'utilisation de l'IA agentive : automatiser les workflows de data science

Ce document décrit une architecture de haut niveau pour une application qui exécute un workflow de science des données afin d'automatiser des tâches complexes d'analyse de données et de machine learning.

Cette architecture utilise des ensembles de données hébergés dans BigQuery ou AlloyDB pour PostgreSQL. L'architecture est un système multi-agents qui permet aux utilisateurs d'exécuter des actions à l'aide de commandes en langage naturel. Elle élimine la nécessité d'écrire du code SQL ou Python complexe.

Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA agentique. Cette architecture permet aux équipes commerciales et de données d'analyser les métriques dans un large éventail de secteurs, tels que le commerce, la finance et l'industrie. Dans ce document, nous partons du principe que vous possédez des connaissances de base sur les systèmes d'IA agentive. Pour en savoir plus sur la différence entre les agents et les systèmes non agentiques, consultez Quelle est la différence entre les agents IA, les assistants IA et les bots ?

La section Déploiement de ce document fournit des liens vers des exemples de code pour vous aider à expérimenter le déploiement d'une application d'IA agentique qui exécute un workflow de science des données.

Architecture

Le diagramme suivant illustre l'architecture d'un agent de workflow de science des données.

Architecture d'un agent de workflow de data science.

Cette architecture comprend les composants suivants :

Composant Description
Interface Les utilisateurs interagissent avec le système multi-agents via une interface utilisateur, telle qu'une interface de chat, qui s'exécute en tant que service Cloud Run sans serveur.
Agents Cette architecture utilise les agents suivants :
  • Agent racine : agent coordinateur qui reçoit les requêtes du service de frontend. L'agent racine interprète la demande de l'utilisateur et tente de la résoudre lui-même. Si la tâche nécessite des outils spécialisés, l'agent racine délègue la requête à l'agent spécialisé approprié.
  • Agent spécialisé : l'agent racine appelle les agents spécialisés suivants à l'aide de la fonctionnalité agent en tant qu'outil.
    • Agent d'analyse : agent spécialisé dans l'analyse et la visualisation des données. L'agent d'analyse utilise le modèle d'IA pour générer et exécuter du code Python afin de traiter les ensembles de données, de créer des graphiques et d'effectuer des analyses statistiques.
    • Agent AlloyDB pour PostgreSQL : agent spécialisé permettant d'interagir avec les données dans AlloyDB pour PostgreSQL. L'agent utilise le modèle d'IA pour interpréter la demande de l'utilisateur et générer du code SQL dans le dialecte PostgreSQL. L'agent se connecte de manière sécurisée à la base de données à l'aide de MCP Toolbox for Databases, puis exécute la requête pour récupérer les données demandées.
    • Agent BigQuery : agent spécialisé pour interagir avec les données dans BigQuery. L'agent utilise le modèle d'IA pour interpréter la demande de l'utilisateur et générer des requêtes GoogleSQL. L'agent se connecte à la base de données à l'aide de l'outil BigQuery intégré à Agent Development Kit (ADK), puis exécute la requête pour récupérer les données demandées.
  • Agent BigQuery ML : sous-agent de l'agent racine dédié aux workflows de machine learning. L'agent interagit avec BigQuery ML pour gérer le cycle de vie du ML de bout en bout. L'agent peut créer et entraîner des modèles, exécuter des évaluations et générer des prédictions en fonction des demandes des utilisateurs.
Environnement d'exécution des agents Les agents d'IA de cette architecture sont déployés en tant que services Cloud Run sans serveur.
ADK ADK fournit des outils et un framework pour développer, tester et déployer des agents. ADK abstrait la complexité de la création d'agents et permet aux développeurs d'IA de se concentrer sur la logique et les capacités de l'agent.
Modèle d'IA et environnements d'exécution de modèles Pour la diffusion d'inférences, les agents de cet exemple d'architecture utilisent le dernier modèle Gemini sur Vertex AI.

Produits utilisés

Cette architecture exemple utilise les produits et outils Google Cloud et Open Source suivants :

  • Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
  • Agent Development Kit (ADK) : ensemble d'outils et de bibliothèques permettant de développer, de tester et de déployer des agents d'IA.
  • Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
  • Gemini: famille de modèles d'IA multimodaux développés par Google.
  • BigQuery : entrepôt de données d'entreprise qui vous aide à gérer et analyser vos données grâce à des fonctionnalités intégrées telles que l'analyse géospatiale du machine learning et l'informatique décisionnelle.
  • AlloyDB pour PostgreSQL : service de base de données entièrement géré compatible avec PostgreSQL, conçu pour vos charges de travail les plus exigeantes, y compris le traitement hybride transactionnel et analytique.
  • MCP Toolbox for Databases : serveur MCP (Model Context Protocol) Open Source qui permet aux agents d'IA de se connecter de manière sécurisée aux bases de données en gérant les complexités associées, comme le regroupement de connexions, l'authentification et l'observabilité.

Déploiement

Pour déployer un exemple d'implémentation de cette architecture, utilisez Data Science with Multiple Agents. Le dépôt fournit deux exemples de jeux de données pour illustrer la flexibilité du système, y compris un jeu de données sur les vols pour l'analyse opérationnelle et un jeu de données sur les ventes d'e-commerce pour l'analyse commerciale.

Étapes suivantes

Contributeurs

Auteur : Samantha He | Rédactrice technique

Autres contributeurs :