Cas d'utilisation de l'IA agentive : automatiser les workflows de data science

Last reviewed 2025-12-08 UTC

Ce document décrit une architecture de haut niveau pour une application qui exécute un workflow de data science afin d'automatiser des tâches complexes d'analyse de données et de machine learning.

Cette architecture utilise des ensembles de données hébergés dans BigQuery ou AlloyDB pour PostgreSQL. Il s'agit d'un système multi-agent qui permet aux utilisateurs d'exécuter des actions à l'aide de commandes en langage naturel et qui élimine le besoin d'écrire du code SQL ou Python complexe.

Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA agentique. Cette architecture permet aux équipes commerciales et de données d'analyser des métriques dans un large éventail de secteurs, tels que le commerce de détail, la finance et la fabrication. Ce document suppose une compréhension de base des systèmes d'IA agentique. Pour savoir en quoi les agents diffèrent des systèmes non agentiques, consultez Quelle est la différence entre les agents IA, les assistants IA et les bots ?

La section Déploiement de ce document fournit des liens vers des exemples de code pour vous aider à tester le déploiement d'une application d'IA agentique qui exécute un workflow de data science.

Architecture

Le schéma suivant présente l'architecture d'un agent de workflow de data science.

Architecture d'un agent de workflow de data science.

Cette architecture comprend les composants suivants :

Composant Description
Interface Les utilisateurs interagissent avec le système multi-agent via une interface, telle qu' une interface de chat, qui s'exécute en tant que service sans serveur Cloud Run.
Agents Cette architecture utilise les agents suivants :
  • Agent racine : agent coordinateur qui reçoit les requêtes du service frontend. L'agent racine interprète la requête de l'utilisateur et tente de la résoudre lui-même. Si la tâche nécessite des outils spécialisés, l'agent racine délègue la requête à l'agent spécialisé approprié.
  • Agent spécialisé : l'agent racine appelle les agents spécialisés suivants à l'aide de la fonctionnalité "Agent as a tool" (Agent en tant qu'outil).
    • Agent d'analyse : agent spécialisé dans l'analyse et la visualisation des données. L'agent d'analyse utilise le modèle d'IA pour générer et exécuter du code Python afin de traiter des ensembles de données, de créer des graphiques et d'effectuer des analyses statistiques.
    • Agent AlloyDB pour PostgreSQL : agent spécialisé agent pour interagir avec les données dans AlloyDB pour PostgreSQL. L'agent utilise le modèle d'IA pour interpréter la requête de l'utilisateur et générer du code SQL dans le dialecte PostgreSQL. L'agent se connecte de manière sécurisée à la base de données à l'aide de MCP Toolbox for Databases, puis exécute la requête pour récupérer les données demandées.
    • Agent BigQuery : agent spécialisé agent pour interagir avec les données dans BigQuery. L'agent utilise le modèle d'IA pour interpréter la requête de l'utilisateur et générer GoogleSQL. L' agent se connecte à la base de données à l'aide de l'outil BigQuery intégré à Agent Development Kit (ADK)'s, puis exécute la requête pour récupérer les données demandées.
  • Agent BigQuery ML : sous-agent de l'agent racine dédié aux workflows de machine learning. L'agent interagit avec BigQuery ML pour gérer le cycle de vie de bout en bout du ML. L'agent peut créer et entraîner des modèles, exécuter des évaluations et générer des prédictions en fonction des requêtes des utilisateurs.
Environnement d'exécution des agents Les agents d'IA de cette architecture sont déployés en tant que services Cloud Run sans serveur.
ADK ADK fournit des outils et un framework pour développer, tester et déployer des agents. ADK élimine la complexité de la création d'agents et permet aux développeurs d'IA de se concentrer sur la logique et les capacités de l'agent.
Modèle d'IA et environnements d'exécution de modèles Pour le service d'inférence, les agents de cet exemple d'architecture utilisent le dernier modèle Gemini sur Vertex AI.

Produits utilisés

Cet exemple d'architecture utilise les produits et outils suivants, qui sont open source : Google Cloud

  • Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
  • Agent Development Kit (ADK) : ensemble d'outils et de bibliothèques permettant de développer, tester et déployer des agents d'IA.
  • Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
  • Gemini: famille de modèles d'IA multimodaux développés par Google.
  • BigQuery : entrepôt de données d'entreprise qui vous aide à gérer et analyser vos données grâce à des fonctionnalités intégrées telles que l'analyse géospatiale du machine learning et l'informatique décisionnelle.
  • AlloyDB pour PostgreSQL : service de base de données entièrement géré compatible avec PostgreSQL conçu pour vos charges de travail les plus exigeantes, y compris le traitement hybride transactionnel et analytique.
  • MCP Toolbox for Databases : serveur Model Context Protocol (MCP) Open Source qui permet aux agents d'IA de se connecter de manière sécurisée aux bases de données en gérant les complexités de la base de données, telles que le regroupement de connexions, l'authentification et l'observabilité.

Déploiement

Pour déployer un exemple de mise en œuvre de cette architecture, utilisez Data Science with Multiple Agents. Le dépôt fournit deux exemples d'ensembles de données pour illustrer la flexibilité du système, y compris un ensemble de données sur les vols pour l'analyse opérationnelle et un ensemble de données sur les ventes d'e-commerce pour l'analyse de données commerciales.

Étape suivante

Contributeurs

Auteur : Samantha He | Rédactrice technique

Autres contributeurs :