Cas d'utilisation de l'IA agentive : orchestrer l'accès à des systèmes d'entreprise disparates

Ce document fournit une architecture de haut niveau pour un système d'IA agentique permettant d'orchestrer les interactions avec différents systèmes d'entreprise. Un agent d'orchestration automatise les processus complexes et unifie l'accès à plusieurs systèmes d'entreprise grâce à des interfaces conversationnelles modernes. Il peut s'agir d'applications commerciales tierces ou de systèmes internes propriétaires. Cette approche de conception élimine les intégrations système point à point, ce qui permet à vos opérateurs d'éviter de changer constamment de contexte (traitement swivel-chair).

Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA agentique dans le cloud. Ce document part du principe que vous disposez de connaissances de base sur l'IA agentique.

Architecture

Le diagramme suivant illustre une architecture multicouche dans laquelle un agent d'orchestration utilise l'IA pour acheminer les interactions client provenant de plusieurs canaux vers les systèmes de backend appropriés.

Architecture d'une application d'IA agentive qui orchestre l'accès à des systèmes d'entreprise disparates. Architecture d'une application d'IA agentive qui orchestre l'accès à des systèmes d'entreprise disparates.

Les composants de l'architecture sont organisés dans les couches suivantes :

intégrée Composants
Chaînes interactives

Dans l'architecture d'exemple, les clients interagissent avec le système d'IA agentique via les canaux suivants :

  • Une interface personnalisée, telle qu'une application Web qui communique avec l'agent via une API REST sécurisée et qui prend en charge les processus avec intervention humaine.
  • Interface de chat ad hoc sur Gemini Enterprise qui appelle l'agent en tant qu'outil sécurisé et permet aux utilisateurs d'interagir avec des systèmes backend complexes en langage naturel.
  • Application externe qui lance des workflows d'automatisation de système à système en publiant des événements métier dans un sujet Pub/Sub.
Noyau agentif

Le composant principal de l'architecture est un agent d'orchestration créé à l'aide de l'Agent Development Kit (ADK) et déployé sur Cloud Run. L'orchestrateur gère un système multi-agents. Cette plate-forme sans serveur offre une évolutivité et un contrôle des accès à l'aide d'Identity and Access Management (IAM) pour l'API REST de l'agent.

Pour conserver l'état des tâches en plusieurs étapes, l'agent utilise la prise en charge ADK intégrée pour persister les données d'état dans le service de session Vertex AI ou Cloud Storage.

Intégration standardisée aux systèmes de backend

Pour la communication entre l'agent et les systèmes de backend, l'architecture utilise des serveurs MCP (Model Context Protocol) déployés sur Cloud Run.

  • MCP Toolbox for Databases fournit un ensemble d'outils sécurisés et prêts à l'emploi pour accéder à des bases de données telles que Cloud SQL.
  • Les serveurs MCP personnalisés permettent d'accéder aux applications de backend.

Chaque serveur MCP expose l'API d'un système de backend spécifique sous la forme d'un ensemble d'outils standardisés. Les serveurs MCP forment une couche anti-corruption qui isole l'agent des systèmes de backend. Cette approche permet d'éviter un couplage étroit de l'agent avec les systèmes de backend. Elle simplifie la logique de l'agent et vous permet de moderniser les systèmes de backend indépendamment de l'agent.

Systèmes de backend

Dans l'exemple d'architecture, l'agent d'IA orchestre l'accès aux systèmes de backend suivants :

  • Une base de données opérationnelle dans Cloud SQL.
  • Application déployée sur des VM Compute Engine.
  • Une application qui s'exécute en dehors de Google Cloud.

Produits utilisés

Cette architecture d'exemple utilise les produits Google Cloud suivants :

  • Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
  • Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
  • Pub/Sub : service de messagerie asynchrone et évolutif qui dissocie les services qui produisent des messages des services qui traitent ces messages.
  • Gemini Enterprise : plate-forme sécurisée et entièrement gérée permettant de déployer et de gérer des agents IA dans une entreprise.
  • Gemini: famille de modèles d'IA multimodaux développés par Google.
  • Cloud Storage : store d'objets économique et sans limite pour tout type de données. Les données sont accessibles depuis et en dehors de Google Cloud, et sont répliquées sur plusieurs emplacements à des fins de redondance.
  • Cloud SQL : service de base de données relationnelle entièrement géré qui vous aide à provisionner, exploiter et gérer vos bases de données MySQL, PostgreSQL et SQL Server sur Google Cloud.

Cas d'utilisation

Cette architecture est utile pour les cas d'utilisation suivants :

  • Automatisez le traitement des données entre différentes applications externes et internes.
  • Créez une interface unifiée pour plusieurs anciens systèmes sans migration à grande échelle.
  • Ajoutez des fonctionnalités conversationnelles et intelligentes aux processus métier existants.
  • Modernisez progressivement vos applications avec des fonctionnalités axées sur les événements.

Cette architecture offre les avantages suivants :

  • Productivité : automatisez les tâches répétitives pour réduire les erreurs humaines et permettre à vos équipes de se concentrer sur les tâches à valeur ajoutée.
  • Évolutivité : utilisez une approche axée sur les événements pour développer, déployer et faire évoluer les services de manière indépendante.
  • Expérience utilisateur améliorée : créez des interfaces modernes et flexibles pour intégrer des processus métier complexes.
  • Intégration pérenne : standardisez l'intégration aux systèmes de backend à l'aide des serveurs MCP. Vous pourrez ainsi remplacer et mettre à niveau les systèmes de backend de manière indépendante.

Considérations de conception

Pour implémenter cette architecture en production, tenez compte des recommandations suivantes :

  • Sécurité : pour les services Cloud Run, utilisez des comptes de service IAM dédiés avec des autorisations basées sur le principe du moindre privilège. Sécurisez l'API de l'agent en configurant les contrôles d'entrée Cloud Run pour limiter l'accès aux appelants authentifiés.
  • Observabilité : dans les systèmes distribués, la journalisation et le traçage sont essentiels pour résoudre les problèmes. Pour obtenir de la visibilité sur l'ensemble du workflow agentique, instrumentez vos services pour écrire des journaux structurés dans Cloud Logging et émettre des traces dans Cloud Trace.
  • Performances : Cloud Run effectue un scaling automatique en fonction de la demande et passe à zéro instance en l'absence de charge. Pour les applications sensibles à la latence, vous pouvez réduire les démarrages à froid en configurant un nombre minimal d'instances.
  • Automatisation du déploiement : automatisez le provisionnement et la gestion des ressources à l'aide d'un outil Infrastructure as Code (IaC) tel que Terraform. L'IaC permet de garantir des déploiements reproductibles et auditables dans les environnements de développement, de préproduction et de production.
  • Gouvernance : simplifiez la conception et le déploiement de l'infrastructure de votre application à l'aide d'App Design Center. Vous pouvez utiliser le centre de conception d'applications pour définir des modèles qui intègrent des règles de gouvernance et des bonnes pratiques pour votre organisation.

Étapes suivantes

Contributeurs

Auteur : Casey West | Architecture Advocate, Google Cloud

Autres contributeurs :