Ce document fournit une architecture de haut niveau pour un système d'IA agentique permettant d'orchestrer les interactions avec différents systèmes d'entreprise. Un agent d'orchestration automatise les processus complexes et unifie l'accès à plusieurs systèmes d'entreprise grâce à des interfaces conversationnelles modernes. Il peut s'agir d'applications commerciales tierces ou de systèmes internes propriétaires. Cette approche de conception élimine les intégrations système point à point, ce qui permet à vos opérateurs d'éviter de changer constamment de contexte (traitement swivel-chair).
Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA agentique dans le cloud. Ce document part du principe que vous disposez de connaissances de base sur l'IA agentique.
Architecture
Le diagramme suivant illustre une architecture multicouche dans laquelle un agent d'orchestration utilise l'IA pour acheminer les interactions client provenant de plusieurs canaux vers les systèmes de backend appropriés.
Les composants de l'architecture sont organisés dans les couches suivantes :
| intégrée | Composants |
|---|---|
| Chaînes interactives | Dans l'architecture d'exemple, les clients interagissent avec le système d'IA agentique via les canaux suivants :
|
| Noyau agentif | Le composant principal de l'architecture est un agent d'orchestration créé à l'aide de l'Agent Development Kit (ADK) et déployé sur Cloud Run. L'orchestrateur gère un système multi-agents. Cette plate-forme sans serveur offre une évolutivité et un contrôle des accès à l'aide d'Identity and Access Management (IAM) pour l'API REST de l'agent. Pour conserver l'état des tâches en plusieurs étapes, l'agent utilise la prise en charge ADK intégrée pour persister les données d'état dans le service de session Vertex AI ou Cloud Storage. |
| Intégration standardisée aux systèmes de backend | Pour la communication entre l'agent et les systèmes de backend, l'architecture utilise des serveurs MCP (Model Context Protocol) déployés sur Cloud Run.
Chaque serveur MCP expose l'API d'un système de backend spécifique sous la forme d'un ensemble d'outils standardisés. Les serveurs MCP forment une couche anti-corruption qui isole l'agent des systèmes de backend. Cette approche permet d'éviter un couplage étroit de l'agent avec les systèmes de backend. Elle simplifie la logique de l'agent et vous permet de moderniser les systèmes de backend indépendamment de l'agent. |
| Systèmes de backend | Dans l'exemple d'architecture, l'agent d'IA orchestre l'accès aux systèmes de backend suivants :
|
Produits utilisés
Cette architecture d'exemple utilise les produits Google Cloud suivants :
- Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
- Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
- Pub/Sub : service de messagerie asynchrone et évolutif qui dissocie les services qui produisent des messages des services qui traitent ces messages.
- Gemini Enterprise : plate-forme sécurisée et entièrement gérée permettant de déployer et de gérer des agents IA dans une entreprise.
- Gemini: famille de modèles d'IA multimodaux développés par Google.
- Cloud Storage : store d'objets économique et sans limite pour tout type de données. Les données sont accessibles depuis et en dehors de Google Cloud, et sont répliquées sur plusieurs emplacements à des fins de redondance.
- Cloud SQL : service de base de données relationnelle entièrement géré qui vous aide à provisionner, exploiter et gérer vos bases de données MySQL, PostgreSQL et SQL Server sur Google Cloud.
Cas d'utilisation
Cette architecture est utile pour les cas d'utilisation suivants :
- Automatisez le traitement des données entre différentes applications externes et internes.
- Créez une interface unifiée pour plusieurs anciens systèmes sans migration à grande échelle.
- Ajoutez des fonctionnalités conversationnelles et intelligentes aux processus métier existants.
- Modernisez progressivement vos applications avec des fonctionnalités axées sur les événements.
Cette architecture offre les avantages suivants :
- Productivité : automatisez les tâches répétitives pour réduire les erreurs humaines et permettre à vos équipes de se concentrer sur les tâches à valeur ajoutée.
- Évolutivité : utilisez une approche axée sur les événements pour développer, déployer et faire évoluer les services de manière indépendante.
- Expérience utilisateur améliorée : créez des interfaces modernes et flexibles pour intégrer des processus métier complexes.
- Intégration pérenne : standardisez l'intégration aux systèmes de backend à l'aide des serveurs MCP. Vous pourrez ainsi remplacer et mettre à niveau les systèmes de backend de manière indépendante.
Considérations de conception
Pour implémenter cette architecture en production, tenez compte des recommandations suivantes :
- Sécurité : pour les services Cloud Run, utilisez des comptes de service IAM dédiés avec des autorisations basées sur le principe du moindre privilège. Sécurisez l'API de l'agent en configurant les contrôles d'entrée Cloud Run pour limiter l'accès aux appelants authentifiés.
- Observabilité : dans les systèmes distribués, la journalisation et le traçage sont essentiels pour résoudre les problèmes. Pour obtenir de la visibilité sur l'ensemble du workflow agentique, instrumentez vos services pour écrire des journaux structurés dans Cloud Logging et émettre des traces dans Cloud Trace.
- Performances : Cloud Run effectue un scaling automatique en fonction de la demande et passe à zéro instance en l'absence de charge. Pour les applications sensibles à la latence, vous pouvez réduire les démarrages à froid en configurant un nombre minimal d'instances.
- Automatisation du déploiement : automatisez le provisionnement et la gestion des ressources à l'aide d'un outil Infrastructure as Code (IaC) tel que Terraform. L'IaC permet de garantir des déploiements reproductibles et auditables dans les environnements de développement, de préproduction et de production.
- Gouvernance : simplifiez la conception et le déploiement de l'infrastructure de votre application à l'aide d'App Design Center. Vous pouvez utiliser le centre de conception d'applications pour définir des modèles qui intègrent des règles de gouvernance et des bonnes pratiques pour votre organisation.
Étapes suivantes
- (Atelier de programmation) Déployer un serveur MCP sécurisé sur Cloud Run
- (Atelier de programmation) Créer et déployer un agent qui utilise un serveur MCP sur Cloud Run.
- (Atelier de programmation) Appeler de manière asynchrone une application d'IA agentive à l'aide d'événements.
- (Cours Google Skills) Créer des agents intelligents avec ADK
- (Exemples de code) Découvrez d'autres exemples de code sur GitHub pour créer des agents avec l'ADK.
- Pour obtenir une présentation des principes et des recommandations d'architecture spécifiques aux charges de travail d'IA et de ML dans Google Cloud, consultez la perspective de l'IA et du ML dans le framework Well-Architected.
Contributeurs
Auteur : Casey West | Architecture Advocate, Google Cloud
Autres contributeurs :
- Amina Mansour | Cadre chez Cloud Platform Evaluations
- Kumar Dhanagopal Développeur de solutions multiproduits
- Leonid Yankulin | Ingénieur relations avec les développeurs