Environnement d'exécution de l'agent

Agent Runtime est un ensemble de services qui permet aux développeurs de déployer, de gérer et de faire évoluer des agents IA en production. Agent Runtime gère l'infrastructure pour faire évoluer les agents en production, ce qui vous permet de vous concentrer sur la création d'applications. L'environnement d'exécution de l'agent propose les services suivants, que vous pouvez utiliser individuellement ou en combinaison :

  • Runtime :
    • Déployez et mettez à l'échelle des agents grâce à un environnement d'exécution géré et à des fonctionnalités de gestion de bout en bout.
    • Personnalisez l'image de conteneur de l'agent avec des scripts d'installation au moment de la compilation pour les dépendances système.
    • Utilisez des fonctionnalités de sécurité, y compris la conformité VPC-SC et la configuration de l'authentification et d'IAM.
    • Accédez à des modèles et des outils tels que l'appel de fonction.
    • Déployez des agents créés à l'aide de différents frameworks Python et du protocole ouvert Agent2Agent.
  • Qualité et évaluation (preview) : évaluez la qualité des agents avec le service d'évaluation de l'IA générative intégré et optimisez les agents avec les exécutions d'entraînement du modèle Gemini.
  • Sessions de la plate-forme d'agent : les sessions de la plate-forme d'agent vous permettent de stocker les interactions individuelles entre les utilisateurs et les agents, en fournissant des sources définitives pour le contexte de la conversation.
  • Banque de mémoire Agent Platform : la banque de mémoire Agent Platform du runtime d'agent vous permet de stocker et de récupérer des informations à partir de sessions pour personnaliser les interactions avec l'agent.
  • Exécution de code : l'exécution de code dans l'environnement d'exécution de l'agent permet à votre agent d'exécuter du code dans un environnement de bac à sable sécurisé, isolé et géré.
  • Example Store (aperçu) : stockez et récupérez dynamiquement des exemples few-shot pour améliorer les performances de l'agent.
  • Observabilité : comprenez le comportement de l'agent avec Google Cloud Trace (compatible avec OpenTelemetry), Cloud Monitoring et Cloud Logging.
  • Gouvernance : Agent Runtime est compatible avec plusieurs fonctionnalités qui vous aident à gérer les agents en production et à répondre à vos besoins en termes de sécurité et d'entreprise :
    • Détecter les menaces avec Security Command Center : Agent Runtime Threat Detection (aperçu) est un service intégré à Security Command Center qui vous aide à détecter et à examiner les attaques potentielles sur les agents déployés dans Agent Runtime.
    • Identité de l'agent (preview) : utilisez l'identité de l'agent Identity and Access Management (IAM) pour bénéficier de fonctionnalités de sécurité et de gestion des accès lorsque vous utilisez des agents sur Agent Runtime.
    • Passerelle d'agent (aperçu) : utilisez la passerelle d'agent pour définir des règles pour les communications agentiques et appliquer des règles de sécurité et de contrôle des accès aux agents, aux clients et aux outils qui se connectent à votre projetGoogle Cloud .

Créer et déployer sur Agent Runtime

Voici le workflow pour créer un agent sur Agent Runtime :

  1. Configurer l'environnement : configurez votre projet Google et installez la dernière version du SDK Agent Platform pour Python.
  2. Développer un agent : développez un agent pouvant être déployé sur Agent Runtime.
  3. Déployez l'agent : déployez l'agent sur l'environnement d'exécution géré Agent Runtime.
  4. Utiliser l'agent : interrogez l'agent en envoyant une requête API.
  5. Gérer l'agent déployé : gérez et supprimez les agents que vous avez déployés sur Agent Runtime.

Les étapes sont illustrées dans le schéma suivant :

Créer et déployer un agent 

Frameworks compatibles

Le tableau suivant décrit le niveau de compatibilité de l'environnement d'exécution de l'agent avec différents frameworks d'agents :

Niveau d'assistance Frameworks d'agents
Modèle personnalisé : vous pouvez adapter un modèle personnalisé pour prendre en charge le déploiement sur Agent Runtime à partir de votre framework. CrewAI, frameworks personnalisés
Intégration du SDK Agent Platform : Agent Runtime fournit des modèles gérés par framework dans le SDK Agent Platform et la documentation. AG2, LlamaIndex
Intégration complète : les fonctionnalités sont intégrées pour fonctionner dans le framework, l'environnement d'exécution de l'agent et l'écosystème Google Cloud au sens large. Agent Development Kit (ADK), LangChain, LangGraph

Déployer en production avec la CLI Agents

L'interface de ligne de commande (CLI) Agents est l'interface de ligne de commande et l'ensemble de compétences unifiés pour la plate-forme Gemini Enterprise Agent. Il fournit aux agents de codage et aux développeurs un chemin prévisible tout au long du cycle de vie du développement d'agents : échafaudage, évaluation, déploiement, publication et observation. La CLI Agents fournit les éléments suivants :

  • Modèles d'agents prédéfinis : ReAct, RAG, multi-agents et autres modèles.
  • Playground interactif : testez votre agent et interagissez avec lui.
  • Infrastructure automatisée : utilise Terraform pour une gestion simplifiée des ressources.
  • Pipelines CI/CD : workflows de déploiement automatisés utilisant Cloud Build.
  • Observabilité : compatibilité intégrée avec Cloud Trace et Cloud Logging.

Pour commencer, consultez le guide de démarrage rapide.

Cas d'utilisation

Pour en savoir plus sur Agent Runtime avec des exemples de bout en bout, consultez les ressources suivantes :

Cliquer pour développer les cas d'utilisation

Cas d'utilisation Description Liens
Créer des agents en se connectant à des API publiques Convertissez des devises.

Créez une fonction qui se connecte à une application de change de devises pour permettre au modèle de fournir des réponses précises à des requêtes telles que "Quel est le taux de change de l'euro par rapport au dollar aujourd'hui ?"
Notebook SDK Agent Platform (Python) : présentation de la création et du déploiement d'un agent avec Agent Runtime
Concevoir un projet d'énergie solaire communautaire.

 Identifiez des emplacements potentiels, recherchez les organismes gouvernementaux et les fournisseurs concernés, et examinez les images satellite et le potentiel solaire des régions et des bâtiments pour trouver l'emplacement optimal pour installer vos panneaux solaires.
Notebook du SDK Agent Platform (Python) : créer et déployer un agent de l'API Google Maps avec Agent Runtime
Créer des agents en se connectant à des bases de données Intégration à AlloyDB et Cloud SQL pour PostgreSQL. Article de blog : annonce de LangChain sur la plate-forme d'agents Gemini Enterprise pour AlloyDB et Cloud SQL pour PostgreSQL

Notebook du SDK Agent Platform (Python) : déployer une application RAG avec Cloud SQL pour PostgreSQL vers Agent Runtime

Notebook du SDK Agent Platform (Python) : déployer une application RAG avec AlloyDB pour PostgreSQL vers Agent Runtime
Créez des agents avec des outils qui accèdent aux données de votre base de données. Notebook SDK Agent Platform (Python) : déployer un agent avec Agent Runtime et MCP Toolbox for Databases
Interrogez et comprenez les magasins de données structurées en langage naturel. Notebook du SDK Agent Platform (Python) : créer un agent de recherche conversationnel avec Agent Runtime et le RAG dans Agent Search
Interroger et comprendre des bases de données orientées graphe en langage naturel Article de blog : GraphRAG GenAI et agents d'IA utilisant Agent Runtime avec LangChain et Neo4j
Interroger et comprendre des magasins de vecteurs en langage naturel Article de blog : Simplifier la génération augmentée par récupération (RAG) de l'IA générative avec MongoDB Atlas et Agent Runtime
Créer des agents avec Agent Development Kit Créez et déployez des agents à l'aide d'Agent Development Kit. Agent Development Kit : déployer sur Agent Runtime
Créer des agents avec des frameworks OSS Créez et déployez des agents à l'aide du framework Open Source Onetwo. Article de blog : OneTwo et Agent Runtime : explorer le développement d'agents d'IA avancée sur Google Cloud
Créer et déployer des agents à l'aide du framework Open Source LangGraph. Notebook du SDK Agent Platform (Python) : créer et déployer une application LangGraph avec Agent Runtime
Déboguer et optimiser les agents Créer et tracer des agents à l'aide d'OpenTelemetry et de Cloud Trace Notebook SDK Agent Platform (Python) : débogage et optimisation des agents : guide de traçage dans Agent Runtime
Créer des systèmes multi-agents avec le protocole A2A (preview) Créez des agents interopérables qui communiquent et collaborent avec d'autres agents, quel que soit leur framework. Pour en savoir plus, consultez la documentation sur le protocole A2A.

Sécurité d'entreprise

L'environnement d'exécution de l'agent est compatible avec plusieurs fonctionnalités qui vous aident à répondre aux exigences de sécurité de l'entreprise, à respecter les règles de sécurité de votre organisation et à suivre les bonnes pratiques de sécurité. Les fonctionnalités suivantes sont disponibles :

  • VPC Service Controls : Agent Runtime est compatible avec VPC Service Controls pour renforcer la sécurité des données et limiter les risques d'exfiltration de données. Lorsque VPC Service Controls est configuré, l'agent déployé conserve un accès sécurisé aux API et services Google, tels que l'API BigQuery, l'API Cloud SQL Admin et l'API Agent Platform, ce qui garantit un fonctionnement fluide dans le périmètre que vous avez défini. De manière critique, VPC Service Controls bloque efficacement tout accès à l'Internet public, limitant le déplacement des données aux limites de votre réseau autorisé et améliorant considérablement votre posture de sécurité d'entreprise.

    VPC Service Controls n'est pas compatible avec Agent Gateway. Toutefois, vous pouvez utiliser des contraintes de règle d'administration personnalisées pour limiter les passerelles pouvant être associées à vos agents. Pour en savoir plus, consultez Router le trafic via Agent Gateway.

  • Interface Private Service Connect : pour Agent Runtime, PSC-I permet à vos agents d'interagir avec des services hébergés de manière privée dans le VPC d'un utilisateur. Pour en savoir plus, consultez Utiliser l'interface Private Service Connect avec Agent Runtime.

  • Clés de chiffrement gérées par le client (CMEK) : Agent Runtime est compatible avec les CMEK pour protéger vos données avec vos propres clés de chiffrement. Vous possédez ainsi les clés qui protègent vos données au repos dans Google Cloudet les contrôlez entièrement. Pour en savoir plus, consultez CMEK de l'environnement d'exécution de l'agent.

  • Résidence des données (DRZ) : Agent Runtime est compatible avec la résidence des données (DRZ) pour garantir que toutes les données au repos sont stockées dans la région spécifiée.

  • HIPAA : en tant que partie de la plate-forme d'agent, Agent Runtime est compatible avec les charges de travail HIPAA.

  • Access Transparency : Access Transparency vous fournit des journaux qui enregistrent les actions effectuées par le personnel de Google lorsqu'il accède à votre contenu. Pour savoir comment activer Access Transparency pour Agent Runtime, consultez Access Transparency dans Agent Platform.

Le tableau suivant indique les fonctionnalités de sécurité d'entreprise compatibles avec chaque service Agent Platform :

Fonctionnalité de sécurité Environnement d'exécution de l'agent Sessions Banque de mémoire Example Store Exécution de code
VPC Service Controls Oui Oui Oui Non Oui
Clés de chiffrement gérées par le client Oui Oui Oui Non Oui
Résidence des données (DRZ) au repos Oui Oui Oui Non Oui
HIPAA Oui Oui Oui Oui Oui
Access Transparency Oui Oui Oui Non Non
Access Approval Oui Oui Oui Non Non

Régions où le service est disponible

Consultez Emplacements pour obtenir la liste des régions compatibles avec Agent Runtime.

Quota

Pour en savoir plus sur les quotas d'Agent Runtime, consultez Quotas et limites du système.

Tarifs

Une version sans frais est disponible pour Agent Runtime. Pour en savoir plus sur les tarifs d'Agent Runtime, consultez la page Tarifs de Gemini Enterprise Agent Platform.

Migration vers le SDK basé sur le client

Le module agent_engines du SDK Agent Platform est en cours de refactorisation pour adopter une conception basée sur le client, et ce pour les raisons clés suivantes :

  • Pour s'aligner sur l'Agent Development Kit (ADK) et le SDK Google Gen AI dans les représentations de types canoniques. Cela garantit une représentation cohérente et standardisée des types de données dans différents SDK, ce qui simplifie l'interopérabilité et réduit les frais généraux de conversion.
  • Pour la définition du champ d'application au niveau du client des paramètres Google Cloud dans les applications multiprojets et multilocales. Cela permet à une application de gérer les interactions avec les ressources de différents projets Google Cloud et zones géographiques en configurant chaque instance cliente avec ses propres paramètres de projet et de localisation.
  • Pour améliorer la visibilité et la cohérence des services Agent Runtime

Étapes suivantes

Guide

Configurez votre environnement pour utiliser Agent Platform Runtime.

Ressource

Obtenez de l'aide pour le développement sur Agent Platform.