Ce document explique comment utiliser le serveur MCP (Model Context Protocol) distant de traçabilité des données pour vous connecter à des applications d'IA, y compris Gemini CLI, ChatGPT, Claude et les applications personnalisées que vous développez. Le serveur MCP distant de traçabilité des données vous permet d'interagir avec la traçabilité des données pour interroger des graphes de traçabilité des données, découvrir la provenance des données en amont et analyser l'impact en aval. Le serveur MCP distant de l'API Data Lineage est activé lorsque vous activez l'API Data Lineage.
Le Model Context Protocol (MCP) standardise la façon dont les grands modèles de langage (LLM) et les applications ou agents d'IA se connectent à des sources de données externes. Les serveurs MCP vous permettent d'utiliser leurs outils, leurs ressources et leurs prompts pour effectuer des actions et obtenir des données mises à jour à partir de leur service backend.
Quelle est la différence entre les serveurs MCP locaux et distants ?
- Serveurs MCP locaux
- S'exécutent généralement sur votre machine locale et utilisent les flux d'entrée et de sortie standards (stdio) pour la communication entre les services sur le même appareil.
- Serveurs MCP distants
- S'exécutent sur l'infrastructure du service et proposent un point de terminaison HTTP aux applications d'IA pour la communication entre le client MCP d'IA et le serveur MCP. Pour en savoir plus sur l'architecture MCP, consultez la section Architecture MCP.
Serveurs MCP Google et Google Cloud distants
Les serveurs MCP Google et Google Cloud distants présentent les fonctionnalités et avantages suivants :- Découverte centralisée et simplifiée
- Points de terminaison HTTP mondiaux ou régionaux gérés
- Autorisations précises
- Sécurité facultative des prompts et des réponses avec la protection Model Armor
- Journalisation d'audit centralisée
Pour en savoir plus sur les autres serveurs MCP, ainsi que sur les contrôles de sécurité et de gouvernance disponibles pour les serveurs MCP Google Cloud, consultez la présentation des serveurs MCP Google Cloud.
Avant de commencer
- Connectez-vous à votre Google Cloud compte. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits sans frais pour exécuter, tester et déployer des charges de travail.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Data Lineage API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Data Lineage API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Rôles requis
Pour obtenir les autorisations nécessaires pour utiliser le serveur MCP de traçabilité des données, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet dans lequel vous souhaitez utiliser le serveur MCP de traçabilité des données :
-
Effectuer des appels d'outils MCP:
utilisateur de l'outil MCP (
roles/mcp.toolUser) -
Afficher les informations de traçabilité des données :
lecteur de la traçabilité des données (
roles/datalineage.viewer)
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Ces rôles prédéfinis contiennent les autorisations requises pour utiliser le serveur MCP de traçabilité des données. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour utiliser le serveur MCP de traçabilité des données :
-
Effectuer des appels d'outils MCP :
mcp.tools.call -
Interroger la traçabilité des données dans la recherche de liens :
datalineage.locations.searchLinks
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Authentification et autorisation
Le serveur MCP distant de l'API Data Lineage utilise le protocole OAuth 2.0 avec Identity and Access Management (IAM) pour l'authentification et l'autorisation. Toutes Google Cloud les identités sont compatibles avec l'authentification auprès des serveurs MCP.Nous vous recommandons de créer une identité distincte pour les agents qui utilisent des outils MCP afin de pouvoir contrôler et surveiller l'accès aux ressources. Pour en savoir plus sur l'authentification, consultez S'authentifier auprès des serveurs MCP.
Habilitations OAuth MCP de traçabilité des données
OAuth 2.0 utilise des habilitations et des identifiants pour déterminer si un compte principal authentifié est autorisé à effectuer une action spécifique sur une ressource. Pour en savoir plus sur les habilitations OAuth 2.0 dans Google, consultez Utiliser OAuth 2.0 pour accéder aux API Google.
La traçabilité des données comporte les habilitations OAuth d'outil MCP suivantes :
| URI du champ d'application pour gcloud CLI | Description |
|---|---|
https://www.googleapis.com/auth/datalineage.readonly |
Autorise uniquement l'accès en lecture aux données. |
https://www.googleapis.com/auth/datalineage.read-write |
Autorise l'accès en lecture et en modification aux données. |
Des habilitations supplémentaires peuvent être requises sur les ressources auxquelles vous accédez lors d'un appel d'outil. Pour afficher la liste des habilitations requises pour la traçabilité des données, consultez API Data Lineage.
Configurer un client MCP pour utiliser le serveur MCP de traçabilité des données
Les applications et agents d'IA, tels que Claude ou Gemini CLI, peuvent instancier un client MCP qui se connecte à un seul serveur MCP. Une application d'IA peut avoir plusieurs clients qui se connectent à différents serveurs MCP. Pour se connecter à un serveur MCP distant, le client MCP doit connaître l'URL du serveur MCP distant.
Dans votre application d'IA, recherchez un moyen de vous connecter à un serveur MCP distant. Vous êtes invité à saisir des informations sur le serveur, telles que son nom et son URL.
Pour le serveur MCP de traçabilité des données, saisissez les informations suivantes, le cas échéant :
- Nom du serveur : serveur MCP de traçabilité des données
- URL du serveur ou Point de terminaison :
- Point de terminaison mondial :
https://datalineage.googleapis.com/mcp - Points de terminaison régionaux :
https://REGION-datalineage.googleapis.com/mcp. Remplacez REGION par l'une des régions compatibles.
- Point de terminaison mondial :
- Transport: HTTP
- Informations d'authentification : selon la méthode d'authentification souhaitée, vous pouvez saisir vos Google Cloud identifiants, votre ID client OAuth et votre code secret, ou une identité et des identifiants d'agent. Pour en savoir plus sur l'authentification, consultez S'authentifier auprès des serveurs MCP.
- Habilitation OAuth : l'habilitation OAuth 2.0 que vous souhaitez utiliser lorsque vous vous connectez au serveur MCP de traçabilité des données.
Pour obtenir des conseils spécifiques à l'hôte sur la configuration et la connexion au serveur MCP, consultez les ressources suivantes :
Pour obtenir des conseils plus généraux, consultez les ressources suivantes :
Outils disponibles
Pour afficher les détails des outils MCP disponibles et leurs descriptions pour le serveur MCP de traçabilité des données, consultez la documentation de référence MCP de traçabilité des données.
Lister les outils
Utilisez l'inspecteur MCP pour lister les outils ou envoyez directement une
tools/list requête HTTP au serveur MCP distant
de traçabilité des données. La méthode tools/list ne nécessite pas d'authentification.
POST /mcp HTTP/1.1
Host: datalineage.googleapis.com
Content-Type: application/json
{
"method": "tools/list",
"jsonrpc": "2.0",
"id": 1
}
Exemples de cas d'utilisation
Voici quelques exemples de cas d'utilisation du serveur MCP de traçabilité des données :
- Découvrir toutes les sources de données en amont et les processus de transformation qui alimentent un actif de données spécifique pour vérifier l'origine et l'exactitude des données.
- Analyser l'impact des pipelines de données interrompus, bloqués ou retardés sur les consommateurs de données en aval.
Exemples de requêtes
- "Dans mon projet
my-analytics-project, j'ai un ensemble de donnéessales_dataavec une table appeléemonthly_reports. Indiquez-moi tous les actifs de données et les processus de transformation qui alimentent cette table." - "J'ai une tâche BigQuery qui écrit dans la table
hr_dataset.salary. Je vois que la tâche ne s'exécute plus depuis 12 heures. Pouvez-vous me dire quels actifs en aval auront des données obsolètes à cause de ce problème ?" - "Parcourez la table
monthly_reportsdans l'ensemble de donnéessales_dataet le projetmy-analytics-projectpour trouver toutes les colonnes qui ont des sources de données en amont, et indiquez-moi tous les processus qui alimentent ces colonnes." - "Recherchez les liens de traçabilité connectés à la table
finance.employment_costspour comprendre ses dépendances en amont."
Configurations de sécurité facultatives
MCP introduit de nouveaux risques et considérations de sécurité en raison de la grande variété d'actions que vous pouvez effectuer avec les outils MCP. Pour minimiser et gérer ces risques, Google Cloud propose des paramètres par défaut et des règles personnalisables pour contrôler l'utilisation des outils MCP dans votre Google Cloud organisation ou projet.
Pour en savoir plus sur la sécurité et la gouvernance MCP, consultez Sécurité et sûreté de l'IA.
Contrôler l'utilisation de MCP avec des stratégies de refus IAM
Les stratégies de refus Identity and Access Management (IAM) vous aident à sécuriser Google Cloud les serveurs MCP distants. Configurez ces stratégies pour bloquer l'accès indésirable aux outils MCP.
Par exemple, vous pouvez refuser ou autoriser l'accès en fonction des éléments suivants :
- Le compte principal
- Les propriétés de l'outil, telles que la lecture seule
- L'ID client OAuth de l'application
Pour en savoir plus, consultez Contrôler l'utilisation de MCP avec Identity and Access Management.
Étape suivante
- Consultez la documentation de référence MCP de traçabilité des données.
- En savoir plus sur les serveurs MCP Google Cloud.