In diesem Dokument wird beschrieben, wie Sie den Remote-MCP-Server (Model Context Protocol) für die Datenherkunft verwenden, um eine Verbindung zu KI-Anwendungen wie der Gemini CLI, ChatGPT, Claude und benutzerdefinierten Anwendungen herzustellen, die Sie entwickeln. Mit dem Remote-MCP-Server für die Datenherkunft können Sie mit der Datenherkunft interagieren, um Datenherkunftsgrafiken abzufragen, die vorgelagerte Datenherkunft zu ermitteln und die nachgelagerte Auswirkung zu analysieren. Der Remote-MCP-Server der Data Lineage API wird aktiviert, wenn Sie die Data Lineage API aktivieren.
Das Model Context Protocol (MCP) standardisiert die Verbindung von Large Language Models (LLMs) und KI-Anwendungen oder ‑Agents mit externen Datenquellen. Mit MCP-Servern können Sie die zugehörigen Tools, Ressourcen und Prompts verwenden, um Aktionen auszuführen und aktualisierte Daten vom Backend-Dienst abzurufen.
Was ist der Unterschied zwischen lokalen und Remote-MCP-Servern?
- Lokale MCP-Server
- werden in der Regel auf Ihrem lokalen Computer ausgeführt und verwenden die Standard-Ein- und Ausgabestreams (stdio) für die Kommunikation zwischen Diensten auf demselben Gerät.
- Remote-MCP-Server
- Wird auf der Infrastruktur des Dienstes ausgeführt und bietet einen HTTP-Endpunkt für KI-Anwendungen für die Kommunikation zwischen dem KI-MCP-Client und dem MCP-Server. Weitere Informationen zur MCP-Architektur finden Sie unter MCP-Architektur.
Google- und Google Cloud Remote-MCP-Server
Google- und Google Cloud Remote-MCP-Server bieten folgende Funktionen und Vorteile:- Einfache, zentrale Suche
- Verwaltete globale oder regionale HTTP-Endpunkte
- Detaillierte Autorisierung
- Optionale Sicherheit für Prompts und Antworten mit Model Armor
- Zentralisiertes Audit-Logging
Informationen zu anderen MCP-Servern sowie zu Sicherheits- und Governance-Kontrollen, die für Google Cloud-MCP-Server verfügbar sind, finden Sie unter Google Cloud-MCP-Server – Übersicht.
Hinweis
- Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Data Lineage API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Data Lineage API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, in dem Sie den Data Lineage MCP-Server verwenden möchten, um die Berechtigungen zu erhalten, die Sie für die Verwendung des Data Lineage MCP-Servers benötigen:
-
MCP-Tool-Aufrufe ausführen:
MCP Tool User (
roles/mcp.toolUser) -
Informationen zur Datenherkunft ansehen:
Data Lineage-Betrachter (
roles/datalineage.viewer)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Verwenden des MCP-Servers für den Datenursprung erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um den MCP-Server für den Datenursprung zu verwenden:
-
MCP-Tool-Aufrufe erstellen:
mcp.tools.call -
Data Lineage in der Suche nach Links abfragen:
datalineage.locations.searchLinks
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Authentifizierung und Autorisierung
Der Remote-MCP-Server der Data Lineage API verwendet das OAuth 2.0-Protokoll mit Identity and Access Management (IAM) für die Authentifizierung und Autorisierung. Alle Google Cloud Identitäten werden für die Authentifizierung bei MCP-Servern unterstützt.Wir empfehlen, eine separate Identität für Kundenservicemitarbeiter zu erstellen, die MCP-Tools verwenden, damit der Zugriff auf Ressourcen gesteuert und überwacht werden kann. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.
OAuth-Bereiche für Data Lineage MCP
OAuth 2.0 verwendet Bereiche und Anmeldedaten, um zu ermitteln, ob ein authentifiziertes Hauptkonto autorisiert ist, eine bestimmte Aktion für eine Ressource auszuführen. Weitere Informationen zu OAuth 2.0-Bereichen bei Google finden Sie unter Mit OAuth 2.0 auf Google APIs zugreifen.
Für die Datenherkunft sind die folgenden OAuth-Bereiche für das MCP-Tool erforderlich:
| Bereichs-URI für die gcloud CLI | Beschreibung |
|---|---|
https://www.googleapis.com/auth/datalineage.readonly |
Gewährt nur Lesezugriff auf Daten. |
https://www.googleapis.com/auth/datalineage.read-write |
Ermöglicht den Zugriff zum Lesen und Ändern von Daten. |
Möglicherweise sind zusätzliche Bereiche für die Ressourcen erforderlich, auf die während eines Tool-Aufrufs zugegriffen wird. Eine Liste der für die Data Lineage API erforderlichen Bereiche finden Sie unter Data Lineage API.
MCP-Client für die Verwendung des MCP-Servers für Datenherkunft konfigurieren
KI-Anwendungen und ‑Agents wie Claude oder die Gemini CLI können einen MCP-Client instanziieren, der eine Verbindung zu einem einzelnen MCP-Server herstellt. Eine KI-Anwendung kann mehrere Clients haben, die eine Verbindung zu verschiedenen MCP-Servern herstellen. Damit eine Verbindung zu einem Remote-MCP-Server hergestellt werden kann, muss der MCP-Client die URL des Remote-MCP-Servers kennen.
Suchen Sie in Ihrer KI-Anwendung nach einer Möglichkeit, eine Verbindung zu einem Remote-MCP-Server herzustellen. Sie werden aufgefordert, Details zum Server einzugeben, z. B. den Namen und die URL.
Geben Sie für den MCP-Server für den Datenursprung Folgendes ein:
- Servername: MCP-Server für Datenherkunft
- Server-URL oder Endpunkt:
- Globaler Endpunkt:
https://datalineage.googleapis.com/mcp - Regionale Endpunkte:
https://REGION-datalineage.googleapis.com/mcp. Ersetzen Sie REGION durch eine der unterstützten Regionen.
- Globaler Endpunkt:
- Transport: HTTP
- Authentifizierungsdetails: Je nachdem, wie Sie sich authentifizieren möchten, können Sie Ihre Google Cloud Anmeldedaten, Ihre OAuth-Client-ID und Ihren OAuth-Clientschlüssel oder eine Agent-Identität und Anmeldedaten eingeben. Weitere Informationen zur Authentifizierung finden Sie unter Authentifizierung bei MCP-Servern.
- OAuth-Bereich: der OAuth 2.0-Bereich, den Sie beim Herstellen einer Verbindung zum MCP-Server für den Datenursprung verwenden möchten.
Eine hostspezifische Anleitung zum Einrichten und Herstellen einer Verbindung zu einem MCP-Server finden Sie hier:
Allgemeine Informationen finden Sie in den folgenden Ressourcen:
Verfügbare Tools
Details zu den verfügbaren MCP-Tools und deren Beschreibungen für den MCP-Server für die Datenherkunft finden Sie in der MCP-Referenz für die Datenherkunft.
Tools für Listen
Verwenden Sie das MCP-Prüftool, um Tools aufzulisten, oder senden Sie eine tools/list HTTP-Anfrage direkt an den Remote-MCP-Server für die Datenherkunft. Für die Methode tools/list ist keine Authentifizierung erforderlich.
POST /mcp HTTP/1.1
Host: datalineage.googleapis.com
Content-Type: application/json
{
"method": "tools/list",
"jsonrpc": "2.0",
"id": 1
}
Beispielanwendungsfälle
Beispiel-Anwendungsfälle für den Data-Lineage-MCP-Server:
- Alle Upstream-Datenquellen und Transformationsprozesse ermitteln, die in ein bestimmtes Daten-Asset einfließen, um Datenursprung und ‑genauigkeit zu überprüfen.
- Analyse der Auswirkungen von fehlerhaften, unterbrochenen oder verzögerten Datenpipelines auf nachgelagerte Datennutzer.
Beispiel-Prompts
- „In meinem Projekt
my-analytics-projecthabe ich ein Datasetsales_datamit einer Tabelle namensmonthly_reports. Nenne mir alle Daten-Assets und Transformationsprozesse, aus denen Daten in diese Tabelle einfließen.“ - „Ich habe einen BigQuery-Job, der in die Tabelle
hr_dataset.salaryschreibt. Der Job kann seit 12 Stunden nicht ausgeführt werden. Können Sie mir sagen, bei welchen nachgelagerten Assets die Daten aufgrund dieses Problems veraltet sind?“ - „Sieh dir die Tabelle
monthly_reportsim Datasetsales_dataund im Projektmy-analytics-projectan, um alle Spalten mit Upstream-Datenquellen zu finden, und gib mir alle Prozesse, die in diese Spalten einfließen.“ - „Suche nach Herkunftsinformationen für die Tabelle
finance.employment_costs, um die Upstream-Abhängigkeiten zu ermitteln.“
Optionale Sicherheitskonfigurationen
Das MCP birgt neue Sicherheitsrisiken und ‑aspekte, da mit den MCP-Tools eine Vielzahl von Aktionen ausgeführt werden kann. Um diese Risiken zu minimieren und zu verwalten, bietetGoogle Cloud Standardeinstellungen und anpassbare Richtlinien, mit denen Sie die Verwendung von MCP-Tools in Ihrer Google Cloud-Organisation oder Ihrem Google Cloud-Projekt steuern können.
Weitere Informationen zur Sicherheit und Governance von MCP finden Sie unter KI-Sicherheit.
MCP-Nutzung mit IAM-Ablehnungsrichtlinien steuern
IAM-Ablehnungsrichtlinien (Identity and Access Management) helfen Ihnen, Google Cloud Remote-MCP-Server zu schützen. Konfigurieren Sie diese Richtlinien, um unerwünschten Zugriff auf MCP-Tools zu blockieren.
Sie können den Zugriff beispielsweise anhand der folgenden Kriterien verweigern oder zulassen:
- Der Prinzipal
- Tool-Eigenschaften wie „Schreibgeschützt“
- Die OAuth-Client-ID der Anwendung
Weitere Informationen finden Sie unter MCP-Nutzung mit Identity and Access Management steuern.
Nächste Schritte
- Lesen Sie die Referenzdokumentation zum MCP für Datenherkunft.
- Weitere Informationen zu Google Cloud-MCP-Servern