Auf dieser Seite wird erklärt, wie Sie Ihre Knowledge Catalog-Instanz (früher Dataplex Universal Catalog) mit Entwicklertools wie der Gemini CLI verbinden. Wenn Sie Knowledge Catalog mit diesen Tools verbinden, können Sie KI-gestützte Datenerkennung und Assetverwaltung direkt in Ihrer IDE nutzen.
Für eine integrierte Befehlszeilenumgebung empfehlen wir die Verwendung der speziellen Knowledge Catalog-Erweiterung für die Gemini CLI. Die Erweiterung bündelt den zugrunde liegenden MCP-Server (Model Context Protocol), der als Vermittler zwischen der Gemini CLI und Knowledge Catalog fungiert. Dadurch ist keine separate Servereinrichtung erforderlich.
Alternativ können Sie andere IDEs und Entwicklertools, die MCP unterstützen, mit der universellen MCP Toolbox for Databases verbinden. Anschließend können Sie KI-Agents in Ihrer vorhandenen IDE verwenden, um Datenassets in Knowledge Catalog zu finden. Weitere Informationen zu MCP finden Sie unter Einführung in das Model Context Protocol.
In dieser Anleitung wird der Verbindungsprozess für die folgenden Tools beschrieben:
- Gemini CLI (über Erweiterung)
- Gemini Code Assist
- Claude Code
- Claude für Desktop
- Cline (VS Code-Erweiterung)
- Cursor
- Visual Studio Code (Copilot)
- Windsurf (früher Codeium)
Gemini CLI und Erweiterungen
Die Gemini CLI ist ein Open-Source-KI-Agent von Google, der auf Unterhaltungen basiert und Entwicklungs-Workflows beschleunigt. Er unterstützt Sie beim Programmieren, Debuggen, bei der Datenanalyse und bei der Erstellung von Inhalten. Er bietet eine agentengesteuerte Umgebung für die Interaktion mit Data Cloud-Diensten wie Knowledge Catalog und anderen beliebten Open-Source-Datenbanken.
Weitere Informationen zur Gemini CLI finden Sie in der Dokumentation zur Gemini CLI.
Funktionsweise von Erweiterungen
Erweiterungen erweitern die Funktionen der Gemini CLI und ermöglichen die Verbindung und Steuerung bestimmter Google Cloud Dienste und anderer Tools. Sie liefern Gemini Kontext und API-Verständnis und ermöglichen so die Unterhaltung. Sie können Gemini CLI-Erweiterungen über GitHub-URLs, lokale Verzeichnisse oder Registries laden. Diese Erweiterungen bieten neue Tools, Slash-Befehle und Prompts. Sie sind von IDE-Erweiterungen wie Gemini Code Assist getrennt, die über die MCP Toolbox eingebunden werden.
Knowledge Catalog-Erweiterung
Die MCP Toolbox for Databases befindet sich in der Beta-Phase (vor Version 1.0) und es können bis zur ersten stabilen Version (1.0) Breaking Changes auftreten.
Die Knowledge Catalog-Erweiterung für die Gemini CLI integriert KI in Ihre Data Governance- und Datenerkennungsaufgaben. Sie können mit Knowledge Catalog über Prompts in natürlicher Sprache in Ihrem Terminal interagieren. Hier einige Beispiele:
| Kategorie | Tool | Beispiel für einen Prompt in natürlicher Sprache |
|---|---|---|
| Datenerkennung und ‑verwaltung | dataplex_search_entries |
|
dataplex_lookup_entry |
|
|
dataplex_search_aspect_types |
|
|
| LLM mit Kontext versehen | dataplex_lookup_context |
|
Weitere Informationen zur Knowledge Catalog-Erweiterung finden Sie unter der Gemini CLI-Erweiterung – Knowledge Catalog.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Herstellen einer Verbindung zu Knowledge Catalog mit der MCP Toolbox oder der Gemini CLI-Erweiterung benötigen:
-
Zum Aktivieren von APIs:
Service Usage-Administrator (
roles/serviceusage.serviceUsageAdmin) -
Zum Verwenden von Knowledge Catalog-Tools:
Dataplex Catalog-Betrachter (
roles/dataplex.catalogViewer)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Herstellen einer Verbindung zu Knowledge Catalog mit der MCP Toolbox oder der Gemini CLI-Erweiterung erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um eine Verbindung zu Knowledge Catalog mit der MCP Toolbox oder der Gemini CLI-Erweiterung herzustellen:
-
Zum Aktivieren von APIs:
serviceusage.services.enable -
Zum Verwenden von Knowledge Catalog-Tools:
-
dataplex.projects.search -
dataplex.entries.get -
dataplex.aspectTypes.get -
dataplex.aspectTypes.list
-
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Dataplex API aktivieren
-
Wechseln Sie in der Google Cloud console zur Seite für die Projektauswahl.
-
Wählen Sie ein Google Cloud Projekt aus oder erstellen Sie eines.
Rollen, die zum Auswählen oder Erstellen eines Projekts erforderlich sind
- Projekt auswählen: Für die Auswahl eines Projekts ist keine bestimmte IAM-Rolle erforderlich. Sie können ein beliebiges Projekt auswählen, für das Ihnen eine Rolle zugewiesen wurde.
-
Projekt erstellen: Zum Erstellen eines Projekts benötigen Sie die Rolle „Project Creator“
(
roles/resourcemanager.projectCreator), die dieresourcemanager.projects.createBerechtigung enthält. Rollen zuweisen.
-
Prüfen Sie, ob für Ihr Google Cloud Projekt die Abrechnung aktiviert ist.
Dataplex API aktivieren
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (
roles/serviceusage.serviceUsageAdmin), die die Berechtigungserviceusage.services.enableenthält. Rollen zuweisen.-
Wenn Sie eine lokale Shell verwenden, erstellen Sie lokale Anmeldedaten zur Authentifizierung für Ihr Nutzerkonto:
gcloud auth application-default login
Wenn Sie Cloud Shell verwenden, ist dies nicht erforderlich.
Wenn ein Authentifizierungsfehler zurückgegeben wird und Sie einen externen Identitätsanbieter (IdP) verwenden, prüfen Sie, ob Sie sich mit Ihrer föderierten Identität in der gcloud CLI angemeldet haben.
MCP Toolbox installieren
Wenn Sie nur Gemini Code Assist oder die Gemini CLI-Erweiterung verwenden möchten, müssen Sie die MCP Toolbox nicht installieren, da diese die erforderlichen Serverfunktionen bündeln. Für andere IDEs und Tools folgen Sie der Anleitung in diesem Abschnitt, um die MCP Toolbox zu installieren.
Laden Sie die aktuelle Version der MCP Toolbox als Binärprogramm herunter. Wählen Sie das Binärprogramm aus, das Ihrem Betriebssystem und Ihrer CPU-Architektur entspricht. Sie müssen die MCP Toolbox-Version 0.31.0 oder höher verwenden.
Linux/amd64
curl -O https://storage.googleapis.com/genai-toolbox/VERSION/linux/amd64/toolbox
Ersetzen Sie
VERSIONdurch die Version der MCP Toolbox, z. B.v0.31.0.macOS (Darwin)/arm64
curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/arm64/toolbox
Ersetzen Sie
VERSIONdurch die Version der MCP Toolbox, z. B.v0.31.0.macOS (Darwin)/amd64
curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/amd64/toolbox
Ersetzen Sie
VERSIONdurch die Version der MCP Toolbox, z. B.v0.31.0.Windows/amd64
curl -O https://storage.googleapis.com/genai-toolbox/VERSION/windows/amd64/toolbox
Ersetzen Sie
VERSIONdurch die Version der MCP Toolbox, z. B.v0.31.0.So machen Sie die Binärdatei ausführbar:
chmod +x toolboxInstallation prüfen:
./toolbox --versionBei einer erfolgreichen Installation wird die Versionsnummer zurückgegeben, z. B. 0.15.0.
Clients und Verbindungen einrichten
In diesem Abschnitt wird erklärt, wie Sie Knowledge Catalog mit Ihren Tools verbinden.
Wenn Sie Gemini Code Assist oder die eigenständige Gemini CLI verwenden, müssen Sie die MCP Toolbox nicht installieren oder konfigurieren, da diese Tools die erforderlichen Serverfunktionen bündeln. Eine Anleitung zur Einrichtung finden Sie auf den Tabs „Gemini Code Assist“ oder „Gemini CLI-Erweiterung“.
Für andere MCP-kompatible Tools und IDEs müssen Sie zuerst die MCP Toolbox installieren. Die Toolbox fungiert als Open-Source- Model Context Protocol (MCP) Server, der sich zwischen Ihrer IDE und Knowledge Catalog befindet und eine sichere und effiziente Steuerungsebene für Ihre KI-Tools bietet. Wählen Sie nach der Installation den Tab für Ihr spezifisches Tool aus, um eine Konfigurationsanleitung zu erhalten.
Gemini CLI-Erweiterung
Bei dieser Methode wird die spezielle dataplex-Erweiterung für das eigenständige Gemini CLI-Tool verwendet. Die MCP Toolbox wird nicht verwendet.
- Installieren Sie die Gemini-Befehlszeile.
- Installieren Sie die Knowledge Catalog-Erweiterung für die Gemini CLI aus dem GitHub-Repository:
gemini extensions install https://github.com/gemini-cli-extensions/dataplex
- Legen Sie die Umgebungsvariable fest, um eine Verbindung zu Ihrem Knowledge Catalog-Projekt herzustellen:
export DATAPLEX_PROJECT="PROJECT_ID"
Ersetzen Sie
PROJECT_IDdurch die ID Ihres Google Cloud Projekts in. - Starten Sie die Gemini CLI im interaktiven Modus:
Die CLI lädt automatisch die Knowledge Catalog-Erweiterung und ihre Tools, mit denen Sie mit Ihren Datenassets interagieren können.gemini
Gemini Code Assist
Gemini Code Assist bündelt die erforderlichen MCP-Serverfunktionen. Sie müssen die MCP Toolbox also nicht separat installieren.
- Installieren Sie in VS Code die Gemini Code Assist Erweiterung.
- Aktivieren Sie den KI-Agentenmodus im Gemini Code Assist-Chat.
- Erstellen Sie in Ihrem Arbeitsverzeichnis einen Ordner mit dem Namen
.gemini. Erstellen Sie darin eine Dateisettings.json. - Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch
Ihre Werte und speichern Sie die Datei:
{ "mcpServers": { "dataplex": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Claude Code
- Installieren Sie Claude Code.
- Erstellen Sie im Stammverzeichnis Ihres Projekts eine Datei
.mcp.json, falls sie noch nicht vorhanden ist. - Fügen Sie die Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie die Datei:
{ "mcpServers": { "dataplex": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Claude für Desktop
- Öffnen Sie Claude für Desktop und navigieren Sie zu den Einstellungen.
- Klicken Sie auf dem Tab Entwickler auf Konfiguration bearbeiten , um die Konfigurationsdatei zu öffnen.
- Fügen Sie die Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte,
und speichern Sie die Datei:
{ "mcpServers": { "dataplex": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } } - Starten Sie Claude für Desktop neu.
Auf dem neuen Chatbildschirm wird ein MCP-Symbol mit dem neuen MCP-Server angezeigt.
Cline
- Öffnen Sie in VS Code die Cline Erweiterung und klicken Sie dann auf das Symbol MCP-Server.
- Tippen Sie auf MCP-Server konfigurieren, um die Konfigurationsdatei zu öffnen.
- Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch
Ihre Werte und speichern Sie die Datei:
Nach erfolgreicher Verbindung des Servers wird ein grüner aktiver Status angezeigt.{ "mcpServers": { "dataplex": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Cursor
- Erstellen Sie im Stammverzeichnis Ihres Projekts das Verzeichnis
.cursor, falls es noch nicht vorhanden ist. - Erstellen Sie die
.cursor/mcp.jsonDatei, falls sie noch nicht vorhanden ist, und öffnen Sie sie. - Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch
Ihre Werte und speichern Sie die Datei:
{ "mcpServers": { "dataplex": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } } - Öffnen Sie Cursor und rufen Sie Einstellungen>Cursor-Einstellungen > MCP auf. Wenn der Server verbunden ist, wird ein grüner aktiver Status angezeigt.
VS Code (Copilot)
- Öffnen Sie VS Code
und erstellen Sie das Verzeichnis
.vscodeim Stammverzeichnis Ihres Projekts, falls es noch nicht vorhanden ist. - Erstellen Sie die Datei
.vscode/mcp.json, falls sie noch nicht vorhanden ist, und öffnen Sie sie. - Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch
Ihre Werte und speichern Sie die Datei:
{ "servers": { "dataplex": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Windsurf
- Öffnen Sie Windsurf und rufen Sie den Cascade-Assistenten auf.
- Klicken Sie auf das MCP-Symbol und dann auf Konfigurieren , um die Konfigurationsdatei zu öffnen.
- Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch
Ihre Werte und speichern Sie die Datei:
{ "mcpServers": { "dataplex": { "command": "./PATH/TO/toolbox", "args": ["--prebuilt","dataplex","--stdio"], "env": { "DATAPLEX_PROJECT": "PROJECT_ID" } } } }
Tools verwenden
Ihr KI-Tool ist jetzt mit Knowledge Catalog verbunden. Bitten Sie Ihren KI-Assistenten, einige Datenassets wie BigQuery-Datasets und Cloud SQL-Instanzen zu finden.
Dem LLM stehen die folgenden Tools zur Verfügung:
- dataplex_search_entries: nach Datenassets suchen
- dataplex_lookup_entry: eine bestimmte Teilmenge von Metadaten (z. B. Schema, Nutzung, geschäftliche Übersicht und Kontakte) eines bestimmten einzelnen Datenassets abrufen
- dataplex_search_aspect_types: nach Aspekttypen suchen
- lookup_context: ein vorformatiertes, umfangreiches Set von Metadaten zu einem oder mehreren Datenassets abrufen
Optional: Systemanweisungen hinzufügen
Mit Systemanweisungen können Sie dem LLM bestimmte Richtlinien geben, damit es den Kontext besser versteht und genauer antworten kann. Richten Sie System anweisungen basierend auf dem empfohlenen Systemprompt ein.
Sie können beispielsweise Anweisungen hinzufügen, um das LLM bei der Verwendung der Knowledge Catalog-Tools zu unterstützen:
- Wenn Sie nach Datasets oder Tabellen gefragt werden, verwenden Sie das Tool
dataplex_search_entries. - Wenn Sie nach Tabellenschema- oder Metadatendetails wie Regeln zur Datenqualität oder Eigentumsrechten gefragt werden, verwenden Sie das Tool
dataplex_lookup_entry. - Wenn Sie nach Governance-Regeln oder ‑Klassifizierungen gefragt werden, verwenden Sie zuerst
dataplex_search_aspect_types, um relevante Aspekttypen zu finden. - Wenn zum Beantworten von Fragen ein breites Spektrum an Metadaten erforderlich ist, verwenden Sie das Tool
dataplex_lookup_context, um diese abzurufen.
Weitere Informationen zum Konfigurieren von Anweisungen finden Sie unter Anweisungen verwenden, um KI-Bearbeitungen zu erhalten, die Ihrem Programmierstil entsprechen.
Nächste Schritte
- Nach Ressourcen in Knowledge Catalog suchen.
- Erfahren Sie, wie Sie benutzerdefinierte Quellen in Knowledge Catalog aufnehmen.
- Erfahren Sie, wie Sie Aspekte verwalten und Metadaten anreichern.