Dataplex Universal Catalog mit MCP, Gemini und anderen Agents verwenden

Auf dieser Seite wird erläutert, wie Sie Ihre Dataplex Universal Catalog-Instanz mit Entwicklertools wie der Gemini CLI verbinden. Wenn Sie Dataplex Universal Catalog mit diesen Tools verbinden, können Sie KI-gestützte Datenerkennung und Asset-Verwaltung direkt in Ihrer IDE nutzen.

Für eine integrierte Befehlszeilenumgebung empfehlen wir die Verwendung der speziellen Dataplex Universal Catalog-Erweiterung für die Gemini CLI. Die Erweiterung enthält den zugrunde liegenden MCP-Server (Model Context Protocol), der als Vermittler zwischen der Gemini-Befehlszeile und Dataplex Universal Catalog fungiert. Dadurch ist keine separate Servereinrichtung erforderlich.

Alternativ können Sie auch andere IDEs und Entwicklertools, die MCP unterstützen, über die MCP Toolbox for Databases verbinden. Anschließend können Sie KI-Agents in Ihrer vorhandenen IDE verwenden, um Daten-Assets im Dataplex Universal Catalog zu ermitteln. Weitere Informationen zu MCP finden Sie unter Einführung in das Model Context Protocol.

In diesem Leitfaden wird der Verbindungsprozess für die folgenden Tools beschrieben:

Gemini CLI und Erweiterungen

Die Gemini CLI ist ein Open-Source-Tool von Google, das auf Konversations-KI basiert. Es beschleunigt Entwicklungs-Workflows und unterstützt Sie beim Programmieren, Debuggen, bei der Datenanalyse und beim Erstellen von Inhalten. Sie bietet eine agentengesteuerte Möglichkeit, mit Data Cloud-Diensten wie Dataplex Universal Catalog und anderen beliebten Open-Source-Datenbanken zu interagieren.

Weitere Informationen zur Gemini-Befehlszeile finden Sie in der Dokumentation zur Gemini-Befehlszeile.

So funktionieren Erweiterungen

Erweiterungen erweitern die Funktionen von Gemini CLI und ermöglichen es, bestimmte Google Cloud -Dienste und andere Tools zu verbinden und zu steuern. Sie liefern Gemini Kontext und API-Informationen und ermöglichen so eine Konversationsinteraktion. Sie können Gemini CLI-Erweiterungen über GitHub-URLs, lokale Verzeichnisse oder Registrierungen laden. Diese Erweiterungen bieten neue Tools, Slash-Befehle und Prompts. Diese sind von IDE-Erweiterungen wie Gemini Code Assist getrennt, die über die MCP Toolbox integriert werden.

Dataplex Universal Catalog-Erweiterung

Die MCP Toolbox for Databases befindet sich in der Betaphase (vor Version 1.0) und es kann bis zur ersten stabilen Version (v1.0) zu wichtigen Änderungen kommen.

Die Dataplex Universal Catalog-Erweiterung für die Gemini CLI integriert KI in Ihre Aufgaben zur Daten-Governance und ‑Erkennung. Sie können über Prompts in natürlicher Sprache in Ihrem Terminal mit Dataplex Universal Catalog interagieren. Hier einige Beispiele:

Kategorie Tool Beispiel für einen Prompt in natürlicher Sprache
Datenerkennung und ‑governance dataplex_search_entries
  • Alle Datasets zu Umsätzen in Europa finden
  • Zeige mir Tabellen mit personenidentifizierbaren Kundeninformationen.
  • Alle BigQuery-Datasets im Lake „marketing“ im Dataplex Universal Catalog auflisten.
dataplex_lookup_entry
  • Wie sieht das Schema der Tabelle „orders“ aus?
  • Beschreiben Sie die Regeln für die Datenqualität, die auf die Kundendatenbank angewendet werden.
  • Wer wird als Inhaber der Tabelle „customer_details“ aufgeführt?
dataplex_search_aspect_types
  • Zeige mir Aspekttypen im Zusammenhang mit Datenqualitätsregeln.
  • Alle Aspekttypen auflisten, die für die Data Governance verwendet werden.
  • Gibt es Aspekttypen zum Markieren personenbezogener Daten?

Weitere Informationen zur Dataplex Universal Catalog-Erweiterung finden Sie unter Gemini CLI Extension – Dataplex Universal Catalog.

Erforderliche Rollen und Berechtigungen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Herstellen einer Verbindung zu Dataplex Universal Catalog mit der MCP Toolbox oder der Gemini CLI-Erweiterung benötigen:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Herstellen einer Verbindung zum Dataplex Universal Catalog mit der MCP Toolbox oder der Gemini CLI-Erweiterung erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um mit der MCP Toolbox oder der Gemini CLI-Erweiterung eine Verbindung zu Dataplex Universal Catalog herzustellen:

  • So aktivieren Sie APIs: serviceusage.services.enable
  • So verwenden Sie Dataplex Universal Catalog-Tools:
    • dataplex.projects.search
    • dataplex.entries.get
    • dataplex.aspectTypes.get
    • dataplex.aspectTypes.list

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Dataplex Universal Catalog API aktivieren

  1. Sehen Sie sich die erforderlichen Berechtigungen an, um die Aufgaben in dieser Anleitung auszuführen.
  2. In the Google Cloud console, go to the project selector page.

    Go to project selector

  3. Select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Dataplex API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  6. If you're using a local shell, then create local authentication credentials for your user account:

    gcloud auth application-default login

    You don't need to do this if you're using Cloud Shell.

    If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.

MCP-Toolbox installieren

Sie müssen die MCP Toolbox nicht installieren, wenn Sie nur Gemini Code Assist oder die Gemini CLI-Erweiterung verwenden möchten, da die erforderlichen Serverfunktionen darin enthalten sind. Für andere IDEs und Tools folgen Sie der Anleitung in diesem Abschnitt, um die MCP Toolbox zu installieren.

  1. Laden Sie die neueste Version der MCP-Toolbox als Binärdatei herunter. Wählen Sie die Binärdatei aus, die Ihrem Betriebssystem und Ihrer CPU-Architektur entspricht. Sie müssen mindestens die MCP Toolbox-Version 0.15.0 verwenden.

    Linux/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/linux/amd64/toolbox
    

    Ersetzen Sie VERSION durch die Version der MCP Toolbox, z. B. v0.15.0.

    macOS (Darwin)/arm64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/arm64/toolbox
    

    Ersetzen Sie VERSION durch die Version der MCP Toolbox, z. B. v0.15.0.

    macOS (Darwin)/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/darwin/amd64/toolbox
    

    Ersetzen Sie VERSION durch die Version der MCP Toolbox, z. B. v0.15.0.

    Windows/amd64

    curl -O https://storage.googleapis.com/genai-toolbox/VERSION/windows/amd64/toolbox
    

    Ersetzen Sie VERSION durch die Version der MCP Toolbox, z. B. v0.15.0.

  2. So machen Sie die Binärdatei ausführbar:

    chmod +x toolbox
    
  3. Installation prüfen:

    ./toolbox --version
    

    Bei einer erfolgreichen Installation wird die Versionsnummer zurückgegeben, z. B. 0.15.0.

Clients und Verbindungen einrichten

In diesem Abschnitt wird beschrieben, wie Sie Dataplex Universal Catalog mit Ihren Tools verbinden.

Wenn Sie Gemini Code Assist oder die eigenständige Gemini CLI verwenden, müssen Sie die MCP Toolbox nicht installieren oder konfigurieren, da diese Tools die erforderlichen Serverfunktionen enthalten. Eine Anleitung zur Einrichtung finden Sie auf den Tabs „Gemini Code Assist“ oder „Gemini CLI-Erweiterung“.

Für andere MCP-kompatible Tools und IDEs müssen Sie zuerst die MCP-Toolbox installieren. Die Toolbox fungiert als Open-Source-Model Context Protocol (MCP)-Server, der sich zwischen Ihrer IDE und dem Dataplex Universal Catalog befindet und eine sichere und effiziente Steuerungsebene für Ihre KI-Tools bietet. Wählen Sie nach der Installation den Tab für Ihr Tool aus, um die Konfigurationsanleitung aufzurufen.

Gemini CLI-Erweiterung

Bei dieser Methode wird die dedizierte dataplex-Erweiterung für das eigenständige Gemini CLI-Tool verwendet und nicht die MCP Toolbox.

  1. Installieren Sie die Gemini-Befehlszeile.
  2. Installieren Sie die Dataplex Universal Catalog-Erweiterung für die Gemini CLI aus dem GitHub-Repository:
    gemini extensions install https://github.com/gemini-cli-extensions/dataplex
  3. Legen Sie die Umgebungsvariable fest, um eine Verbindung zu Ihrem Dataplex Universal Catalog-Projekt herzustellen:
    export DATAPLEX_PROJECT="PROJECT_ID"

    Ersetzen Sie dabei PROJECT_ID durch die ID Ihres Projekts in Google Cloud .

  4. Starten Sie die Gemini CLI im interaktiven Modus:
    gemini
    Die CLI lädt automatisch die Dataplex Universal Catalog-Erweiterung und die zugehörigen Tools, mit denen Sie mit Ihren Daten-Assets interagieren können.

Gemini Code Assist

Gemini Code Assist enthält die erforderlichen MCP-Serverfunktionen, sodass Sie die MCP Toolbox nicht separat installieren müssen.

  1. Installieren Sie in VS Code die Erweiterung Gemini Code Assist.
  2. Aktivieren Sie den Agent-Modus im Gemini Code Assist-Chat.
  3. Erstellen Sie in Ihrem Arbeitsverzeichnis einen Ordner mit dem Namen .gemini. Erstellen Sie darin eine settings.json-Datei.
  4. Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Claude-Code

  1. Installieren Sie Claude Code.
  2. Erstellen Sie im Stammverzeichnis Ihres Projekts die Datei .mcp.json, falls sie noch nicht vorhanden ist.
  3. Fügen Sie die Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Claude für den Computer

  1. Öffnen Sie Claude Desktop und rufen Sie die Einstellungen auf.
  2. Klicken Sie auf dem Tab Entwickler auf Konfiguration bearbeiten, um die Konfigurationsdatei zu öffnen.
  3. Fügen Sie die Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
  4. Starten Sie Claude Desktop neu.
    Auf dem neuen Chatbildschirm wird ein MCP-Symbol mit dem neuen MCP-Server angezeigt.

Cline

  1. Öffnen Sie in VS Code die Cline-Erweiterung und klicken Sie dann auf das Symbol MCP Servers.
  2. Tippen Sie auf MCP-Server konfigurieren, um die Konfigurationsdatei zu öffnen.
  3. Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
    Nachdem die Verbindung zum Server erfolgreich hergestellt wurde, wird ein grüner aktiver Status angezeigt.

Cursor

  1. Erstellen Sie das Verzeichnis .cursor im Stammverzeichnis Ihres Projekts, falls es noch nicht vorhanden ist.
  2. Erstellen Sie die Datei .cursor/mcp.json, falls sie noch nicht vorhanden ist, und öffnen Sie sie.
  3. Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      
  4. Öffnen Sie Cursor und gehen Sie zu Einstellungen> Cursoreinstellungen > MCP. Wenn der Server verbunden ist, wird ein grüner aktiver Status angezeigt.

VS Code (Copilot)

  1. Öffnen Sie VS Code und erstellen Sie das Verzeichnis .vscode im Stammverzeichnis Ihres Projekts, falls es noch nicht vorhanden ist.
  2. Erstellen Sie die Datei .vscode/mcp.json, falls sie noch nicht vorhanden ist, und öffnen Sie sie.
  3. Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie:
      {
        "servers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Windsurfen

  1. Öffnen Sie Windsurf und rufen Sie den Cascade-Assistenten auf.
  2. Klicken Sie auf das MCP-Symbol und dann auf Konfigurieren, um die Konfigurationsdatei zu öffnen.
  3. Fügen Sie die folgende Konfiguration hinzu, ersetzen Sie die Umgebungsvariablen durch Ihre Werte und speichern Sie:
      {
        "mcpServers": {
          "dataplex": {
            "command": "./PATH/TO/toolbox",
            "args": ["--prebuilt","dataplex","--stdio"],
            "env": {
              "DATAPLEX_PROJECT": "PROJECT_ID"
            }
          }
        }
      }
      

Tools verwenden 

Ihr KI-Tool ist jetzt mit Dataplex Universal Catalog verbunden. Bitten Sie Ihren KI-Assistenten, einige Daten-Assets wie BigQuery-Datasets, Cloud SQL-Instanzen und andere zu finden.

Dem LLM stehen die folgenden Tools zur Verfügung:

Optional: Systemanweisungen hinzufügen

Mit Systemanweisungen können Sie dem LLM spezifische Richtlinien geben, damit es den Kontext besser versteht und genauer antworten kann. Richten Sie Systemanweisungen basierend auf dem empfohlenen Systemprompt ein.

Sie können beispielsweise Anleitungen hinzufügen, um das LLM bei der Verwendung der Dataplex Universal Catalog-Tools zu unterstützen:

  • Wenn Sie nach Datensätzen oder Tabellen gefragt werden, verwenden Sie das Tool dataplex_search_entries.
  • Wenn Sie nach Tabellenschema- oder Metadatendetails wie Datenqualitätsregeln oder Inhaberschaft gefragt werden, verwenden Sie das Tool dataplex_lookup_entry.
  • Wenn Sie nach Governance-Regeln oder ‑Klassifizierungen gefragt werden, verwenden Sie zuerst dataplex_search_aspect_types, um relevante Aspekttypen zu finden.

Weitere Informationen zum Konfigurieren von Anweisungen finden Sie unter Anweisungen verwenden, um KI-Bearbeitungen zu erhalten, die Ihrem Codierungsstil entsprechen.

Nächste Schritte