Unternehmensglossare in eine Google-Tabelle exportieren

In diesem Dokument wird erläutert, wie Sie mit dem Dienstprogramm zum Exportieren von Unternehmensglossaren Glossare, Kategorien und Begriffe aus Knowledge Catalog (ehemals Dataplex Universal Catalog) in eine Google-Tabelle extrahieren können, um sie in großen Mengen zu verwalten und Berichte zu erstellen.

Das glossary_export Dienstprogramm ruft Metadaten aus Ihrem Knowledge Catalog-Unternehmensglossar ab und füllt eine Google-Tabelle mit einem strukturierten Schema, einschließlich Beschreibungen, Datenverantwortlichen und Labels.

Hinweis

Bevor Sie Glossare exportieren, müssen die folgenden Voraussetzungen erfüllt sein.

Dienstkonto einrichten

Damit Sie das Exportdienstprogramm ausführen können, müssen Sie ein Dienstkonto mit den erforderlichen Berechtigungen für den Zugriff auf die Google Sheets API einrichten und die Identität Ihres Nutzers übernehmen:

  1. Dienstkonto identifizieren oder erstellen

    Wählen Sie ein vorhandenes Dienstkonto aus oder erstellen Sie ein neues in dem Projekt, in dem Sie das Importdienstprogramm ausführen. Weitere Informationen finden Sie unter Dienstkonten erstellen. Notieren Sie sich die E-Mail-Adresse des Dienstkontos (z. B. SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com).

  2. Identitätsübernahme des Dienstkontos konfigurieren

    Damit Sie das Exportdienstprogramm-Skript lokal ausführen können, muss Ihr Nutzerkonto die Berechtigung haben, die Identität des Dienstkontos zu übernehmen. Weisen Sie Ihrem Nutzerkonto die Rolle Ersteller von Dienstkonto-Tokens (roles/iam.serviceAccountTokenCreator) für das Dienstkonto zu.

    Weitere Informationen finden Sie unter Zugriff auf Dienstkonten verwalten.

  3. Gewähren Sie dem Dienstkonto Editor-Zugriff auf das Google-Sheet.

    Öffnen Sie das Google-Sheet, das Sie für den Import verwenden möchten, klicken Sie auf Freigeben, und fügen Sie die E-Mail-Adresse des Dienstkontos als Editor hinzu. Mit dieser Berechtigung kann das Dienstkonto Daten aus Ihrem Sheet lesen oder Daten in Ihr Sheet schreiben.

Erforderliche Rollen

Damit das Dienstkonto die erforderlichen Berechtigungen zum Exportieren von Glossaren in eine Google-Tabelle hat, bitten Sie Ihren Administrator, dem Dienstkonto die folgenden IAM-Rollen zu gewähren:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Ihr Administrator kann dem Dienstkonto möglicherweise auch die erforderlichen Berechtigungen über benutzerdefinierte Rollen oder andere vordefinierte Rollen erteilen.

APIs aktivieren

Aktivieren Sie die folgenden APIs in Ihrem Projekt, um Glossare zu exportieren:

Rollen, die zum Aktivieren von APIs erforderlich sind

Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Informationen zum Zuweisen von Rollen.

APIs aktivieren

Git-Repository einrichten

Klonen Sie das Repository dataplex-labs:

git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import/dataplex-glossary/export

Abhängigkeiten installieren

Installieren Sie die erforderlichen Python-Abhängigkeiten:

pip3 install -r requirements.txt

Wenn bei der Paketinstallation Probleme auftreten, richten Sie eine neue Python-Entwicklungsumgebung ein.

Authentifizieren und Identitätsübernahme des Dienstkontos konfigurieren

Initialisieren Sie die Google Cloud CLI und authentifizieren Sie sich mit Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) und der Identitätsübernahme des Dienstkontos:

# Set your service account email address
SA_EMAIL="SERVICE_ACCOUNT_EMAIL"

# Authenticate ADC using service account impersonation and required scopes
gcloud auth application-default login \
  --impersonate-service-account="${SA_EMAIL}" \
  --scopes="https://www.googleapis.com/auth/spreadsheets"

Ersetzen Sie SERVICE_ACCOUNT_EMAIL durch die E-Mail-Adresse des Dienstkontos. Beispiel:

SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

Google-Zielsheet für den Export einrichten

Erstellen Sie ein leeres Google-Sheet oder verwenden Sie ein vorhandenes. Das Exportskript schreibt in das erste Sheet. Achten Sie darauf, dass Sie dem Dienstkonto Editor-Zugriff auf das Google-Sheet gewährt haben.

Glossar in das Google-Sheet exportieren

Führen Sie das Skript glossary-export.py aus. Das Dienstprogramm fordert Sie während der Ausführung auf, das Google-Zielsheet und den Namen des Glossars anzugeben, das Sie exportieren möchten:

python3 glossary-export.py

Sie können die Ausführungsprotokolle im Verzeichnis logs/ in Ihrem lokalen Ausführungspfad einsehen. Diese Protokolle helfen Ihnen, den Übertragungsprozess zu prüfen und übersprungene Einträge oder Formatierungswarnungen zu identifizieren.

Exportierte Glossardaten prüfen

Das Exportskript füllt das Google-Sheet mit den folgenden Spalten. Prüfen Sie die exportierten Daten.

Feld Beschreibung
id Eine eindeutige Kennung für den Begriff oder die Kategorie im Glossar.
parent Die ID der übergeordneten Kategorie.
display_name Der Anzeigename des Begriffs oder der Kategorie.
description Eine kurze Beschreibung des Begriffs oder der Kategorie.
overview Eine Rich-Text-Beschreibung des Begriffs oder der Kategorie (unterstützt HTML-Tags).
type Der Zeilentyp: TERM oder CATEGORY.
contact1_email E-Mail-Adresse des primären Datenverantwortlichen für den Begriff oder die Kategorie.
contact1_name Name des primären Datenverantwortlichen für den Begriff oder die Kategorie.
contact2_email E-Mail-Adresse des sekundären Datenverantwortlichen für den Begriff oder die Kategorie.
contact2_name Name des sekundären Datenverantwortlichen für den Begriff oder die Kategorie.
label1_key Schlüssel für das erste zugewiesene Label.
label1_value Wert für das erste zugewiesene Label.
label2_key Schlüssel für das zweite zugewiesene Label.
label2_value Wert für das zweite zugewiesene Label.

Nächste Schritte

  • Erfahren Sie, wie Sie ein Unternehmensglossar verwalten.
  • Glossare mit JSON-Dateien importieren .
  • Glossare aus einem Google-Sheet importieren .
  • Weitere Informationen zur Metadatenverwaltung.