In diesem Dokument wird erläutert, wie Sie mit dem Dienstprogramm zum Exportieren von Eintragslinks Eintragslinks (Beziehungen zwischen Glossarbegriffen und Daten-Assets) aus Knowledge Catalog (ehemals Dataplex Universal Catalog) in ein Google-Sheet extrahieren.
Sie können Eintragslinks in ein Google-Sheet exportieren, um vorhandene Links zu prüfen, Ihre Metadaten zu sichern oder eine Vorlage für Massenaktualisierungen vorzubereiten.
Hinweis
Bevor Sie Eintragslinks in ein Google-Sheet exportieren, müssen Sie die folgenden Voraussetzungen erfüllen.
Dienstkonto einrichten
Zum Ausführen des Exportdienstprogramms müssen Sie ein Dienstkonto mit den erforderlichen Berechtigungen für den Zugriff auf die Google Sheets API einrichten und die Identität Ihrer Nutzeranmeldedaten übernehmen:
Dienstkonto identifizieren oder erstellen
Wählen Sie ein vorhandenes Dienstkonto aus oder erstellen Sie ein neues in dem Projekt, in dem Sie das Importdienstprogramm ausführen. Weitere Informationen finden Sie unter Dienstkonten erstellen. Notieren Sie sich die E-Mail-Adresse des Dienstkontos (z. B.
SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com).Identitätsübernahme des Dienstkontos konfigurieren
Damit Sie das Exportdienstprogramm-Skript lokal ausführen können, muss Ihr Nutzerkonto die Berechtigung haben, die Identität des Dienstkontos zu übernehmen. Weisen Sie Ihrem Nutzerkonto die Rolle Ersteller von Dienstkonto-Tokens (
roles/iam.serviceAccountTokenCreator) für das Dienstkonto zu.Weitere Informationen finden Sie unter Zugriff auf Dienstkonten verwalten.
Gewähren Sie dem Dienstkonto
Editor-Zugriff auf das Google-Sheet.Öffnen Sie das Google-Sheet, das Sie für den Import verwenden möchten, klicken Sie auf Teilen, und fügen Sie die E-Mail-Adresse des Dienstkontos als
Editorhinzu. Mit dieser Berechtigung kann das Dienstkonto Daten aus Ihrem Sheet lesen oder Daten in Ihr Sheet schreiben.
Erforderliche Rollen
Damit das Dienstkonto die erforderlichen Berechtigungen zum Exportieren von Eintragslinks in ein Google-Sheet hat, bitten Sie Ihren Administrator, dem Dienstkonto die folgenden IAM-Rollen zu gewähren:
- Dataplex-Administrator (
roles/dataplex.admin) für das Projekt - Dataplex Catalog Admin (
roles/dataplex.catalogAdmin) für das Projekt - Dataplex Catalog Editor (
roles/dataplex.catalogEditor) für das Projekt
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Ihr Administrator kann dem Dienstkonto möglicherweise auch die erforderlichen Berechtigungen über benutzerdefinierte Rollen oder andere vordefinierte Rollen erteilen.
APIs aktivieren
Aktivieren Sie die folgenden APIs in Ihrem Projekt, um Eintragslinks zu exportieren:
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“
(roles/serviceusage.serviceUsageAdmin), die
die Berechtigung serviceusage.services.enable enthält. Informationen zum Zuweisen von
Rollen.
Git-Repository einrichten
Klonen Sie das Repository dataplex-labs:
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import/dataplex-glossary/export
Abhängigkeiten installieren
Installieren Sie die erforderlichen Python-Abhängigkeiten:
pip3 install -r requirements.txt cd dataplex-glossary
Wenn Probleme bei der Paketinstallation auftreten, richten Sie eine neue Python-Entwicklungsumgebung ein.
Identitätsübernahme des Dienstkontos authentifizieren und konfigurieren
Initialisieren Sie die Google Cloud CLI und authentifizieren Sie sich mit Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) und der Identitätsübernahme des Dienstkontos:
# Set your service account email address SA_EMAIL="SERVICE_ACCOUNT_EMAIL" # Authenticate ADC using service account impersonation and required scopes gcloud init gcloud auth login gcloud auth application-default login \ --impersonate-service-account="${SA_EMAIL}" \ --scopes="https://www.googleapis.com/auth/spreadsheets"
Ersetzen Sie SERVICE_ACCOUNT_EMAIL durch die E-Mail-Adresse des Dienstkontos. Beispiel:
SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Ziel-Google-Sheet für den Export einrichten
Erstellen Sie ein leeres Google-Sheet oder verwenden Sie ein vorhandenes. Das Exportskript schreibt in das erste Sheet. Achten Sie darauf, dass Sie dem Dienstkonto Editor-Zugriff auf das Google-Sheet gewährt haben.
Umgebungsvariablen einrichten
Richten Sie die folgenden Umgebungsvariablen ein:
# Set your glossary URL export GLOSSARY_URL="GLOSSARY_URL" # Set your Google Sheet URL export SPREADSHEET_URL="GOOGLE_SHEET_URL" # Set the project ID export USER_PROJECT="USER_PROJECT"
Eintragslinks in das Google-Sheet exportieren
Führen Sie das folgende Skript aus, um Eintragslinks in einem Glossar in das Google-Sheet zu exportieren:
cd export python3 entrylinks-export.py \ --glossary-url="$GLOSSARY_URL" \ --spreadsheet-url="$SPREADSHEET_URL" \ --user-project="$USER_PROJECT"
Sie können die Ausführungsprotokolle im Verzeichnis logs/ in Ihrem lokalen Ausführungspfad einsehen. Diese Protokolle helfen Ihnen, den Übertragungsprozess zu prüfen und übersprungene Einträge oder Formatierungswarnungen zu identifizieren.
Exportierte Eintragslinksdaten prüfen
Das Exportskript füllt das Google-Sheet mit den folgenden Spalten:
| Spaltenüberschrift | Beschreibung |
|---|---|
entry_link_type |
Der Typ des Eintragslinks (definition, related, oder
synonym). |
source_entry |
Der vollständige Ressourcenpfad des Quelleintrags. |
target_entry |
Der vollständige Ressourcenpfad des Zieleintrags. |
source_path |
Spalten- oder Feldpfad für Definitionslinks. |
Nächste Schritte
- Erfahren Sie, wie Sie ein Unternehmensglossar verwalten.
- Eintragslinks aus einem Google-Sheet importieren .
- Glossare in ein Google-Sheet exportieren .
- Weitere Informationen zur Metadatenverwaltung.