Glossare und Eintragslinks importieren und exportieren

Dieses Dokument bietet einen Überblick darüber, wie Sie Geschäftsglossare und Eintragslinks in Knowledge Catalog (früher Dataplex Universal Catalog) importieren und exportieren.

Mit dem Unternehmensglossar in Knowledge Catalog können Sie ein gemeinsames Unternehmensvokabular definieren und diese Begriffe mit physischen Daten-Assets verknüpfen. Wenn Ihr Katalog wächst, kann es schwierig werden, diese Begriffe und ihre Beziehungen einzeln in derGoogle Cloud -Konsole zu verwalten.

Wenn Sie Ihr Unternehmensglossar im großen Maßstab verwalten möchten, können Sie Glossare (Kategorien und Begriffe) und Eintragslinks (die Verknüpfungen zwischen Begriffen und Daten-Assets) im Bulk-Verfahren importieren und exportieren.

Terminologie

Bevor Sie die Import- und Exportdienstprogramme verwenden, sollten Sie sich mit den folgenden wichtigen Komponenten vertraut machen:

  • Glossarressourcen:Bestehen aus Kategorien und Begriffen, die Ihr Unternehmensvokabular definieren.
  • Eintragslinks:Die Beziehungen oder Verknüpfungen zwischen Ressourcen. Knowledge Catalog unterstützt drei Arten von Eintragslinks:

    • definition: Ordnet einen Glossarbegriff einem bestimmten Datenasset zu, z. B. einer BigQuery-Spalte.
    • related: Stellt eine Beziehung zwischen zwei verwandten Glossarbegriffen her.
    • synonym: Stellt eine Beziehung zwischen zwei synonymen Glossarbegriffen her.

Methoden zum Importieren und Exportieren von Glossaren und Eintragslinks

Knowledge Catalog unterstützt zwei primäre Methoden für die Massenverwaltung von Glossaren. Wählen Sie die Methode aus, die Ihren Automatisierungsanforderungen und Ihrer bevorzugten Benutzeroberfläche am besten entspricht:

  • JSON-basierter Metadatenimport
  • Google Sheets-basierte Dienstprogramme für Import und Export

JSON-basierter Metadatenimport

Dies ist der integrierte, vollständig verwaltete Knowledge Catalog-Mechanismus. Sie verwenden die Dataplex API, um Glossarbegriffe und ihre Zuordnungen zu importieren, die in JSON-formatierten Metadatendateien definiert sind.

Beispiel für Anwendungsfall:Aktualisieren Sie die Metadaten Ihres Knowledge Catalog automatisch im Rahmen einer täglich geplanten Datenpipeline, z. B. durch Synchronisieren von Begriffen direkt aus einer externen Unternehmensdatenbank.

Weitere Informationen finden Sie unter Glossare und Eintragslinks mit JSON-Dateien importieren.

Google Sheets-basierte Dienstprogramme für Import und Export

Dies ist ein Open-Source-Ansatz, der auf Skripten basiert und im dataplex-labs-Repository verfügbar ist. Dazu wird ein Python-Skript verwendet, um Glossarmetadaten zwischen einem Google-Tabellenblatt und Knowledge Catalog zu synchronisieren.

Beispiel: Ein Team für Data Governance möchte gemeinsam mit nicht technischen Stakeholdern aus dem Unternehmen Dutzende neuer Geschäftsbedingungen entwerfen und überprüfen. Das Team verwendet diese tabellenbasierte Methode, damit jeder die Begriffe in Google-Tabelle bearbeiten, kommentieren und genehmigen kann, bevor ein Administrator das Skript ausführt, um sie im Bulk-Verfahren in den Knowledge Catalog hochzuladen.

Weitere Informationen finden Sie in folgenden Dokumenten:

Gängiger Anwendungsfall: Round-Trip-Bearbeitung mit Google Sheets

Ein gängiger administrativer Workflow ist die Roundtrip-Bearbeitung. Dazu müssen Sie Ihre vorhandene Katalogkonfiguration exportieren, Bulk-Änderungen vornehmen und diese Änderungen wieder auf Knowledge Catalog anwenden.

Der folgende Workflow veranschaulicht, wie dieser Prozess ausgeführt wird:

  1. Sie können vorhandene Metadaten aus Knowledge Catalog nach Google Sheets exportieren.

    Mit den Dienstprogrammen Glossarexport und Eintragslinks exportieren können Sie Ihre vorhandene Glossarstruktur und Eintragslinks in eine Google-Tabelle exportieren.

  2. Metadaten in Google Sheets ändern

    Nehmen Sie die erforderlichen Änderungen in der Google-Tabelle vor. Da symmetrische Links (z. B. synonym- und related-Eintragslinks) beim Export vereinfacht und in nur eine Richtung dargestellt werden, um doppelte Zeilen zu vermeiden, müssen Sie sie nur einmal verwalten.

    Sie können dem jeweiligen Tabellenblatt neue Zeilen hinzufügen, die dem erforderlichen Spaltenschema entsprechen. Sie können auch Details wie Beschreibungen oder Anzeigenamen direkt in den Zeilen ändern.

  3. Änderungen aus Google Sheets in Knowledge Catalog übernehmen und importieren

    Führen Sie zuerst das Dienstprogramm Glossarimport aus. So wird sichergestellt, dass alle neuen Begriffe oder Kategorien erfolgreich im Unternehmensglossar erstellt werden, bevor Sie versuchen, sie zu verknüpfen.

    Führen Sie das Dienstprogramm Eintraglinks importieren aus. Dieses Tool liest Ihre aktualisierten Zuordnungen, stellt sie in Ihrem Cloud Storage-Bucket bereit und wendet die Links definition, related und synonym auf Ihr neu aktualisiertes Glossar an.

Nächste Schritte