Informazioni sull'importazione e l'esportazione di glossari e link alle voci

Questo documento fornisce una panoramica su come importare ed esportare glossari aziendali e link alle voci in Knowledge Catalog (in precedenza Dataplex Universal Catalog).

Il glossario aziendale di Knowledge Catalog ti consente di definire un vocabolario aziendale comune e di associare questi termini agli asset di dati fisici. Man mano che il catalogo cresce, gestire questi termini e le loro relazioni singolarmente nella consoleGoogle Cloud può diventare difficile.

Per gestire il glossario aziendale su larga scala, puoi importare ed esportare glossari (categorie e termini) e link alle voci (le associazioni tra termini e asset di dati) in blocco.

Terminologia

Prima di utilizzare le utilità di importazione ed esportazione, acquisisci familiarità con i seguenti componenti chiave:

  • Risorse del glossario:sono costituite da categorie e termini che stabiliscono il vocabolario della tua attività.
  • Link di ingresso:le relazioni o le associazioni tra le risorse. Knowledge Catalog supporta tre tipi di link alle voci:

    • definition: associa un termine del glossario a un asset di dati specifico (ad esempio una colonna BigQuery)
    • related: stabilisce una relazione tra due termini del glossario correlati
    • synonym: stabilisce una relazione tra due termini di glossario sinonimi

Metodi per importare ed esportare glossari e link alle voci

Knowledge Catalog supporta due metodi principali per la gestione in blocco del glossario. Scegli il metodo più in linea con le tue esigenze di automazione e l'interfaccia che preferisci:

  • Importazione dei metadati basata su JSON
  • Utilità basate su Fogli Google per l'importazione e l'esportazione

Importazione dei metadati basata su JSON

Si tratta del meccanismo integrato e completamente gestito di Knowledge Catalog. Utilizzi l'API Dataplex per importare i termini del glossario e le relative associazioni definite in file di metadati in formato JSON.

Esempio di caso d'uso:aggiorna automaticamente i metadati di Knowledge Catalog nell'ambito di una pipeline di dati pianificata giornalmente, ad esempio sincronizza i termini direttamente da un database aziendale esterno.

Per saperne di più, consulta Importare glossari e link alle voci utilizzando file JSON.

Utilità basate su Fogli Google per l'importazione e l'esportazione

Si tratta di un approccio open source basato su script fornito nel repository dataplex-labs. Utilizza uno script Python per sincronizzare i metadati del glossario tra un foglio Google e Knowledge Catalog.

Esempio di caso d'uso: un team di governance dei dati vuole redigere e rivedere in collaborazione decine di nuovi termini aziendali con gli stakeholder aziendali non tecnici. Il team utilizza questo metodo basato su fogli di lavoro per consentire a tutti di modificare, commentare e approvare i termini in Fogli Google prima che un amministratore esegua lo script per caricarli in blocco in Knowledge Catalog.

Per saperne di più, consulta i seguenti documenti:

Caso d'uso comune: modifica round trip con Fogli Google

Un flusso di lavoro amministrativo comune è l'esecuzione della modifica round trip. Ciò comporta l'esportazione della configurazione del catalogo esistente, l'apporto di modifiche collettive e l'applicazione di queste modifiche a Knowledge Catalog.

Il seguente flusso di lavoro illustra come eseguire questa procedura:

  1. Esporta i metadati esistenti da Knowledge Catalog in Fogli Google.

    Utilizza le utilità di esportazione del glossario e di esportazione dei link alle voci per estrarre la struttura del glossario e i link alle voci esistenti in un foglio Google.

  2. Modifica i metadati in Fogli Google.

    Apporta le modifiche necessarie nel foglio Google. Poiché i link simmetrici (come i link di ingresso synonym e related) vengono semplificati in una singola direzione durante l'esportazione per evitare righe duplicate, devi gestirli una sola volta.

    Puoi aggiungere nuove righe al foglio corrispondente seguendo lo schema delle colonne richiesto. Puoi anche modificare i dettagli, come le descrizioni o i nomi visualizzati, direttamente nelle righe.

  3. Organizza e importa le modifiche da Fogli Google a Knowledge Catalog.

    Esegui prima l'utilità di importazione del glossario. In questo modo, tutti i nuovi termini o categorie vengono creati correttamente nel glossario aziendale prima di tentare di collegarli.

    Esegui l'utilità Importazione link di accesso. Questa utilità legge le associazioni aggiornate, le organizza nel bucket Cloud Storage e applica i link definition, related e synonym al glossario appena aggiornato.

Passaggi successivi