Questo documento spiega come utilizzare l'utilità di esportazione del glossario aziendale per estrarre glossari, categorie e termini da Knowledge Catalog (in precedenza Dataplex Universal Catalog) in un Foglio Google per la gestione e la generazione di report in blocco.
L'utilità glossary_export recupera i metadati dal glossario aziendale di Knowledge Catalog e compila un Foglio Google con uno schema strutturato, incluse descrizioni, responsabili dei dati ed etichette.
Prima di iniziare
Prima di esportare i glossari, completa i seguenti prerequisiti.
Configurare il account di servizio
Per eseguire l'utilità di esportazione, devi configurare un account di servizio con le autorizzazioni necessarie per accedere all'API Google Sheets e simulare le credenziali utente:
Identifica o crea un account di servizio.
Seleziona un account di servizio esistente o creane uno nuovo nel progetto in cui esegui l'utilità di importazione. Per saperne di più, consulta Creare service account. Prendi nota dell'indirizzo email del account di servizio (ad esempio,
SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com).Configura la simulazione dell'identità del account di servizio.
Per eseguire lo script dell'utilità di esportazione in locale, il tuo account utente deve disporre dell'autorizzazione per simulare l'identità del account di servizio. Concedi al tuo account utente il ruolo Creatore token account di servizio (
roles/iam.serviceAccountTokenCreator) nel service account.Per saperne di più, consulta Gestire l'accesso ai service account.
Concedi al account di servizio l'accesso
Editoral Foglio Google.Apri il foglio Google che vuoi utilizzare per la procedura di importazione, fai clic su Condividi, e aggiungi l'indirizzo email del account di servizio come
Editor. Questa autorizzazione consente al account di servizio di leggere o scrivere dati nel foglio.
Ruoli obbligatori
Per assicurarti che il account di servizio disponga delle autorizzazioni necessarie per esportare i glossari in un Foglio Google, chiedi all'amministratore di concedere i seguenti ruoli IAM al account di servizio:
- Dataplex Administrator (
roles/dataplex.admin) sul progetto - Dataplex Catalog Admin (
roles/dataplex.catalogAdmin) sul progetto - Dataplex Catalog Editor (
roles/dataplex.catalogEditor) sul progetto
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
L'amministratore potrebbe anche assegnare al account di servizio le autorizzazioni richieste tramite ruoli personalizzati o altri ruoli predefiniti.
Abilitare le API
Per esportare i glossari, abilita le seguenti API nel tuo progetto:
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo servizi (roles/serviceusage.serviceUsageAdmin), che
contiene l'autorizzazione serviceusage.services.enable. Scopri come concedere
i ruoli.
Configurare il repository Git
Clona il repository dataplex-labs:
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import/dataplex-glossary/export
Installare le dipendenze
Installa le dipendenze Python richieste:
pip3 install -r requirements.txt
Se riscontri problemi con l'installazione del pacchetto, configura un nuovo ambiente di sviluppo Python.
Autenticare e configurare la simulazione dell'identità del account di servizio
Inizializza Google Cloud CLI ed esegui l'autenticazione utilizzando le credenziali predefinite dell'applicazione (ADC) con la simulazione dell'identità del account di servizio:
# Set your service account email address SA_EMAIL="SERVICE_ACCOUNT_EMAIL" # Authenticate ADC using service account impersonation and required scopes gcloud auth application-default login \ --impersonate-service-account="${SA_EMAIL}" \ --scopes="https://www.googleapis.com/auth/spreadsheets"
Sostituisci SERVICE_ACCOUNT_EMAIL con l'ID email del account di servizio. Ad esempio:
SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Configurare il Foglio Google di destinazione per l'esportazione
Crea un Foglio Google vuoto o utilizzane uno esistente. Lo script di esportazione scrive nel primo foglio. Assicurati di aver concesso al account di servizio l'accesso Editor al Foglio Google.
Esportare il glossario nel Foglio Google
Esegui lo script glossary-export.py. Durante l'esecuzione, l'utilità ti chiede il Foglio Google di destinazione e il nome del glossario specifico che vuoi esportare:
python3 glossary-export.py
Puoi esaminare i log di esecuzione nella directory logs/ nel percorso di esecuzione locale. Questi log ti aiutano a controllare la procedura di trasferimento e a identificare le voci saltate o gli avvisi di formattazione.
Verificare i dati del glossario esportati
Lo script di esportazione compila il Foglio Google con le seguenti colonne. Verifica i dati esportati.
| Campo | Descrizione |
|---|---|
id |
Un identificatore univoco per il termine o la categoria all'interno del glossario. |
parent |
L'ID della categoria principale. |
display_name |
Il nome visualizzato del termine o della categoria. |
description |
Una breve descrizione del termine o della categoria. |
overview |
Una descrizione in Rich Text del termine o della categoria (supporta i tag HTML). |
type |
Il tipo di riga: TERM o CATEGORY. |
contact1_email |
L'indirizzo email del responsabile dei dati principale per il termine o la categoria. |
contact1_name |
Il nome del responsabile dei dati principale per il termine o la categoria. |
contact2_email |
L'indirizzo email del responsabile dei dati secondario per il termine o la categoria. |
contact2_name |
Il nome del responsabile dei dati secondario per il termine o la categoria. |
label1_key |
La chiave per la prima etichetta assegnata. |
label1_value |
Il valore per la prima etichetta assegnata. |
label2_key |
La chiave per la seconda etichetta assegnata. |
label2_value |
Il valore per la seconda etichetta assegnata. |
Passaggi successivi
- Scopri come gestire un glossario aziendale.
- Scopri come importare i glossari utilizzando i file JSON.
- Scopri come importare i glossari da un Foglio Google.
- Scopri di più sulla gestione dei metadati.