Esportare i link alle voci in un foglio Google

Questo documento spiega come utilizzare l'utilità di esportazione dei link alle voci per estrarre i link alle voci (relazioni tra i termini del glossario e gli asset di dati) da Knowledge Catalog (precedentemente Dataplex Universal Catalog) in un foglio Google.

Puoi esportare i link alle voci in un foglio Google per controllare i link esistenti, eseguire il backup dei metadati o preparare un modello per gli aggiornamenti collettivi.

Prima di iniziare

Prima di esportare i link alle voci in un foglio Google, completa i seguenti prerequisiti.

Configurare il service account

Per eseguire l'utilità di esportazione, devi configurare un account di servizio con le autorizzazioni necessarie per accedere all'API Google Sheets e simulare le tue credenziali utente:

  1. Identifica o crea un account di servizio.

    Seleziona un account di servizio esistente o creane uno nuovo nel progetto in cui esegui l'utilità di importazione. Per saperne di più, vedi Creare service account. Prendi nota dell'indirizzo email del account di servizio (ad esempio, SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com).

  2. Configura la simulazione dell'identità del account di servizio.

    Per eseguire lo script dell'utilità di esportazione in locale, il tuo account utente deve disporre dell'autorizzazione per rappresentare il account di servizio. Concedi al tuo account utente il ruolo Creatore token account di servizio (roles/iam.serviceAccountTokenCreator) nell'account di servizio.

    Per saperne di più, vedi Gestire l'accesso ai service account.

  3. Concedi al account di servizio l'accesso Editor al foglio Google.

    Apri il foglio Google che vuoi utilizzare per la procedura di importazione, fai clic su Condividi e aggiungi l'email dell'account di servizio come Editor. Questa autorizzazione consente alaccount di serviziot di leggere o scrivere dati nel tuo foglio.

Ruoli obbligatori

Per assicurarti che il account di servizio disponga delle autorizzazioni necessarie per esportare i link alle voci in un foglio Google, chiedi all'amministratore di concedere account di serviziount i seguenti ruoli IAM:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

L'amministratore potrebbe anche essere in grado di concedere al account di servizio le autorizzazioni richieste tramite ruoli personalizzati o altri ruoli predefiniti.

Abilita API

Per esportare i link alle voci, abilita le seguenti API nel tuo progetto:

Ruoli richiesti per abilitare le API

Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

Abilita le API

Configura il repository Git

Clona il repository dataplex-labs:

git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import/dataplex-glossary/export

Installa le dipendenze

Installa le dipendenze Python richieste:

pip3 install -r requirements.txt
cd dataplex-glossary

Se riscontri problemi con l'installazione del pacchetto, configura un nuovo ambiente di sviluppo Python.

Autentica e configura la simulazione dell'identità del account di servizio

Inizializza Google Cloud CLI ed esegui l'autenticazione utilizzando le credenziali predefinite dell'applicazione (ADC) con la simulazione dell'identità del account di servizio:

# Set your service account email address
SA_EMAIL="SERVICE_ACCOUNT_EMAIL"

# Authenticate ADC using service account impersonation and required scopes
gcloud init
gcloud auth login
gcloud auth application-default login \
  --impersonate-service-account="${SA_EMAIL}" \
  --scopes="https://www.googleapis.com/auth/spreadsheets"

Sostituisci SERVICE_ACCOUNT_EMAIL con l'ID email del account di servizio. Ad esempio:

SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

Configurare il foglio Google di destinazione per l'esportazione

Crea un foglio Google vuoto o utilizzane uno esistente. Lo script di esportazione scrive nel primo foglio. Assicurati di aver concesso al account di servizio Editor l'accesso al foglio Google.

Imposta le variabili di ambiente

Imposta le seguenti variabili di ambiente:

# Set your glossary URL
export GLOSSARY_URL="GLOSSARY_URL"

# Set your Google Sheet URL
export SPREADSHEET_URL="GOOGLE_SHEET_URL"

# Set the project ID
export USER_PROJECT="USER_PROJECT"

Esportare i link alle voci nel foglio Google

Per esportare i link delle voci di un glossario nel foglio Google, esegui il seguente script:

cd export
python3 entrylinks-export.py \
  --glossary-url="$GLOSSARY_URL" \
  --spreadsheet-url="$SPREADSHEET_URL" \
  --user-project="$USER_PROJECT"

Puoi esaminare i log di esecuzione nella directory logs/ nel percorso di esecuzione locale. Questi log ti aiutano a controllare la procedura di trasferimento e a identificare le voci ignorate o gli avvisi di formattazione.

Verificare i dati dei link delle voci esportate

Lo script di esportazione compila il foglio Google con le seguenti colonne:

Intestazione di colonna Descrizione
entry_link_type Il tipo di link della voce (definition, related o synonym).
source_entry Il percorso completo della risorsa della voce di origine.
target_entry Il percorso completo della risorsa della voce di destinazione.
source_path Percorso della colonna o del campo per i link alle definizioni.

Passaggi successivi