Utilizzare i prodotti dati

Questo documento è destinato ai consumatori di prodotti di dati di Knowledge Catalog (precedentemente Dataplex Universal Catalog) che vogliono scoprire e utilizzare i prodotti di dati per i loro casi d'uso.

Per saperne di più sull'architettura e sui concetti chiave dei prodotti di dati, consulta Informazioni sui prodotti di dati.

Prima di iniziare

  1. Abilita le API Dataplex e BigQuery.

    Ruoli richiesti per abilitare le API

    Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

    Abilita le API

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per cercare, accedere e utilizzare i prodotti di dati, chiedi all'amministratore di concederti i seguenti ruoli IAM sul prodotto di dati o sul progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

In qualità di consumatore di un prodotto di dati, per visualizzare i metadati di un asset, devi disporre dell'autorizzazione viewer per accedere all'asset corrispondente nel sistema di origine. Ad esempio, per cercare i metadati di un set di dati o di una tabella in un prodotto di dati, devi disporre del ruolo Visualizzatore metadati BigQuery (roles/bigquery.metadataViewer). Per saperne di più, consulta Ruoli richiesti per accedere ai risultati di ricerca.

Console

  1. Nella console Google Cloud , vai alla pagina Ricerca di Knowledge Catalog.

    Vai a Cerca

  2. Cerca utilizzando parole chiave o il linguaggio naturale. Per saperne di più, consulta Cercare risorse.

  3. Nei risultati di ricerca, fai clic sul prodotto di dati di cui vuoi visualizzare i dettagli. Puoi esaminare la descrizione, gli asset, il contratto, gli aspetti, i dettagli di contatto e altra documentazione associata al prodotto dati.

REST

Per cercare un prodotto di dati, utilizza il metodo searchEntries.

Ad esempio, invia la seguente richiesta POST:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d \
  '{
  "query": "ADDITIONAL_KEYWORDS (type=(DATA_PRODUCT))",
  "pageSize": 10
  }' \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/global:searchEntries"

Sostituisci quanto segue:

  • ADDITIONAL_KEYWORDS (facoltativo): eventuali parole chiave o criteri di ricerca aggiuntivi per restringere i risultati (ad esempio, displayName:'My Data Product' o description:'sales')
  • PROJECT_ID: l'ID del tuo progetto Google Cloud in cui viene creato il prodotto di dati

Richiedere l'accesso ai prodotti di dati

In qualità di consumatore di prodotti di dati, se non disponi delle autorizzazioni IAM per accedere a un prodotto di dati, puoi richiedere l'accesso utilizzando i flussi di lavoro di approvazione dell'accesso integrati.

Invia una richiesta di accesso

Console

  1. Nella console Google Cloud , vai alla pagina Prodotti di dati di Knowledge Catalog.

    Vai a Prodotti di dati

  2. Fai clic sul prodotto di dati a cui vuoi accedere.

  3. Fai clic su Richiedi accesso.

  4. Nel riquadro Dettagli richiesta, specifica i seguenti parametri:

    • Gruppi di accesso: seleziona il gruppo di accesso funzionale a cui vuoi unirti.
    • Self o Service account: seleziona il tipo di entità di sicurezza:

      • Se richiedi l'accesso per te, seleziona Personale.

      • Se richiedi l'accesso per l'identità programmatica, seleziona Service account. Questa opzione è disponibile solo se il prodotto dati supporta i service account.

    • Giustificazione: inserisci una giustificazione aziendale per la tua richiesta.

  5. Fai clic su Invia.

Viene generata una nuova richiesta di modifica che il proprietario del prodotto di dati deve esaminare. Riceverai una notifica via email con lo stato finale non appena la richiesta verrà approvata o rifiutata.

REST

I consumatori di prodotti di dati che dispongono dell'autorizzazione dataplex.dataProducts.get possono richiedere l'accesso creando una risorsa ChangeRequest. Invia una richiesta POST all'endpoint della risorsa del prodotto di dati utilizzando il metodo personalizzato :requestAccess:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d '{
  "parent": "projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID",
  "change_request": {
    "justification": "JUSTIFICATION_TEXT",
    "data_product_access_request": {
      "parent": "projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID",
      "access_group_id": "DATA_PRODUCT_ACCESS_GROUP_ID"
    }
  }
}' \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataProducts/DATA_PRODUCT_ID:requestAccess"

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del tuo progetto Google Cloud

  • LOCATION: la regione in cui esiste il prodotto dati (ad esempio us-central1)

  • DATA_PRODUCT_ID: l'identificatore univoco del prodotto di dati di destinazione

  • JUSTIFICATION_TEXT: il motivo aziendale che spiega perché è necessario l'accesso

  • DATA_PRODUCT_ACCESS_GROUP_ID: l'ID del gruppo di accesso specifico a cui stai richiedendo di partecipare

Visualizzare lo stato delle richieste di accesso

In qualità di consumatore di prodotti di dati, puoi monitorare l'avanzamento e il ciclo di vita delle richieste di accesso inviate. Knowledge Catalog monitora e mostra queste richieste utilizzando stati distinti a seconda che tu stia visualizzando un elenco di workflow unificato o un riepilogo dell'accesso di un prodotto specifico.

Visualizzare un elenco unificato delle richieste di accesso

Per visualizzare un elenco completo di tutte le richieste di accesso inviate per tutti i prodotti di dati, segui questi passaggi:

Console

  1. Nella console Google Cloud , vai alla pagina Workflow di governance del Knowledge Catalog.

    Vai a Workflow di governance

  2. Fai clic sulla scheda Le mie richieste.

  3. Esamina l'elenco unificato che mostra le richieste passate e in attesa, insieme ai relativi stati del workflow attuali:

    • Nuova: la richiesta di accesso è stata creata ed è in attesa di revisione da parte dell'approvatore.

    • Approvata: la richiesta è stata approvata, ma i sistemi di backend stanno ancora effettuando il provisioning dell'accesso.

    • Rifiutata: la richiesta è stata negata. Esamina i commenti dell'approvatore per vedere la motivazione del rifiuto.

REST

Invia una richiesta GET utilizzando il metodo di raccolta personalizzato :listMine:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/changeRequests:listMine"

Visualizzare il riepilogo degli accessi per un prodotto dati specifico

Oltre all'elenco dei workflow globali, puoi controllare la tua postura di accesso per un singolo prodotto di dati. In questo modo puoi verificare se disponi già dell'accesso ereditato a un gruppo di asset senza dover inviare una nuova richiesta.

Per visualizzare il riepilogo dell'accesso per un prodotto di dati:

Console

  1. Nella console Google Cloud , vai alla pagina Prodotti di dati di Knowledge Catalog.

    Vai a Prodotti di dati

  2. Fai clic sul prodotto di dati specifico che vuoi esaminare.

  3. Fai clic sulla scheda Riepilogo accesso. Controlla il tuo stato in tutti i gruppi di accesso per quel prodotto dati.

    La scheda Riepilogo accesso utilizza i seguenti stati:

    Stato Descrizione
    Nessun accesso Non hai accesso al gruppo di accesso e non hai ancora richiesto l'accesso.
    In corso di revisione Hai inviato una richiesta di accesso ed è in attesa di revisione da parte di un approvatore.
    Approvato La tua richiesta di accesso è stata approvata, ma la propagazione dell'iscrizione al gruppo Google sottostante è ancora in fase di elaborazione.
    Accesso concesso L'accesso è completamente attivo. Fai parte del gruppo di accesso e puoi interagire con gli asset del prodotto di dati.
    Rifiutata La tua richiesta di accesso a questo gruppo di accesso è stata rifiutata.

REST

Invia una richiesta GET utilizzando l'ID univoco restituito al momento della creazione iniziale della richiesta:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://dataplex.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/changeRequests/CHANGE_REQUEST_ID"

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del tuo progetto Google Cloud

  • LOCATION: la regione in cui esiste il prodotto dati (ad esempio us-central1)

  • CHANGE_REQUEST_ID: l'ID univoco della richiesta di modifica inviata

Eliminare una richiesta di accesso

  1. Nella console Google Cloud , vai alla pagina Workflow di governance del Knowledge Catalog.

    Vai a Workflow di governance

  2. Fai clic sulla scheda Le mie richieste.

  3. Individua la riga contenente la richiesta del prodotto di dati di destinazione. Se necessario, applica un filtro per isolare la voce.

  4. Fai clic su Azioni e poi su Elimina.

Utilizzare i prodotti di dati

Per utilizzare un prodotto di dati, assicurati di disporre delle autorizzazioni necessarie. Consulta Richiedere l'accesso ai prodotti di dati.

Dopo che il proprietario del prodotto di dati ti ha concesso l'autorizzazione, puoi accedere al prodotto di dati e alle relative risorse. Ad esempio, se ti vengono concesse le autorizzazioni per accedere a una tabella BigQuery, puoi eseguire query direttamente in BigQuery per generare insight.

Accedere agli asset utilizzando le credenziali utente

Se la tua richiesta di accesso è stata approvata per le tue credenziali utente, segui questi passaggi per accedere agli asset:

  1. Cerca il prodotto di dati.
  2. Nei risultati di ricerca, fai clic sul prodotto di dati che vuoi utilizzare.
  3. Fai clic sulla scheda Asset.
  4. Fai clic sull'asset di cui vuoi visualizzare i dettagli. Si apre la pagina dei dettagli della voce.

    Puoi accedere a dettagli come schema, approfondimenti e derivazione. Se l'asset è una tabella o una vista BigQuery, puoi fare clic su Apri in BigQuery per passare a BigQuery Studio ed eseguire query sui risultati.

Accedere agli asset utilizzando un account di servizio

Se la tua richiesta di accesso è stata approvata per un account di servizio, ti viene concesso il ruolo IAM Creatore token service account (roles/iam.serviceAccountTokenCreator) sul account di servizio del produttore di dati. In questo modo puoi creare una catena di rappresentazione per accedere agli asset sottostanti.

Per accedere agli asset utilizzando un account di servizio:

  1. Identifica i service account configurati per il prodotto di dati andando alla scheda Asset di dati della pagina dei dettagli del prodotto di dati.

  2. Per simulare l'identità del account di servizio del produttore di dati, crea una catena di simulazione per il tuo account di servizio utilizzando il seguente comando Google Cloud CLI:

    gcloud config set auth/impersonate_service_account CONSUMER_SERVICE_ACCOUNT,PRODUCER_SERVICE_ACCOUNT
    

    Sostituisci quanto segue:

    • CONSUMER_SERVICE_ACCOUNT: l'indirizzo email completo delaccount di serviziot appartenente al consumer del prodotto di dati

    • PRODUCER_SERVICE_ACCOUNT: l'indirizzo email completo del account di servizio mappato al gruppo di accesso al prodotto dati

    Per saperne di più, consulta Utilizza account di servizio account.

Accedere ai prodotti di dati utilizzando il server MCP remoto

Per le applicazioni client e gli strumenti per sviluppatori che interagiscono con i tuoi prodotti di dati al di fuori dell'ecosistema Google Cloud , puoi utilizzare un server Model Context Protocol (MCP) remoto. Questo pattern architetturale consente ai client sviluppatori esterni di eseguire query e scoprire in modo sicuro gli asset di dati catalogati, mantenendo al contempo limiti di governance unificati.

Per scoprire come eseguire il deployment e connetterti a un server esterno, consulta Utilizzare il server MCP remoto del Knowledge Catalog.

Passaggi successivi