Utilizzare gli approfondimenti sui dati per i dati strutturati

Questo documento spiega come generare, visualizzare e gestire gli insight sui dati per i dati strutturati. L'utilizzo degli insight sui dati basati sull'AI ti aiuta ad accelerare l'esplorazione dei dati generando automaticamente descrizioni, grafici delle relazioni e query SQL dai metadati di tabelle e set di dati.

In BigQuery Studio, puoi generare insight sui dati per set di dati, tabelle, viste, tabelle Google Cloud Lakehouse e tabelle esterne BigQuery.

In Knowledge Catalog, puoi generare insight sui dati per le tabelle del catalogo REST Iceberg di Lakehouse.

Prima di iniziare

Prima di utilizzare gli insight sui dati, assicurati di aver completato i seguenti prerequisiti:

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per utilizzare gli insight sui dati, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questi ruoli predefiniti contengono le autorizzazioni necessarie per utilizzare gli insight sui dati. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per utilizzare gli insight sui dati sono necessarie le seguenti autorizzazioni:

  • dataplex.datascans.create
  • dataplex.datascans.get
  • dataplex.datascans.getData
  • dataplex.datascans.run

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Abilita API

Per utilizzare gli insight sui dati, abilita le seguenti API nel tuo progetto:

  • API Dataplex
  • API BigQuery
  • API Gemini for Google Cloud

Ruoli richiesti per abilitare le API

Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo servizi (roles/serviceusage.serviceUsageAdmin), che contiene l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

Abilita le API

Per saperne di più sull'abilitazione dell'API Gemini for Google Cloud, consulta Abilita l'API Gemini for Google Cloud in un Google Cloud progetto.

Preparazione dei dati

Per le tabelle Google Cloud Lakehouse, assicurati che i dati si trovino in Cloud Storage e che sia stata creata una tabella Google Cloud Lakehouse.

Per le tabelle del catalogo REST Iceberg, assicurati che le tabelle siano registrate nel catalogo di runtime di Lakehouse.

Genera insight in BigQuery

Gli insight sui dati per set di dati, tabelle, viste, tabelle Google Cloud Lakehouse e tabelle esterne BigQuery vengono generati utilizzando Gemini in BigQuery e possono essere generati solo in BigQuery Studio.

Devi prima configurare Gemini in BigQuery, quindi generare gli insight. Dopo aver generato gli insight, puoi visualizzarli e modificarli in Knowledge Catalog.

Per saperne di più sulla generazione di insight in BigQuery, consulta i seguenti documenti:

Genera insight per le tabelle del catalogo REST Iceberg

  1. Nella Google Cloud console, vai alla pagina Cerca di Knowledge Catalog.

    Vai a Cerca

  2. In Filtri, seleziona Lakehouse.

  3. Seleziona la tabella del catalogo REST Iceberg per cui vuoi generare insight.

  4. Fai clic sulla scheda Insight. Se la scheda è vuota, significa che gli insight per questa tabella non sono ancora stati generati.

  5. Per generare insight e allegarli in modo permanente alla tabella come aspetti, fai clic su Genera e pubblica. In questo modo, gli insight diventano indicizzabili, ricercabili e visibili agli altri utenti della tua organizzazione all'interno di Knowledge Catalog.

    Per generare insight e visualizzarli temporaneamente durante la sessione corrente, fai clic su Genera senza pubblicare. Utilizza questa opzione se hai bisogno solo di un'analisi rapida dei dati senza salvare i metadati in Knowledge Catalog.

    Per saperne di più sulle differenze tra le modalità Genera e pubblica e Genera senza pubblicare, consulta Modalità per la generazione di insight sui dati.

  6. Seleziona una regione per generare insight e fai clic su Genera.

    La compilazione degli insight richiede alcuni minuti.

  7. Fai clic sulla scheda Insight ed esamina quanto segue:

    • Descrizioni: si tratta di riepiloghi generati dall'AI che spiegano lo scopo della tabella e descrivono colonne specifiche.
    • Query di esempio: si tratta dell'elenco di query SQL personalizzate progettate specificamente per lo schema e i contenuti del set di dati.
  8. Per visualizzare la query SQL che risponde a una domanda, fai clic sulla domanda.

Esamina gli insight generati per una risorsa

Per visualizzare gli insight generati per una risorsa, segui questi passaggi:

  1. Nella Google Cloud console, vai alla pagina Cerca di Knowledge Catalog.

    Vai a Cerca

  2. Cerca la risorsa per cui vuoi visualizzare gli insight.

  3. Nei risultati di ricerca, fai clic sulla risorsa per aprire la relativa pagina dei dettagli della voce.

  4. Esamina le descrizioni e le query generate per la risorsa selezionata.

  5. Per visualizzare i grafici delle relazioni per capire come si collegano i punti dati, fai clic sulla scheda Relazioni (anteprima). Puoi visualizzare le relazioni solo a livello di tabella, non a livello di set di dati.

Gestisci gli insight sulle tabelle

Dopo aver generato e pubblicato gli insight sulle tabelle, puoi esaminarli e gestirli come aspetti dei metadati in Knowledge Catalog. Gli insight a livello di tabella includono descrizioni di tabelle e colonne e query di esempio.

Aggiorna le descrizioni generate per una tabella

Puoi aggiornare le descrizioni di tabelle e colonne utilizzando solo l'API Dataplex. Per farlo, utilizza il entries.patch.

Aggiorna le query generate per una tabella

Puoi aggiornare le query generate per una tabella utilizzando sia la Google Cloud console che l'API Dataplex.

Console

  1. Cerca la tabella per cui vuoi aggiornare le query generate.

  2. Nei risultati di ricerca, fai clic sulla tabella per aprire la relativa pagina dei dettagli della voce.

  3. Nella sezione Query, fai clic su Modifica.

  4. Aggiorna la descrizione della query in base alle tue esigenze.

  5. Gestisci la proprietà: per impostazione predefinita, l'origine è impostata su Agente. Se modifici una query e cambi l'origine in Utente, le successive esecuzioni di generazione di insight non sostituiranno le modifiche. Se l'origine rimane Agente, la query potrebbe essere sostituita durante una rigenerazione.

  6. Gestisci le sostituzioni: per impedire che tutte le query vengano sostituite durante una nuova esecuzione, puoi impostare l'opzione Gestita dall'utente su True. Questa impostazione si applica all'intero set di query per l'aspetto dei metadati, garantendo che non vengano perse modifiche manuali.

REST

Per aggiornare le query per una tabella, utilizza il entries.patch.

Aggiorna le relazioni generate per una tabella

Puoi aggiornare le relazioni utilizzando solo l'API Dataplex. Per farlo, utilizza il metodo entries.patch.

Gestisci gli insight sui set di dati

Gli insight a livello di set di dati si concentrano su descrizioni di alto livello e query a livello di set di dati.

Aggiorna le descrizioni generate per un set di dati

Puoi aggiornare le descrizioni del set di dati utilizzando solo l'API Dataplex. Per farlo, utilizza il entries.patch.

Aggiorna le query generate per un set di dati

Puoi aggiornare le query generate per un set di dati utilizzando sia la Google Cloud console che l'API Dataplex.

Console

  1. Cerca il set di dati per cui vuoi aggiornare le query generate.

  2. Nei risultati di ricerca, fai clic sul set di dati per aprire la relativa pagina dei dettagli della voce.

  3. Nella sezione Query, fai clic su Modifica.

  4. Aggiorna la descrizione in base alle tue esigenze.

  5. Gestisci la proprietà: per impostazione predefinita, l'origine è impostata su Agente. Se modifici una query e cambi l'origine in Utente, le successive esecuzioni di generazione di insight non sostituiranno le modifiche. Se l'origine rimane Agente, la query potrebbe essere sostituita durante una rigenerazione.

  6. Gestisci le sostituzioni: per impedire che tutte le query vengano sostituite durante una nuova esecuzione, puoi impostare l'opzione Gestita dall'utente su True. Questa impostazione si applica all'intero set di query per l'aspetto dei metadati, garantendo che non vengano perse modifiche manuali.

REST

Per aggiornare le query per un set di dati, utilizza il entries.patch.

Passaggi successivi