Quando esplorano una tabella nuova e sconosciuta, gli analisti dei dati spesso si trovano di fronte al problema dell'avvio a freddo di come iniziare a scrivere query. Il problema può comportare incertezza sulla struttura dei dati e sui pattern chiave nei dati.
Approfondimenti sui dati risolve il problema dell'avvio a freddo generando automaticamente query in linguaggio naturale e i relativi equivalenti SQL in base ai metadati di una tabella. Anziché iniziare con un editor di query vuoto, puoi iniziare rapidamente l'esplorazione dei dati con query significative che offrono insight preziosi. Per approfondire l'argomento, puoi porre domande aggiuntive nel canvas dei dati.
La funzionalità di approfondimenti sui dati di Dataplex Universal Catalog offre un modo automatizzato per esplorare e comprendere i dati. Ciò ti aiuta a scoprire pattern, valutare la qualità dei dati ed eseguire analisi statistiche.
Prima di iniziare
Gli approfondimenti sui dati vengono generati utilizzando
Gemini in BigQuery
e possono essere generati solo in BigQuery Studio.
Per prima cosa, configura Gemini in BigQuery, poi genera insight in BigQuery.
Gemini elabora i metadati per gli approfondimenti esclusivamente nella regione us-central1
. Per saperne di più, consulta Località di pubblicazione di Gemini.
Dopo aver generato gli approfondimenti, puoi visualizzarli in Dataplex Universal Catalog.
Ruoli obbligatori
Per ottenere l'accesso di sola lettura agli approfondimenti generati, chiedi all'amministratore di concederti il seguente ruolo IAM:
- Visualizzatore dati Dataplex DataScan (
roles/dataplex.dataScanDataViewer
) nel progetto contenente le tabelle BigQuery per le quali vuoi visualizzare gli approfondimenti.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti. Per vedere quali sono esattamente le autorizzazioni richieste per generare insight, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
dataplex.datascans.get
dataplex.datascans.getData
Abilita API
Per utilizzare gli approfondimenti sui dati, abilita le seguenti API nel tuo progetto: API Dataplex, API BigQuery e API Gemini in Google Cloud.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM
role (roles/serviceusage.serviceUsageAdmin
), which
contains the serviceusage.services.enable
permission. Learn how to grant
roles.
Per saperne di più su come abilitare l'API Gemini for Google Cloud, vedi Abilita l'API Gemini for Google Cloud in un progetto Google Cloud .
Informazioni sugli approfondimenti sui dati
Data Insights genera automaticamente query in linguaggio naturale e i relativi equivalenti SQL in base ai metadati di una tabella.
Esempio di esecuzione di approfondimenti
Considera una tabella denominata telco_churn
con i seguenti metadati:
Nome campo | Tipo |
---|---|
CustomerID | STRING |
Genere | STRING |
Periodo di incarico | INT64 |
InternetService | STRING |
StreamingTV | STRING |
OnlineBackup | STRING |
Contratto | STRING |
TechSupport | STRING |
PaymentMethod | STRING |
MonthlyCharges | FLOAT |
Tasso di abbandono | BOOLEAN |
Di seguito sono riportate alcune delle query di esempio che approfondimenti sui dati genera per questa tabella:
Identifica i clienti che hanno eseguito la sottoscrizione di tutti i servizi premium e che sono clienti da più di 50 mesi.
SELECT CustomerID, Contract, Tenure FROM agentville_datasets.telco_churn WHERE OnlineBackup = 'Yes' AND TechSupport = 'Yes' AND StreamingTV = 'Yes' AND Tenure > 50;
Identifica il servizio internet con il maggior numero di clienti persi.
SELECT InternetService, COUNT(DISTINCT CustomerID) AS total_customers FROM agentville_datasets.telco_churn WHERE Churn = TRUE GROUP BY InternetService ORDER BY total_customers DESC LIMIT 1;
Identifica i tassi di abbandono per segmento tra i clienti di alto valore.
SELECT Contract, InternetService, Gender, PaymentMethod, COUNT(DISTINCT CustomerID) AS total_customers, SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers, (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID)) * 100 AS churn_rate FROM agentville_datasets.telco_churn WHERE MonthlyCharges > 100 GROUP BY Contract, InternetService, Gender, PaymentMethod;
Visualizza insight
Per visualizzare gli approfondimenti per una tabella BigQuery, utilizza la ricerca di Dataplex Universal Catalog.
Nella console Google Cloud , vai alla pagina Cerca di Dataplex Universal Catalog.
Cerca una tabella BigQuery per cui vuoi visualizzare gli approfondimenti.
Nei risultati di ricerca, fai clic sulla tabella per aprire la relativa pagina di inserimento.
Fai clic sulla scheda Approfondimenti. Se la scheda è vuota, significa che gli approfondimenti per questa tabella non sono ancora stati generati. Puoi generare approfondimenti sui dati in BigQuery Studio.
Prezzi
Per informazioni dettagliate sui prezzi di questa funzionalità, vedi Panoramica dei prezzi di Gemini in BigQuery.
Quote e limiti
Per informazioni su quote e limiti per questa funzionalità, vedi Quote per Gemini in BigQuery.
Località
Gemini opera a livello globale, quindi non puoi limitare l'elaborazione dei dati a una regione specifica. Per scoprire di più sulle località in cui Gemini in BigQuery elabora i dati, consulta Località di pubblicazione di Gemini.
Limitazioni
- Approfondimenti sui dati è disponibile per tabelle BigQuery, tabelle BigLake, tabelle esterne e viste.
- Per i clienti multicloud, i dati di altri cloud non sono disponibili.
- Approfondimenti sui dati non supporta i tipi di colonne
Geo
oJSON
. - Le esecuzioni degli approfondimenti non garantiscono la presentazione delle query ogni volta. Per aumentare la probabilità di generare query più coinvolgenti, rigenera gli approfondimenti in BigQuery Studio.
Passaggi successivi
- Scopri come generare insight in BigQuery.
- Scopri come generare una scansione di profilazione dei dati.
- Scopri come scrivere query con l'assistenza di Gemini in BigQuery.