Puoi esplorare i risultati delle query BigQuery utilizzando i notebook Colab Enterprise in BigQuery.
In questo tutorial, esegui query sui dati da un set di dati pubblico BigQuery ed esplori i risultati della query in un notebook.
Autorizzazioni obbligatorie
Per creare ed eseguire blocchi note, devi disporre dei seguenti ruoli IAM (Identity and Access Management):
- Utente BigQuery (
roles/bigquery.user
) - Utente runtime notebook (
roles/aiplatform.notebookRuntimeUser
) - Code Creator (
roles/dataform.codeCreator
)
Aprire i risultati della query in un notebook
Puoi eseguire una query SQL e poi utilizzare un notebook per esplorare i dati. Questo approccio è utile se vuoi modificare i dati in BigQuery prima di utilizzarli o se hai bisogno solo di un sottoinsieme dei campi della tabella.
Nella console Google Cloud , vai alla pagina BigQuery.
Nel campo Digita per effettuare la ricerca, inserisci
bigquery-public-data
.Se il progetto non viene visualizzato, inserisci
bigquery
nel campo di ricerca, quindi fai clic su Cerca in tutti i progetti in modo da confrontare la stringa di ricerca con i progetti esistenti.Seleziona bigquery-public-data > ml_datasets > penguins.
Per la tabella penguins, fai clic su
Visualizza azioni, quindi fai clic su Query.Aggiungi un asterisco (
*
) per la selezione dei campi alla query generata, in modo che sia simile al seguente esempio:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Fai clic su
Esegui.Nella sezione Risultati delle query, fai clic su Esplora dati e poi su Esplora con il notebook Python.
Prepara il notebook per l'uso
Prepara il notebook per l'uso connettendoti a un runtime e impostando i valori predefiniti dell'applicazione.
- Nell'intestazione del blocco note, fai clic su Connetti per connetterti al runtime predefinito.
- Nel blocco di codice Setup, fai clic su Esegui cella.
esplora i dati
- Per caricare i dati penguins in un DataFrame BigQuery e mostrare i risultati, fai clic su Esegui cella nel blocco di codice nella sezione Set di risultati caricato dal job BigQuery come DataFrame.
- Per ottenere metriche descrittive per i dati, fai clic su Esegui cella nel blocco di codice nella sezione Mostra statistiche descrittive utilizzando describe().
- (Facoltativo) Utilizza altre funzioni o pacchetti Python per esplorare e analizzare i dati.
Il seguente esempio di codice mostra l'utilizzo di
bigframes.pandas
per analizzare i dati e di bigframes.ml
per creare un modello di regressione lineare dai dati penguins in un
DataFrame BigQuery: