Crea ed esegui un notebook utilizzando la galleria di notebook
Inizia ad analizzare i dati utilizzando la galleria di notebook in BigQuery Studio.
Prima di iniziare
- Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.
-
Abilita l'API BigQuery.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (
roles/serviceusage.serviceUsageAdmin), che include l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.Per i nuovi progetti, l'API BigQuery viene abilitata automaticamente.
- (Facoltativo) Abilita la fatturazione per il progetto. Se non vuoi attivare la fatturazione o fornire una carta di credito, i passaggi descritti in questo documento funzionano comunque. BigQuery ti offre una sandbox per eseguire i passaggi. Per saperne di più, vedi Attiva la sandbox di BigQuery.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare un notebook di esecuzione, chiedi all'amministratore di concederti i seguenti ruoli IAM per il progetto:
-
BigQuery Read Session User (
roles/bigquery.readSessionUser) -
Utente BigQuery Studio (
roles/bigquery.studioUser)
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Se non hai mai utilizzato i blocchi note in BigQuery, consulta le autorizzazioni richieste nella pagina Crea blocchi note.
Galleria notebook
La galleria di blocchi note è un hub centrale per scoprire e utilizzare i modelli di blocchi note predefiniti. Questi modelli ti consentono di eseguire attività comuni come la preparazione, l'analisi e la visualizzazione dei dati. I modelli di blocchi note ti aiutano anche a esplorare le funzionalità di BigQuery Studio, gestire i workflow e promuovere le best practice.
Puoi utilizzare i modelli della galleria di blocchi note per semplificare l'intero flusso di lavoro dall'intenzione agli approfondimenti in ogni fase del ciclo di vita dei dati, dall'importazione e dall'esplorazione all'analisi avanzata e a BigQuery ML.
La galleria dei blocchi note fornisce modelli per ogni livello di competenza. La galleria include modelli fondamentali per SQL, Python, Apache Spark e DataFrame. Puoi anche esplorare argomenti come l'AI generativa e l'analisi dei dati multimodali in BigQuery.
Per saperne di più sull'utilizzo dei modelli della galleria di blocchi note, consulta Creare un blocco note utilizzando la galleria di blocchi note.
Creare un notebook da un modello della galleria di notebook
L'esempio seguente utilizza il modello Introduzione ai notebook in BigQuery Studio. Questo blocco note mostra come eseguire le seguenti attività:
- Esegui query sui dati: esegui query utilizzando le celle SQL.
- Visualizza i risultati delle query: crea visualizzazioni senza codice utilizzando le celle di visualizzazione.
- Pulisci e trasforma i dati: ordina, deduplica e filtra i dati utilizzando l'API BigQuery DataFrames (pandas).
- Esegui previsioni dell'AI: genera previsioni utilizzando la
(funzione
AI.FORECAST) in BigQuery DataFrames. La funzioneAI.FORECASTutilizza il foundation model TimesFM per generare previsioni direttamente da un set di dati senza richiedere l'addestramento del modello. - Traccia i dati: traccia i dati utilizzando le librerie di visualizzazione integrate di Python. Tracci i dati utilizzando la libreria di visualizzazione BigQuery DataFrames, basata su Matplotlib e Pandas.
Per utilizzare il notebook, apri il modello, convertilo in un notebook eseguibile, connettiti all'ambiente di runtime del notebook e poi esegui il notebook.
Apri il modello e convertilo in un notebook eseguibile
Prima di poter utilizzare un notebook creato da un modello della galleria di notebook, devi convertire il modello in un notebook eseguibile.
Per aprire il modello Introduzione ai notebook in BigQuery Studio nella galleria dei notebook e convertirlo in un notebook eseguibile, segui questi passaggi:
Vai alla pagina Studio.
Fai clic sul menu a discesa freccia e poi scegli Notebook > Tutti i modelli.
In alternativa, dalla home page di BigQuery Studio, fai clic su Visualizza galleria di notebook.
Fai clic sulla scheda Introduzione ai notebook in BigQuery Studio o cercala nella galleria.
Dopo aver aperto il modello, fai clic su Utilizza questo modello per convertirlo in un notebook eseguibile.
Connettersi al runtime predefinito
Prima di poter eseguire il notebook, devi connetterlo a un runtime di Vertex AI. Un runtime è una risorsa di calcolo che esegue il codice nel notebook. Il runtime deve trovarsi nella stessa regione del notebook.
Per saperne di più sui runtime, vedi Runtime e modelli di runtime. Per saperne di più sulla configurazione delle impostazioni regionali, vedi Impostare la regione predefinita per gli asset di codice.
In questo tutorial utilizzi il runtime predefinito. Il runtime predefinito è un runtime preimpostato che richiede una configurazione minima. Per connetterti al runtime predefinito, segui questi passaggi:
Con il notebook aperto, fai clic su Connetti.
La connessione al runtime predefinito potrebbe richiedere diversi minuti se non hai ancora un runtime attivo.
Quando il runtime è pronto, dovresti vedere un segno di spunta con i grafici di RAM e disco. Se passi il mouse sopra i grafici, viene visualizzato il tipo di runtime e la configurazione del runtime.
Esegui il notebook
L'introduzione ai blocchi note in BigQuery Studio contiene testo, SQL, visualizzazione e celle di codice. Le celle diverse da quelle di testo possono essere eseguite singolarmente oppure puoi eseguire tutte le celle in ordine dalla prima all'ultima.
In questo tutorial, esegui le celle del notebook singolarmente per visualizzare i risultati in più fasi. Per eseguire il notebook:
Nella sezione Esegui query sui tuoi dati utilizzando le celle SQL, passa il mouse sopra la cella SQL e poi fai clic su Esegui cella.
Questa cella SQL esegue una query sulla tabella
bigquery-public-data.epa_historical_air_quality.pm25_frm_daily_summarynel set di dati pubblico sulla qualità dell'aria storica e restituisce la media giornaliera di PM2,5 (una metrica comune della qualità dell'aria) per San Francisco negli ultimi anni.Visualizzare i risultati. I risultati della query vengono visualizzati in un DataFrame.
Nella sezione Visualizza dati, passa il mouse sopra la cella di visualizzazione e poi fai clic su Esegui cella.
Visualizza la visualizzazione generata.
Il risultato mostra un grafico delle serie temporali che traccia i valori medi giornalieri di PM2,5 nel DataFrame
dfche hai generato in precedenza. Questo grafico mostra l'andamento dei livelli di PM2,5 nel tempo.Nella sezione Pulisci i dati, passa il mouse sopra la cella di codice e poi fai clic su Esegui cella.
Visualizzare i risultati. I risultati vengono visualizzati in un DataFrame.
Il codice esegue queste operazioni:
- Importa la libreria
bigframes.pandas. - Assicurati che il campo
date_localsia un timestamp. - Ordina i risultati per data, come richiesto per la previsione.
- Rimuovi le righe duplicate.
- Elimina le righe in cui
avg_pm25ènull. - Filtra gli outlier.
- Visualizza i risultati in un DataFrame BigQuery denominato
df_cleaned.
- Importa la libreria
Nella sezione Prevedi valori utilizzando
AI.FORECAST, passa il mouse sopra la cella SQL e poi fai clic su Esegui cella.Visualizzare i risultati. I risultati della query vengono visualizzati in un DataFrame.
Questa cella SQL esegue una query che utilizza la funzione
AI.FORECASTper prevedere la media giornaliera futura di PM2.5 utilizzando il DataFramedf_cleanedgenerato in precedenza.Nella sezione Visualizza i dati utilizzando Python, passa il mouse sopra la cella di codice e poi fai clic su Esegui cella.
Visualizzare i risultati. I risultati vengono visualizzati in un grafico.
Il codice Python esegue queste operazioni:
- Importa il modulo
datetime. - Traccia prima i dati storici e ottieni gli assi.
- Traccia i dati previsti sugli stessi assi.
- Traccia l'intervallo di affidabilità.
Questa visualizzazione è simile al tracciamento standard di Python, ma
df_cleaned.plotè un comando BigQuery DataFrames. Il comando recupera solo i dati necessari (un campione) per il rendering del grafico, non l'intero set di dati.- Importa il modulo
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- Nella console Google Cloud , vai alla pagina Gestisci risorse.
- Nell'elenco dei progetti, seleziona quello che vuoi eliminare, quindi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
In alternativa, per conservare il progetto ed eliminare le risorse utilizzate in questo tutorial, segui questi passaggi:
Vai alla pagina Studio.
Nel riquadro a sinistra, espandi il progetto e fai clic su Blocchi note.
Per il notebook che stai eliminando, fai clic su Apri azioni > Elimina.
Nella finestra di dialogo Elimina notebook, fai clic su Elimina per confermare.
Passaggi successivi
Per eseguire altri modelli di notebook di esempio nella galleria di notebook, vedi:- Inizia a utilizzare i blocchi note per gli utenti SQL
- Guida introduttiva ai notebook per gli utenti Python
Per saperne di più sui DataFrame, vedi:
Per saperne di più sull'AI generativa e sulle funzioni di ML in BigQuery, consulta la panoramica dell'AI generativa.