Crea ed esegui un notebook utilizzando la galleria di notebook

Inizia ad analizzare i dati utilizzando la galleria di notebook in BigQuery Studio.

Prima di iniziare

  1. Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  6. Abilita l'API BigQuery.

    Ruoli richiesti per abilitare le API

    Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

    Abilitare l'API

    Per i nuovi progetti, l'API BigQuery viene abilitata automaticamente.

  7. (Facoltativo) Abilita la fatturazione per il progetto. Se non vuoi attivare la fatturazione o fornire una carta di credito, i passaggi descritti in questo documento funzionano comunque. BigQuery ti offre una sandbox per eseguire i passaggi. Per saperne di più, vedi Attiva la sandbox di BigQuery.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare un notebook di esecuzione, chiedi all'amministratore di concederti i seguenti ruoli IAM per il progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Se non hai mai utilizzato i blocchi note in BigQuery, consulta le autorizzazioni richieste nella pagina Crea blocchi note.

La galleria di blocchi note è un hub centrale per scoprire e utilizzare i modelli di blocchi note predefiniti. Questi modelli ti consentono di eseguire attività comuni come la preparazione, l'analisi e la visualizzazione dei dati. I modelli di blocchi note ti aiutano anche a esplorare le funzionalità di BigQuery Studio, gestire i workflow e promuovere le best practice.

Puoi utilizzare i modelli della galleria di blocchi note per semplificare l'intero flusso di lavoro dall'intenzione agli approfondimenti in ogni fase del ciclo di vita dei dati, dall'importazione e dall'esplorazione all'analisi avanzata e a BigQuery ML.

La galleria dei blocchi note fornisce modelli per ogni livello di competenza. La galleria include modelli fondamentali per SQL, Python, Apache Spark e DataFrame. Puoi anche esplorare argomenti come l'AI generativa e l'analisi dei dati multimodali in BigQuery.

Per saperne di più sull'utilizzo dei modelli della galleria di blocchi note, consulta Creare un blocco note utilizzando la galleria di blocchi note.

L'esempio seguente utilizza il modello Introduzione ai notebook in BigQuery Studio. Questo blocco note mostra come eseguire le seguenti attività:

  • Esegui query sui dati: esegui query utilizzando le celle SQL.
  • Visualizza i risultati delle query: crea visualizzazioni senza codice utilizzando le celle di visualizzazione.
  • Pulisci e trasforma i dati: ordina, deduplica e filtra i dati utilizzando l'API BigQuery DataFrames (pandas).
  • Esegui previsioni dell'AI: genera previsioni utilizzando la (funzione AI.FORECAST) in BigQuery DataFrames. La funzione AI.FORECAST utilizza il foundation model TimesFM per generare previsioni direttamente da un set di dati senza richiedere l'addestramento del modello.
  • Traccia i dati: traccia i dati utilizzando le librerie di visualizzazione integrate di Python. Tracci i dati utilizzando la libreria di visualizzazione BigQuery DataFrames, basata su Matplotlib e Pandas.

Per utilizzare il notebook, apri il modello, convertilo in un notebook eseguibile, connettiti all'ambiente di runtime del notebook e poi esegui il notebook.

Apri il modello e convertilo in un notebook eseguibile

Prima di poter utilizzare un notebook creato da un modello della galleria di notebook, devi convertire il modello in un notebook eseguibile.

Per aprire il modello Introduzione ai notebook in BigQuery Studio nella galleria dei notebook e convertirlo in un notebook eseguibile, segui questi passaggi:

  1. Vai alla pagina Studio.

    Vai a Studio

  2. Fai clic sul menu a discesa freccia e poi scegli Notebook > Tutti i modelli.

  3. In alternativa, dalla home page di BigQuery Studio, fai clic su Visualizza galleria di notebook.

    Il link Visualizza galleria di blocchi note nella home page di BigQuery Studio.

  4. Fai clic sulla scheda Introduzione ai notebook in BigQuery Studio o cercala nella galleria.

  5. Dopo aver aperto il modello, fai clic su Utilizza questo modello per convertirlo in un notebook eseguibile.

Connettersi al runtime predefinito

Prima di poter eseguire il notebook, devi connetterlo a un runtime di Vertex AI. Un runtime è una risorsa di calcolo che esegue il codice nel notebook. Il runtime deve trovarsi nella stessa regione del notebook.

Per saperne di più sui runtime, vedi Runtime e modelli di runtime. Per saperne di più sulla configurazione delle impostazioni regionali, vedi Impostare la regione predefinita per gli asset di codice.

In questo tutorial utilizzi il runtime predefinito. Il runtime predefinito è un runtime preimpostato che richiede una configurazione minima. Per connetterti al runtime predefinito, segui questi passaggi:

  1. Con il notebook aperto, fai clic su Connetti.

    La connessione al runtime predefinito potrebbe richiedere diversi minuti se non hai ancora un runtime attivo.

  2. Quando il runtime è pronto, dovresti vedere un segno di spunta con i grafici di RAM e disco. Se passi il mouse sopra i grafici, viene visualizzato il tipo di runtime e la configurazione del runtime.

    Le impostazioni di configurazione per il runtime predefinito

Esegui il notebook

L'introduzione ai blocchi note in BigQuery Studio contiene testo, SQL, visualizzazione e celle di codice. Le celle diverse da quelle di testo possono essere eseguite singolarmente oppure puoi eseguire tutte le celle in ordine dalla prima all'ultima.

In questo tutorial, esegui le celle del notebook singolarmente per visualizzare i risultati in più fasi. Per eseguire il notebook:

  1. Nella sezione Esegui query sui tuoi dati utilizzando le celle SQL, passa il mouse sopra la cella SQL e poi fai clic su Esegui cella.

    Il pulsante Esegui cella nella cella SQL

    Questa cella SQL esegue una query sulla tabella bigquery-public-data.epa_historical_air_quality.pm25_frm_daily_summary nel set di dati pubblico sulla qualità dell'aria storica e restituisce la media giornaliera di PM2,5 (una metrica comune della qualità dell'aria) per San Francisco negli ultimi anni.

  2. Visualizzare i risultati. I risultati della query vengono visualizzati in un DataFrame.

    I risultati della query in BigQuery DataFrames

  3. Nella sezione Visualizza dati, passa il mouse sopra la cella di visualizzazione e poi fai clic su Esegui cella.

  4. Visualizza la visualizzazione generata.

    Il grafico generato dalla cella di visualizzazione

    Il risultato mostra un grafico delle serie temporali che traccia i valori medi giornalieri di PM2,5 nel DataFrame df che hai generato in precedenza. Questo grafico mostra l'andamento dei livelli di PM2,5 nel tempo.

  5. Nella sezione Pulisci i dati, passa il mouse sopra la cella di codice e poi fai clic su Esegui cella.

  6. Visualizzare i risultati. I risultati vengono visualizzati in un DataFrame.

    I risultati in un BigQuery DataFrame

    Il codice esegue queste operazioni:

    • Importa la libreria bigframes.pandas.
    • Assicurati che il campo date_local sia un timestamp.
    • Ordina i risultati per data, come richiesto per la previsione.
    • Rimuovi le righe duplicate.
    • Elimina le righe in cui avg_pm25 è null.
    • Filtra gli outlier.
    • Visualizza i risultati in un DataFrame BigQuery denominato df_cleaned.
  7. Nella sezione Prevedi valori utilizzando AI.FORECAST, passa il mouse sopra la cella SQL e poi fai clic su Esegui cella.

  8. Visualizzare i risultati. I risultati della query vengono visualizzati in un DataFrame.

    I risultati prodotti dalla funzione `AI.FORECAST`

    Questa cella SQL esegue una query che utilizza la funzione AI.FORECAST per prevedere la media giornaliera futura di PM2.5 utilizzando il DataFrame df_cleaned generato in precedenza.

  9. Nella sezione Visualizza i dati utilizzando Python, passa il mouse sopra la cella di codice e poi fai clic su Esegui cella.

  10. Visualizzare i risultati. I risultati vengono visualizzati in un grafico.

    Il grafico generato dalla cella di codice Python

    Il codice Python esegue queste operazioni:

    • Importa il modulo datetime.
    • Traccia prima i dati storici e ottieni gli assi.
    • Traccia i dati previsti sugli stessi assi.
    • Traccia l'intervallo di affidabilità.

    Questa visualizzazione è simile al tracciamento standard di Python, ma df_cleaned.plot è un comando BigQuery DataFrames. Il comando recupera solo i dati necessari (un campione) per il rendering del grafico, non l'intero set di dati.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

  1. Nella console Google Cloud , vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona quello che vuoi eliminare, quindi fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.

In alternativa, per conservare il progetto ed eliminare le risorse utilizzate in questo tutorial, segui questi passaggi:

  1. Vai alla pagina Studio.

    Vai a Studio

  2. Nel riquadro a sinistra, espandi il progetto e fai clic su Blocchi note.

  3. Per il notebook che stai eliminando, fai clic su Apri azioni > Elimina.

  4. Nella finestra di dialogo Elimina notebook, fai clic su Elimina per confermare.

Passaggi successivi

Per eseguire altri modelli di notebook di esempio nella galleria di notebook, vedi:

Per saperne di più sui DataFrame, vedi:

Per saperne di più sull'AI generativa e sulle funzioni di ML in BigQuery, consulta la panoramica dell'AI generativa.