Analizzare i dati con l'assistenza di Gemini

Questo tutorial descrive come utilizzare l'assistenza basata sull'AI in Gemini in BigQuery per analizzare i dati.

Per l'esempio in questo tutorial, supponi di essere un analista di dati che deve analizzare e prevedere le vendite dei prodotti da un set di dati.

Questo tutorial presuppone che tu abbia familiarità con SQL e le attività di analisi dei dati di base. Non è richiesta la conoscenza dei Google Cloud prodotti. Se non hai mai utilizzato BigQuery, consulta le guide rapide di BigQuery.

Obiettivi

  • Utilizzare Gemini in BigQuery per rispondere alle domande su come BigQuery gestisce attività di analisi dei dati specifiche.
  • Chiedere a Gemini in BigQuery di trovare set di dati, nonché di spiegare e generare query SQL.
  • Creare un modello di machine learning (ML) per prevedere i periodi futuri.

Costi

Questo tutorial utilizza i seguenti prodotti a pagamento Google Cloud :

Per stimare i costi in base all'utilizzo previsto, utilizza il calcolatore prezzi.

Prima di iniziare

  1. Nella Google Cloud console, nella pagina di selezione del progetto, seleziona o crea un Google Cloud progetto.

    Ruoli richiesti per selezionare o creare un progetto

    • Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico. Puoi selezionare qualsiasi progetto su cui ti è stato concesso un ruolo.
    • Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto (roles/resourcemanager.projectCreator), che contiene l' resourcemanager.projects.create autorizzazione. Scopri come concedere i ruoli.

    Vai al selettore di progetti

  2. Assicurati che Gemini in BigQuery sia configurato per il tuo Google Cloud progetto.
  3. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  4. Crea un set di dati denominato bqml_tutorial. Utilizza il set di dati per archiviare gli oggetti del database, tra cui tabelle e modelli.

  5. Per attivare le funzionalità di Gemini in BigQuery necessarie per completare questo tutorial, nella barra degli strumenti di BigQuery, fai clic su pen_spark Gemini, e seleziona le seguenti opzioni:

    • Completamento automatico
    • Generazione automatica
    • Spiegazione

Scopri le funzionalità di BigQuery

Prima di iniziare, tieni presente che vuoi saperne di più su come BigQuery gestisce le query sui dati. Per ricevere assistenza, puoi inviare a Gemini in BigQuery un'istruzione in linguaggio naturale (o prompt) come la seguente:

  • "Come faccio a iniziare a utilizzare BigQuery?"
  • "Quali sono i vantaggi dell'utilizzo di BigQuery per l'analisi dei dati?"
  • "In che modo BigQuery gestisce la scalabilità automatica per le query?"

Gemini in BigQuery può anche fornire informazioni su come analizzare i dati. Per questo tipo di assistenza, puoi inviare prompt come i seguenti:

  • "Come faccio a creare un modello di previsione delle serie temporali in BigQuery?"
  • "Come faccio a caricare diversi tipi di dati in BigQuery?"

Accedere ai dati e analizzarli

Gemini in BigQuery può aiutarti a capire a quali dati puoi accedere per l'analisi e come analizzarli.

Per questo esempio, supponi di aver bisogno di aiuto per quanto segue:

  • Trovare il set di dati e le tabelle delle vendite da analizzare.
  • Sapere come sono correlate le tabelle e le query dei dati in un set di dati sulle vendite.
  • Comprendere le query complesse e scrivere query che utilizzano il set di dati.

Trovare i dati

Prima di poter eseguire query sui dati, devi sapere a quali dati puoi accedere. Ogni prodotto di dati organizza e archivia i dati in modo diverso.

Per ricevere assistenza, puoi inviare a Gemini in BigQuery un prompt come "Come faccio a sapere quali set di dati e tabelle sono disponibili in BigQuery?"

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nella Google Cloud barra degli strumenti della console, fai clic su spark Apri o chiudi la chat di Gemini Cloud Assist.

  3. Nel riquadro Cloud Assist, inserisci il prompt How do I learn which datasets and tables are available to me in BigQuery?.

  4. Fai clic su send Invia messaggio.

    Scopri come e quando Gemini per Google Cloud utilizza i tuoi dati.

    La risposta include diversi modi per elencare progetti, set di dati o tabelle all'interno di un set di dati.

  5. (Facoltativo) Per reimpostare la cronologia chat, nel riquadro Cloud Assist, fai clic su delete Cancella chat, quindi su Reimposta chat.

Comprendere e scrivere SQL in BigQuery

Per questo esempio, supponi di aver selezionato i dati da analizzare e ora vuoi eseguire query su questi dati. Gemini in BigQuery può aiutarti a lavorare con SQL, sia per comprendere query complesse e difficili da analizzare sia per generare nuove query SQL.

Chiedere l'assistenza di Gemini per spiegare le query SQL

Supponi di voler comprendere una query complessa scritta da un'altra persona. Gemini in BigQuery può spiegare la query in linguaggio semplice, ad esempio la sintassi della query, lo schema sottostante e il contesto aziendale.

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, apri o incolla la query per cui vuoi ricevere una spiegazione. Ad esempio:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Evidenzia la query, quindi fai clic su auto_awesome Spiega questa query selezionata.

    Nel riquadro Cloud Assist viene restituita una risposta simile alla seguente:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Generare una query SQL che raggruppa le vendite per giorno e prodotto

In questo esempio, vuoi generare una query che elenca i tuoi prodotti più venduti per ogni giorno. Quindi, utilizza le tabelle nel set di dati thelook_ecommerce e chiedi a Gemini in BigQuery di generare una query per calcolare le vendite per articolo dell'ordine e per nome del prodotto.

Questo tipo di query è spesso complesso, ma utilizzando Gemini in BigQuery puoi creare automaticamente un'istruzione. Puoi fornire un prompt per generare una query SQL in base allo schema dei dati. Anche se inizi senza codice, con una conoscenza limitata dello schema dei dati o solo con una conoscenza di base della sintassi SQL, l'assistenza di Gemini può suggerire una o più istruzioni SQL.

Per chiedere a Gemini in BigQuery di generare una query che elenca i tuoi prodotti più venduti:

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel menu di navigazione, fai clic su Studio.

  3. Fai clic su Query SQL. Il riquadro Explorer carica automaticamente il database selezionato.

  4. Nell'editor di query, inserisci il seguente prompt, quindi premi Invio:

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Il carattere cancelletto (#) chiede a Gemini in BigQuery di generare SQL. Gemini in BigQuery suggerisce una query SQL simile alla seguente:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Per accettare il codice suggerito, fai clic su Tab, quindi su Esegli per eseguire l'istruzione SQL. Puoi anche scorrere l'SQL suggerito e accettare parole specifiche suggerite nell'istruzione.

  6. Nel riquadro Risultati query, visualizza i risultati della query.

Creare un modello di previsione e visualizzare i risultati

In questo esempio, utilizzi BigQuery ML per eseguire le seguenti operazioni:

  • Utilizzare una query di tendenza per creare un modello di previsione.
  • Utilizzare Gemini in BigQuery per spiegare e aiutarti a scrivere una query per visualizzare i risultati del modello di previsione.

Utilizza la seguente query di esempio con le vendite effettive, che vengono utilizzate come input per il modello. La query viene utilizzata come parte della creazione del modello ML.

  1. Per creare un modello ML di previsione, nell'editor di query, esegui la seguente query SQL:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Puoi utilizzare Gemini in BigQuery per aiutarti a comprendere questa query.

    Una volta creato il modello, la scheda Risultati del riquadro Risultati query mostra un messaggio simile al seguente:

    Successfully created model named sales_forecasting_model.
    
  2. Nel riquadro Cloud Assist, inserisci un prompt per chiedere a Gemini in BigQuery di aiutarti a scrivere una query per ottenere una previsione dal modello al termine, ad esempio inserisci How can I get a forecast in SQL from the model?

    In base al contesto del prompt, la risposta include un esempio di modello ML che prevede le vendite:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    In questa risposta, PROJECT_ID è il tuo Google Cloud progetto.

  3. Nel riquadro Cloud Assist, copia la query SQL.

  4. Nell'editor di query, esegui la query SQL.

Libera spazio

Per evitare che al tuo Google Cloud account vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, puoi eliminare il Google Cloud progetto che hai creato per il tutorial. In alternativa, puoi eliminare le singole risorse.

Elimina progetto

  1. Nella Google Cloud console, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID progetto e fai clic su Chiudi per eliminare il progetto.

Elimina il set di dati

L'eliminazione del progetto rimuove tutti i set di dati e tutte le tabelle nel progetto. Se preferisci riutilizzare il progetto, puoi eliminare il set di dati creato in questo tutorial.

  1. Nella Google Cloud console, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel menu di navigazione, seleziona il set di dati bqml_tutorial che hai creato.

  3. Per eliminare il set di dati, la tabella e tutti i dati, fai clic su Elimina set di dati.

  4. Per confermare l'eliminazione, nella finestra di dialogo Elimina set di dati, digita il nome del set di dati (bqml_tutorial), quindi fai clic su Elimina.

Passaggi successivi