Menganalisis data dengan bantuan Gemini

Tutorial ini menjelaskan cara menggunakan bantuan yang didukung AI di Gemini di BigQuery untuk menganalisis data.

Untuk contoh dalam tutorial ini, anggaplah Anda adalah data analis yang perlu menganalisis dan memprediksi penjualan produk dari sebuah dataset.

Tutorial ini mengasumsikan bahwa Anda sudah memahami SQL dan tugas analisis data dasar. Pengetahuan tentang Google Cloud produk tidak diasumsikan. Jika Anda pengguna baru BigQuery, lihat panduan memulai BigQuery.

Tujuan

  • Menggunakan Gemini di BigQuery untuk menjawab pertanyaan tentang cara BigQuery menangani tugas analisis data tertentu.
  • Meminta Gemini di BigQuery untuk menemukan dataset, serta menjelaskan dan membuat kueri SQL.
  • Membangun model machine learning (ML) untuk memperkirakan periode mendatang.

Biaya

Tutorial ini menggunakan produk yang dapat ditagih berikut Google Cloud :

Untuk memperkirakan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga.

Sebelum memulai

  1. Di Google Cloud konsol, pada halaman pemilih project, pilih atau buat Google Cloud project.

    Peran yang diperlukan untuk memilih atau membuat project

    • Memilih project: Memilih project tidak memerlukan peran IAM tertentu Anda dapat memilih project mana pun yang telah diberi peran.
    • Membuat project: Untuk membuat project, Anda memerlukan peran Pembuat Project (roles/resourcemanager.projectCreator), yang berisi izin resourcemanager.projects.create. Pelajari cara memberikan peran.

    Buka pemilih project

  2. Pastikan Gemini di BigQuery disiapkan untuk project Google Cloud Anda.
  3. Di Google Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  4. Membuat set data yang bernama bqml_tutorial. Anda menggunakan dataset untuk menyimpan database objek, termasuk tabel dan model.

  5. Untuk mengaktifkan fitur Gemini di BigQuery yang Anda perlukan untuk menyelesaikan tutorial ini, di toolbar BigQuery, klik pen_spark Gemini, lalu pilih opsi berikut:

    • Penyelesaian otomatis
    • Pembuatan otomatis
    • Penjelasan

Mempelajari kemampuan BigQuery

Sebelum memulai, pertimbangkan bahwa Anda ingin mempelajari lebih lanjut cara BigQuery menangani kueri data. Untuk mendapatkan bantuan, Anda dapat mengirimkan pernyataan (atau perintah) bahasa alami ke Gemini di BigQuery seperti berikut:

  • "How do I get started with BigQuery?"
  • "What are the benefits of using BigQuery for data analysis?"
  • "How does BigQuery handle auto-scaling for queries?"

Gemini di BigQuery juga dapat memberikan informasi tentang cara menganalisis data Anda. Untuk jenis bantuan tersebut, Anda dapat mengirimkan perintah seperti berikut:

  • "How do I create a time series forecasting model in BigQuery?"
  • "How do I load different types of data into BigQuery?"

Mengakses dan menganalisis data

Gemini di BigQuery dapat membantu Anda mengetahui data apa yang dapat Anda akses untuk analisis, dan cara menganalisis data tersebut.

Untuk contoh ini, pertimbangkan bahwa Anda memerlukan bantuan terkait hal berikut:

  • Menemukan dataset dan tabel penjualan untuk dianalisis.
  • Mengetahui bagaimana tabel dan kueri data terkait dalam dataset penjualan.
  • Memahami kueri kompleks dan menulis kueri yang menggunakan dataset.

Menemukan data

Sebelum dapat mengkueri data, Anda perlu mengetahui data apa yang dapat Anda akses. Setiap produk data mengatur dan menyimpan data dengan cara berbeda.

Untuk mendapatkan bantuan, Anda dapat mengirim Gemini di BigQuery perintah seperti "Bagaimana cara mempelajari dataset dan tabel mana yang tersedia untuk saya di BigQuery?"

  1. Di Google Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di Google Cloud toolbar konsol, klik spark Open or close Gemini Cloud Assist chat.

  3. Di panel Cloud Assist, masukkan perintah How do I learn which datasets and tables are available to me in BigQuery?.

  4. Klik send Send prompt.

    Pelajari cara dan waktu Gemini untuk Google Cloud menggunakan data Anda.

    Respons mencakup beberapa cara untuk menampilkan daftar project, set data, atau tabel dalam sebuah dataset.

  5. Opsional: Untuk mereset histori percakapan Anda, di panel Cloud Assist, klik delete Clear chat, lalu klik Reset chat.

Memahami dan menulis SQL di BigQuery

Untuk contoh ini, asumsikan bahwa Anda memilih data untuk dianalisis dan sekarang ingin mengkueri data tersebut. Gemini di BigQuery dapat membantu Anda menggunakan SQL—baik untuk membantu Anda memahami kueri yang kompleks dan sulit diuraikan, maupun untuk membuat kueri SQL baru.

Meminta bantuan Gemini untuk menjelaskan kueri SQL

Pertimbangkan bahwa Anda ingin memahami kueri kompleks yang ditulis oleh orang lain. Gemini di BigQuery dapat menjelaskan kueri dalam bahasa yang mudah dipahami—seperti sintaksis kueri, skema dasar, dan konteks bisnis.

  1. Di Google Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, buka atau tempel kueri yang ingin Anda minta untuk dijelaskan. Contoh:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Tandai kueri, lalu klik auto_awesome Explain this selected query.

    Di panel Cloud Assist, respons yang ditampilkan mirip dengan contoh berikut:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Membuat kueri SQL yang mengelompokkan penjualan berdasarkan hari dan produk

Dalam contoh ini, Anda ingin membuat kueri yang mencantumkan produk unggulan Anda setiap hari. Kemudian, Anda menggunakan tabel dalam set data thelook_ecommerce dan meminta Gemini di BigQuery untuk membuat kueri agar dapat menghitung penjualan berdasarkan item pesanan dan nama produk.

Jenis kueri ini biasanya kompleks, tetapi dengan menggunakan Gemini di BigQuery, Anda dapat membuat pernyataan secara otomatis. Anda dapat memberikan perintah untuk membuat kueri SQL berdasarkan skema data Anda. Meskipun Anda memulai tanpa kode, memiliki pengetahuan terbatas tentang skema data, atau hanya memiliki pengetahuan dasar tentang sintaksis SQL, bantuan Gemini dapat menyarankan satu atau beberapa pernyataan SQL.

Untuk meminta Gemini di BigQuery membuat kueri yang mencantumkan produk unggulan Anda, ikuti langkah-langkah berikut:

  1. Di Google Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di menu navigasi, klik Studio.

  3. Klik SQL query. Panel Explorer secara otomatis memuat database yang dipilih.

  4. Di editor kueri, masukkan perintah berikut, lalu tekan Enter:

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Karakter tanda pagar (#) meminta Gemini di BigQuery untuk membuat SQL. Gemini di BigQuery akan menyarankan kueri SQL yang mirip dengan contoh berikut:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Untuk menerima kode yang disarankan, klik Tab, lalu klik Run untuk menjalankan pernyataan SQL. Anda juga dapat men-scroll SQL yang disarankan dan menerima kata-kata tertentu yang disarankan dalam pernyataan.

  6. Di panel Query results, lihat hasil kueri.

Membuat model perkiraan dan melihat hasilnya

Dalam contoh ini, Anda menggunakan BigQuery ML untuk melakukan hal berikut:

  • Menggunakan kueri tren untuk membuat model perkiraan.
  • Menggunakan Gemini di BigQuery untuk menjelaskan dan membantu Anda menulis kueri agar dapat melihat hasil model perkiraan.

Anda menggunakan contoh kueri berikut dengan penjualan sebenarnya, yang digunakan sebagai input ke model. Kueri digunakan sebagai bagian dari pembuatan model ML.

  1. Untuk membuat model ML perkiraan, di editor kueri, jalankan kueri SQL berikut:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Anda dapat menggunakan Gemini di BigQuery untuk membantu Anda memahami kueri ini.

    Saat model dibuat, tab Results di panel Query results akan menampilkan pesan yang mirip dengan contoh berikut:

    Successfully created model named sales_forecasting_model.
    
  2. Di panel Cloud Assist, masukkan perintah untuk Gemini di BigQuery untuk membantu Anda menulis kueri guna mendapatkan perkiraan model saat sudah selesai—misalnya, masukkan How can I get a forecast in SQL from the model?

    Berdasarkan konteks perintah tersebut, respons akan menyertakan contoh model ML yang memperkirakan penjualan:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    Dalam respons ini, PROJECT_ID adalah Google Cloud project Anda.

  3. Di panel Cloud Assist, salin kueri SQL.

  4. Di editor kueri, jalankan kueri SQL.

Pembersihan

Agar akunAnda tidak dikenai biaya untuk resource yang digunakan dalam tutorial ini, hapus project Google Cloud yang Anda buat untuk tutorial ini. Google Cloud Atau, Anda dapat menghapus resource satu per satu.

Hapus project

  1. Di Google Cloud konsol, buka halaman Manage resources.

    Buka Kelola resource

  2. Pada daftar project, pilih project yang Anda ingin Anda hapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Menghapus set data

Jika project Anda dihapus, semua set data dan semua tabel dalam project akan dihapus. Jika Anda memilih untuk menggunakan kembali proyek, maka Anda dapat menghapus dataset yang telah dibuat di dalam tutorial ini.

  1. Di Google Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di menu navigasi, pilih set data bqml_tutorial yang Anda buat.

  3. Untuk menghapus set data, tabel, dan semua data, klik Delete dataset.

  4. Untuk mengonfirmasi penghapusan, di dialog Delete dataset, ketik nama set data Anda (bqml_tutorial), lalu klik Delete.

Langkah berikutnya