Anda dapat menjelajahi hasil kueri BigQuery menggunakan notebook Colab Enterprise di BigQuery.
Dalam tutorial ini, Anda akan membuat kueri data dari set data publik BigQuery dan menjelajahi hasil kueri di notebook.
Izin yang diperlukan
Untuk membuat dan menjalankan notebook, Anda memerlukan peran Identity and Access Management (IAM) berikut:
- Pengguna BigQuery (
roles/bigquery.user
) - Pengguna Runtime Notebook (
roles/aiplatform.notebookRuntimeUser
) - Pembuat Kode (
roles/dataform.codeCreator
)
Membuka hasil kueri di notebook
Anda dapat menjalankan kueri SQL, lalu menggunakan notebook untuk menjelajahi data. Pendekatan ini berguna jika Anda ingin mengubah data di BigQuery sebelum menanganinya, atau jika Anda hanya memerlukan subset kolom dalam tabel.
Di konsol Google Cloud , buka halaman BigQuery.
Di kolom Ketik untuk menelusuri, masukkan
bigquery-public-data
.Jika project tidak ditampilkan, masukkan
bigquery
di kolom penelusuran, lalu klik Telusuri semua project untuk mencocokkan string penelusuran dengan project yang ada.Pilih bigquery-public-data > ml_datasets > penguins.
Untuk tabel penguins, klik
Lihat tindakan, lalu klik Kueri.Tambahkan tanda bintang (
*
) untuk pemilihan kolom ke kueri yang dihasilkan, sehingga terbaca seperti contoh berikut:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Klik
Run.Di bagian Hasil kueri, klik Jelajahi data, lalu klik Jelajahi dengan notebook Python.
Menyiapkan notebook untuk digunakan
Siapkan notebook untuk digunakan dengan menghubungkan ke runtime dan menetapkan nilai default aplikasi.
- Di header notebook, klik Connect untuk terhubung ke runtime default.
- Di blok kode Penyiapan, klik Jalankan sel.
Menjelajahi data
- Untuk memuat data penguins ke dalam BigQuery DataFrame dan menampilkan hasilnya, klik Run cell di blok kode di bagian Result set loaded from BigQuery job as a DataFrame.
- Untuk mendapatkan metrik deskriptif untuk data, klik Run cell di blok kode di bagian Show descriptive statistics using describe().
- Opsional: Gunakan fungsi atau paket Python lainnya untuk menjelajahi dan menganalisis data.
Contoh kode berikut menunjukkan penggunaan
bigframes.pandas
untuk menganalisis data, dan bigframes.ml
untuk membuat model regresi linear dari data penguins dalam
DataFrame BigQuery: