Anda dapat menjelajahi hasil kueri menggunakan sel SQL atau sel kode di notebook BigQuery Colab Enterprise.
Dalam tutorial ini, Anda akan membuat kueri data dari set data publik BigQuery dan menjelajahi hasil kueri di notebook.
Tujuan
- Membuat dan menjalankan kueri di BigQuery.
- Jelajahi hasil kueri di notebook menggunakan sel SQL dan sel kode.
Biaya
Tutorial ini menggunakan set data yang tersedia melalui Google Cloud Program Set Data Publik. Google membayar penyimpanan set data ini dan memberikan akses publik ke data tersebut. Anda dikenai biaya untuk kueri yang Anda lakukan pada data. Untuk mengetahui informasi selengkapnya, lihat harga BigQuery.
Sebelum memulai
-
Di konsol Google Cloud , pada halaman pemilih project, pilih atau buat project Google Cloud .
Peran yang diperlukan untuk memilih atau membuat project
- Pilih project: Memilih project tidak memerlukan peran IAM tertentu—Anda dapat memilih project mana pun yang telah diberi peran.
-
Membuat project: Untuk membuat project, Anda memerlukan peran Pembuat Project
(
roles/resourcemanager.projectCreator), yang berisi izinresourcemanager.projects.create. Pelajari cara memberikan peran.
-
Verifikasi bahwa penagihan diaktifkan untuk project Google Cloud Anda.
-
Aktifkan BigQuery API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (
roles/serviceusage.serviceUsageAdmin), yang berisi izinserviceusage.services.enable. Pelajari cara memberikan peran.Untuk project baru, BigQuery diaktifkan secara otomatis.
Menetapkan region default untuk aset kode
Semua aset kode baru di project Google Cloud Anda menggunakan region default. Setelah aset dibuat, Anda tidak dapat mengubah regionnya.
Untuk menetapkan region default untuk aset kode baru, lakukan hal berikut:
Buka halaman BigQuery.
Di panel kiri, klik File untuk membuka browser file:
Di samping nama project, klik View files panel actions > Switch code region.
Pilih region kode yang ingin Anda gunakan sebagai default.
Klik Simpan.
Untuk mengetahui daftar wilayah yang didukung, lihat Lokasi BigQuery Studio.
Izin yang diperlukan
Untuk membuat dan menjalankan notebook, Anda memerlukan peran Identity and Access Management (IAM) berikut:
- Pengguna BigQuery (
roles/bigquery.user) - Pengguna Runtime Notebook (
roles/aiplatform.notebookRuntimeUser) - Pembuat Kode (
roles/dataform.codeCreator)
Membuka hasil kueri di notebook
Anda dapat menjalankan kueri SQL, lalu menggunakan notebook untuk menjelajahi data. Pendekatan ini berguna jika Anda ingin mengubah data di BigQuery sebelum menanganinya, atau jika Anda hanya memerlukan subset kolom dalam tabel.
Di konsol Google Cloud , buka halaman BigQuery.
Di panel kiri, klik Explorer.
Buka project
bigquery-public-data, klik Aktifkan node untuk meluaskannya, lalu klik Set data. Tab baru akan terbuka di panel detail yang menampilkan daftar semua set data dalam project.Di kotak Filter, pilih Dataset ID dan masukkan ml_datasets.
Di halaman Datasets, klik ml_datasets > penguins.
Klik Query.
Tambahkan tanda bintang (
*) untuk pemilihan kolom ke kueri yang dihasilkan, sehingga akan terlihat seperti contoh berikut:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Klik Run.
Di bagian Hasil kueri, klik Buka di, lalu klik Notebook.
Menyiapkan notebook untuk digunakan
Siapkan notebook untuk digunakan dengan menghubungkan ke runtime dan menetapkan nilai default aplikasi.
Di header notebook, klik Connect untuk terhubung ke runtime default.
Di blok kode Setup, klik Run cell.
Menjelajahi data
Klik Insert code cell options > Add SQL cell.
Masukkan kueri berikut di sel SQL:
SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;Klik Run cell.
Hasil kueri ditampilkan dalam DataFrame BigQuery.
Atau, untuk memuat hasil kueri ke DataFrame BigQuery menggunakan tugas kueri yang sebelumnya Anda jalankan di editor kueri, ikuti langkah-langkah berikut:
Buka bagian Kumpulan hasil dimuat dari tugas BigQuery sebagai DataFrame.
Di blok kode, klik Run cell.
Hasil kueri ditampilkan dalam DataFrame BigQuery.
Untuk mendapatkan metrik deskriptif untuk data, ikuti langkah-langkah berikut:
Buka bagian Tampilkan statistik deskriptif menggunakan describe().
Di blok kode, klik Run cell.
Hasilnya ditampilkan dalam DataFrame BigQuery.
Opsional: Gunakan fungsi atau paket Python lainnya untuk menjelajahi dan menganalisis data.
Contoh kode berikut menunjukkan penggunaan
bigframes.pandas
untuk menganalisis data, dan bigframes.ml
untuk membuat model regresi linear dari data penguins dalam
DataFrame BigQuery:
Pembersihan
Agar tidak perlu membayar biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource.
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus Google Cloud project yang Anda buat untuk tutorial ini.
- Di Konsol Google Cloud , buka halaman Manage resources.
- Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
Langkah berikutnya
- Pelajari lebih lanjut cara membuat notebook di BigQuery.
- Pelajari lebih lanjut cara menjelajahi data dengan DataFrame BigQuery.