Membuat kueri tabel akan membaca data dari file Cloud Storage yang mendasarinya menggunakan metadata yang dikelola oleh katalog runtime Lakehouse.
Anda dapat menjalankan kueri pemilihan dari mesin open source seperti Spark dan Trino, atau langsung dari BigQuery menggunakan penamaan tabel empat bagian.
Sebelum memulai
Lihat ringkasan tabel untuk memahami berbagai jenis tabel dan implikasi penggunaannya.
-
Verifikasi bahwa penagihan diaktifkan untuk project Google Cloud Anda.
-
Mengaktifkan BigLake API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (
roles/serviceusage.serviceUsageAdmin), yang berisi izinserviceusage.services.enable. Pelajari cara memberikan peran.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk membuat kueri tabel, minta administrator untuk memberi Anda peran IAM berikut di project dan bucket penyimpanan Anda:
-
Membaca data tabel dalam mode penyediaan kredensial:
BigLake Viewer (
roles/biglake.viewer) - project -
Membaca data tabel dalam mode penyediaan non-kredensial:
- Pelihat BigLake (
roles/biglake.viewer) - project - Storage Object Viewer (
roles/storage.objectViewer) - bucket Cloud Storage
- Pelihat BigLake (
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Membuat kueri tabel
Pilih semua data dari tabel:
Spark
spark.sql("SELECT * FROM TABLE_NAME;").show()
Trino
SELECT * FROM TABLE_NAME;
BigQuery
Untuk membuat kueri tabel katalog REST Iceberg Lakehouse dari BigQuery,
gunakan nama tabel empat bagian dalam kueri Anda dengan format berikut: PROJECT_NAME.CATALOG_ID.NAMESPACE_OR_SCHEMA_NAME.TABLE_NAME.
SELECT * FROM `PROJECT_NAME.BIGLAKE_CATALOG_ID.NAMESPACE_OR_SCHEMA_NAME.TABLE_NAME`;
Ganti nilai berikut:
PROJECT_NAME:Google Cloud project yang memiliki katalog di katalog runtime Lakehouse. Project Google Cloud yang dipilih di konsol Google Cloud akan ditagih untuk kueri tersebut.CATALOG_ID: ID katalog runtime Lakehouse yang ditentukan saat katalog dibuat. ID ini digunakan sebagai nama katalog dalam kueri BigQuery.ID ini juga merupakan nama bucket Cloud Storage Anda.
Misalnya, jika Anda membuat bucket untuk menyimpan katalog dan menamainya
iceberg-bucket, nama katalog dan nama bucket Anda adalahiceberg-bucket. Kolom ini akan digunakan nanti saat Anda membuat kueri katalog di BigQuery, menggunakan sintaksis P.C.N.T. Misalnyamy-project.biglake_catalog_id.quickstart_namespace.quickstart_table.NAMESPACE_OR_SCHEMA_NAME: namespace tabel jika menggunakan Spark atau nama skema tabel jika menggunakan Trino.TABLE_NAME: nama tabel Anda.
Langkah berikutnya
- Pelajari cara mengubah tabel.