Menambahkan metadata ke tabel BigQuery
Pelajari cara memulai pengelolaan metadata di Dataplex Universal Catalog.
Panduan memulai ini menunjukkan cara menambahkan metadata ke tabel BigQuery. Dalam panduan memulai ini, Anda akan melakukan hal berikut:
Buat set data dan tabel BigQuery berdasarkan set data publik.
Buat template yang menentukan sekumpulan kolom metadata terkait.
Template ini disebut jenis aspek. Kumpulan kolom metadata terkait, yang menjelaskan metadata bisnis dan teknis untuk aset data Anda, disebut aspek.
Menambahkan metadata ke tabel.
Di Dataplex Universal Catalog, setiap aset data ditampilkan sebagai entri. Untuk melampirkan metadata ke aset data, Anda menambahkan aspek ke entri.
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan guna menambahkan metadata ke tabel BigQuery, minta administrator untuk memberi Anda peran IAM berikut pada project:
-
Dataplex Catalog Admin (
roles/dataplex.catalogAdmin) -
BigQuery Data Owner (
roles/bigquery.dataOwner) -
BigQuery Job User (
roles/bigquery.jobUser)
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Membuat set data dan tabel
Di konsol Google Cloud , buka halaman BigQuery Studio.
Membuat set data:
Di panel kiri, klik Explorer:

Jika Anda tidak melihat panel kiri, klik Luaskan panel kiri untuk membuka panel.
Di panel Explorer, temukan project Anda. Klik View actions, lalu klik Create dataset.
Di kolom Dataset ID, masukkan
catalog_demo_dataset.Pertahankan nilai default untuk kolom lainnya.
Klik Create dataset.
Menyalin tabel publik ke set data Anda:
Di panel Explorer, telusuri tabel bernama
bigquery-public-data.new_york_citibike.citibike_stations. Anda mungkin perlu menetapkan cakupan penelusuran untuk menyertakan projectbigquery-public-data.Tabel ini adalah bagian dari set data Perjalanan NYC Citi Bike, sebuah set data publik yang berisi data tentang program berbagi sepeda.
Pilih tabel
citibike_stations.Klik Copy. Masukkan informasi sebagai berikut:
- Project: pilih project Anda.
- Dataset: pilih
catalog_demo_dataset. - Table: masukkan
bike_stations.
Klik Copy.
Di panel Explorer, cari set data
catalog_demo_dataset, dan pastikan tabelbike_stationstercantum dalam set data.
Menentukan template metadata: membuat jenis aspek
Di konsol Google Cloud , buka halaman Katalog Dataplex Universal Catalog.
Klik tab Jenis aspek & template tag, lalu klik tab Kustom.
Klik Create aspect type.
Di kolom ID jenis aspek, masukkan
data-governance-demo.Untuk Location, pilih
global.Di bagian Template, klik Add field. Gunakan informasi dalam tabel berikut untuk menambahkan beberapa kolom ke jenis aspek:
Nama Jenis Wajib diisi Deskripsi source-of-data-assetTeks Tidak - retention-dateTanggal dan waktu Tidak - data-classificationEnum
Tambahkan nilai
Public,Sensitive, danConfidential.Ya - has-piiBoolean Ya Whether the data asset has personally identifiable informationKlik Simpan.
Menambahkan metadata ke tabel: menambahkan aspek ke entri
Di konsol Google Cloud , buka halaman Penelusuran Dataplex Universal Catalog.
Di kotak penelusuran, masukkan
catalog_demo_dataset.Pilih tabel bike_stations.
Menambahkan aspek kustom ke entri:
Di bagian Tags & aspects, di samping Optional tags & aspects, klik Tambahkan.
Pilih jenis aspek
data-governance-demo.Tindakan ini akan membuat aspek yang menggunakan jenis aspek Anda sebagai template.
Masukkan nilai berikut:
- Sumber aset data:
Copied from NYC Citi Bike Trips public dataset - Tanggal retensi: masukkan tanggal.
- Klasifikasi data:
Public - Memiliki PII:
False
- Sumber aset data:
Klik Simpan.
Untuk melihat nilai metadata yang Anda tambahkan, di bagian Tag & aspek, pilih aspek data-governance-demo.
Pembersihan
Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Menghapus project
Cara termudah untuk menghentikan penagihan adalah dengan menghapus project yang Anda buat untuk panduan memulai ini.
- Di Konsol Google Cloud , buka halaman Manage resources.
- Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
Menghapus resource satu per satu
Jika Anda ingin menggunakan kembali project, hapus resource yang Anda buat.
Hapus set data:
Di konsol Google Cloud , buka halaman BigQuery Studio.
Di panel kiri, klik Explorer:

Di panel Explorer, telusuri set data
catalog_demo_dataset.Klik Lihat tindakan, lalu klik Hapus. Konfirmasi saat diminta.
Hapus jenis aspek:
Di konsol Google Cloud , buka halaman Katalog Dataplex Universal Catalog.
Klik tab Jenis aspek & template tag, lalu klik tab Kustom.
Klik jenis aspek
data-governance-demo.Klik Hapus. Konfirmasi saat diminta.
Langkah berikutnya
- Pelajari lebih lanjut pengelolaan metadata.
- Pelajari cara menelusuri resource.
- Pelajari cara menggunakan aspek dan jenis aspek.