Membuat insight set data
Dokumen ini menjelaskan cara membuat insight set data untuk set data BigQuery. Insight set data membantu Anda memahami hubungan antar tabel dalam set data dengan membuat grafik hubungan dan kueri antar-tabel.
Insight set data membantu Anda mempercepat eksplorasi set data dengan beberapa tabel dengan otomatis menemukan dan memvisualisasikan hubungan antar tabel dalam grafik, mengidentifikasi hubungan kunci utama dan kunci asing, serta membuat contoh kueri antar-tabel. Hal ini berguna untuk memahami struktur data tanpa dokumentasi, menemukan hubungan antar tabel yang ditentukan skema, berbasis penggunaan, atau disimpulkan AI, dan membuat kueri kompleks yang menggabungkan beberapa tabel.
Untuk mengetahui ringkasan insight tabel dan set data, lihat Ringkasan insight data.
Sebelum memulai
Insight data dibuat menggunakan Gemini di BigQuery. Untuk mulai membuat insight, Anda harus menyiapkan Gemini di BigQuery terlebih dahulu .
Mengaktifkan API
Untuk menggunakan insight data, aktifkan API berikut di project Anda: Dataplex API, BigQuery API, dan Gemini for Google Cloud API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin
(roles/serviceusage.serviceUsageAdmin),
yang berisi izin serviceusage.services.enable. Pelajari cara memberikan
peran.
Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan Gemini for Google Cloud API, lihat Mengaktifkan Gemini for Google Cloud API di sebuah Google Cloud project.
Menyelesaikan pemindaian profil data
Untuk meningkatkan kualitas insight, buat hasil pembuatan profil data untuk tabel di set data Anda.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk membuat, mengelola, dan mengambil insight set data, minta administrator untuk memberi Anda peran IAM berikut:
-
Untuk membuat, mengelola, dan mengambil insight:
-
Dataplex DataScan Editor (
roles/dataplex.dataScanEditor) atau Dataplex DataScan Administrator (roles/dataplex.dataScanAdmin) di project -
BigQuery Data Editor (
roles/bigquery.dataEditor) di tabel -
Pengguna BigQuery (
roles/bigquery.user) atau Pengguna BigQuery Studio (roles/bigquery.studioUser) di project.
-
Dataplex DataScan Editor (
-
Untuk melihat insight:
-
Dataplex DataScan DataViewer (
roles/dataplex.dataScanDataViewer) di project -
BigQuery Data Viewer (
roles/bigquery.dataViewer) di set data
-
Dataplex DataScan DataViewer (
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Untuk melihat izin yang benar-benar diperlukan untuk membuat insight, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
bigquery.datasets.get: membaca metadata set databigquery.jobs.create: membuat tugasbigquery.tables.get: mendapatkan metadata tabelbigquery.tables.getData: mendapatkan data dan metadata tabeldataplex.datascans.create: membuat resource DataScandataplex.datascans.get: membaca metadata resource DataScandataplex.datascans.getData: membaca hasil eksekusi DataScandataplex.datascans.run: menjalankan DataScan sesuai permintaan
Membuat insight set data
Di Google Cloud konsol, buka BigQuery Studio.
Di panel Explorer , pilih project, lalu set data yang ingin Anda buat insight-nya.
Klik tab Insights.
Klik Generate.
Jika set data Anda berada di multi-region, Anda mungkin akan diminta untuk memilih region guna membuat insight. Pilih region yang sesuai dengan multi-region tempat pemindaian insight akan dibuat.
Perlu waktu beberapa menit agar insight terisi. Kualitas insight akan meningkat jika tabel dalam set data memiliki hasil pembuatan profil data.
Setelah insight dibuat, BigQuery akan menampilkan deskripsi set data, grafik hubungan, tabel hubungan, dan contoh kueri antar-tabel.
Melihat dan menyimpan deskripsi set data
Gemini membuat deskripsi set data dalam bahasa alami, yang meringkas jenis tabel yang ada di dalamnya dan domain bisnis yang diwakilinya. Untuk menyimpan deskripsi ini ke metadata set data, klik Save to details.
Anda dapat mengedit deskripsi sebelum menyimpan detailnya.
Menjelajahi grafik hubungan
Grafik Relationships memberikan representasi visual tentang hubungan antar tabel dalam set data. Grafik ini menampilkan 10 tabel yang paling terhubung sebagai node, dengan garis yang mewakili hubungan antar tabel.
- Untuk melihat detail hubungan, seperti kolom yang menggabungkan dua tabel, arahkan kursor ke tepi yang menghubungkan node tabel.
- Untuk mengatur ulang grafik agar lebih mudah dilihat, tarik node tabel.
Menggunakan tabel hubungan
Relationship table mencantumkan hubungan yang ditemukan dalam format tabel. Setiap baris mewakili hubungan antara dua tabel, yang menampilkan tabel dan kolom sumber, serta tabel dan kolom tujuan. Kolom Source menunjukkan cara hubungan ditentukan:
- LLM inferred. Hubungan yang disimpulkan oleh Gemini, berdasarkan nama dan deskripsi tabel dan kolom di seluruh set data.
- Usage based. Hubungan yang diekstrak dari log kueri, berdasarkan gabungan yang sering digunakan.
- Schema-defined. Hubungan yang berasal dari kunci utama dan kunci asing yang ada di skema tabel.
Anda dapat memfilter hubungan untuk tabel tertentu atau memberikan masukan tentang kualitas hubungan yang terdeteksi. Untuk mengekspor deskripsi dan hubungan set data yang dibuat ke file JSON, klik Export to JSON.
Menggunakan rekomendasi kueri
Berdasarkan hubungan yang ditemukan, Gemini membuat contoh kueri. Ini adalah pertanyaan dalam bahasa alami dengan kueri SQL yang sesuai yang menggabungkan beberapa tabel dalam set data.
Untuk melihat kueri SQL, klik pertanyaan.
Untuk membuka kueri di editor kueri BigQuery, klik Copy to query. Kemudian, Anda dapat menjalankan kueri atau mengubahnya.
Untuk mengajukan pertanyaan lanjutan, klik Ask a follow-up, yang akan membuka kanvas data tanpa judul tempat Anda dapat berinteraksi dengan Gemini untuk menjelajahi data Anda.
Langkah berikutnya
- Pelajari ringkasan insight data.
- Pelajari cara membuat insight tabel.
- Pelajari lebih lanjut pembuatan profil data Dataplex Universal Catalog.