Menghasilkan insight set data
Dokumen ini menjelaskan cara membuat insight set data untuk set data BigQuery. Insight set data membantu Anda memahami hubungan antar tabel dalam set data dengan membuat grafik hubungan dan kueri antar-tabel.
Insight set data membantu Anda mempercepat eksplorasi set data dengan beberapa tabel dengan otomatis menemukan dan memvisualisasikan hubungan antar-tabel dalam grafik, mengidentifikasi hubungan kunci utama dan kunci asing, serta membuat contoh kueri antar-tabel. Fitur ini berguna untuk memahami struktur data tanpa dokumentasi, menemukan hubungan antar-tabel yang ditentukan skema, berbasis penggunaan, atau disimpulkan AI, dan membuat kueri kompleks yang menggabungkan beberapa tabel.
Untuk ringkasan insight tabel dan set data, lihat Ringkasan insight data.
Sebelum memulai
Insight data dihasilkan menggunakan Gemini di BigQuery. Untuk mulai membuat insight, Anda harus menyiapkan Gemini di BigQuery terlebih dahulu.
Mengaktifkan API
Untuk menggunakan insight data, aktifkan API berikut di project Anda: Dataplex API, BigQuery API, dan Gemini for Google Cloud API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM
role (roles/serviceusage.serviceUsageAdmin), which
contains the serviceusage.services.enable permission. Learn how to grant
roles.
Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan Gemini for Google Cloud API, lihat Mengaktifkan Gemini for Google Cloud API di project Google Cloud .
Menyelesaikan pemindaian profil data
Untuk meningkatkan kualitas insight, buat hasil pembuatan profil data untuk tabel dalam set data Anda.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan guna membuat, mengelola, dan mengambil insight set data, minta administrator untuk memberi Anda peran IAM berikut:
-
Untuk membuat, mengelola, dan mengambil insight:
-
Dataplex DataScan Editor (
roles/dataplex.dataScanEditor) atau Dataplex DataScan Administrator (roles/dataplex.dataScanAdmin) di project -
BigQuery Data Editor (
roles/bigquery.dataEditor) pada tabel -
Pengguna BigQuery (
roles/bigquery.user) atau Pengguna BigQuery Studio (roles/bigquery.studioUser) di project.
-
Dataplex DataScan Editor (
-
Untuk melihat insight:
-
Dataplex DataScan DataViewer (
roles/dataplex.dataScanDataViewer) di project -
BigQuery Data Viewer (
roles/bigquery.dataViewer) di set data
-
Dataplex DataScan DataViewer (
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Untuk melihat izin persis yang diperlukan untuk membuat insight, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
bigquery.datasets.get: membaca metadata set databigquery.jobs.create: membuat tugasbigquery.tables.get: mendapatkan metadata tabelbigquery.tables.getData: mendapatkan data dan metadata tabeldataplex.datascans.create: membuat resource DataScandataplex.datascans.get: membaca metadata resource DataScandataplex.datascans.getData: membaca hasil eksekusi DataScandataplex.datascans.run: menjalankan DataScan sesuai permintaan
Menghasilkan insight set data
Di konsol Google Cloud , buka BigQuery Studio.
Di panel Explorer, pilih project, lalu pilih set data yang ingin Anda buat insight-nya.
Klik tab Insights.
Klik Generate.
Jika set data Anda berada di multi-region, Anda mungkin diminta untuk memilih region untuk membuat insight. Pilih region yang sesuai dengan multi-region tempat pemindaian insight akan dibuat.
Proses pengisian insight memerlukan waktu beberapa menit. Kualitas insight akan meningkat jika tabel dalam set data memiliki hasil pembuatan profil data.
Setelah insight dibuat, BigQuery akan menampilkan deskripsi set data, grafik hubungan, tabel hubungan, dan contoh kueri lintas tabel.
Melihat dan menyimpan deskripsi set data
Gemini membuat deskripsi bahasa alami tentang set data, meringkas jenis tabel yang ada di dalamnya dan domain bisnis yang diwakilinya. Untuk menyimpan deskripsi ini ke metadata set data, klik Simpan ke detail.
Anda dapat mengedit deskripsi sebelum menyimpan detail.
Menjelajahi grafik hubungan
Grafik Hubungan memberikan representasi visual tentang hubungan antartabel dalam kumpulan data. Bagian ini menampilkan 10 tabel yang paling terhubung sebagai node, dengan garis yang merepresentasikan hubungan di antara tabel tersebut.
- Untuk melihat detail hubungan, seperti kolom yang menggabungkan dua tabel, arahkan kursor ke tepi yang menghubungkan node tabel.
- Untuk mengatur ulang grafik agar lebih mudah dilihat, tarik node tabel.
Menggunakan tabel hubungan
Tabel hubungan mencantumkan hubungan yang ditemukan dalam format tabular. Setiap baris mewakili hubungan antara dua tabel, yang menampilkan tabel dan kolom sumber, serta tabel dan kolom tujuan. Kolom Sumber menunjukkan cara penentuan hubungan:
- Disimpulkan LLM. Hubungan yang disimpulkan oleh Gemini, berdasarkan nama dan deskripsi tabel dan kolom di seluruh set data.
- Berdasarkan penggunaan. Hubungan diekstrak dari log kueri, berdasarkan gabungan yang sering terjadi.
- Ditentukan skema. Hubungan yang berasal dari pemetaan kunci utama dan kunci asing yang ada dalam skema tabel.
Anda dapat memfilter hubungan untuk tabel tertentu atau memberikan masukan tentang kualitas hubungan yang terdeteksi. Untuk mengekspor deskripsi dan hubungan set data yang dibuat ke file JSON, klik Ekspor ke JSON.
Menggunakan rekomendasi kueri
Berdasarkan hubungan yang ditemukan, Gemini membuat contoh kueri. Berikut adalah pertanyaan dalam bahasa alami dengan kueri SQL yang sesuai yang menggabungkan beberapa tabel dalam set data.
Untuk melihat kueri SQL, klik pertanyaan.
Untuk membuka kueri di editor kueri BigQuery, klik Salin ke kueri. Kemudian, Anda dapat menjalankan kueri atau mengubahnya.
Untuk mengajukan pertanyaan lanjutan, klik Ajukan pertanyaan lanjutan, yang akan membuka kanvas data tanpa judul tempat Anda dapat melakukan percakapan dengan Gemini untuk menjelajahi data Anda.
Langkah berikutnya
- Pelajari ringkasan insight data.
- Pelajari cara membuat insight tabel.
- Pelajari lebih lanjut pembuatan profil data Katalog Universal Dataplex.