Dokumen ini menjelaskan cara membuat, melihat, dan mengelola insight data untuk data terstruktur Anda. Menggunakan insight data yang didukung AI membantu Anda mempercepat eksplorasi data dengan membuat deskripsi, grafik hubungan, dan kueri SQL secara otomatis dari metadata tabel dan set data Anda.
Di BigQuery Studio, Anda dapat membuat insight data untuk set data, tabel, tampilan, tabel BigLake, dan tabel eksternal BigQuery.
Di Knowledge Catalog, Anda dapat membuat insight data untuk tabel BigLake dan Iceberg REST Catalog.
Sebelum memulai
Sebelum menggunakan insight data, pastikan Anda telah menyelesaikan prasyarat berikut:
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk menggunakan insight data, minta administrator untuk memberi Anda peran IAM berikut:
-
Dapatkan akses hanya baca ke insight yang dihasilkan:
Dataplex DataScan DataViewer (
roles/dataplex.dataScanDataViewer) di project yang berisi resource -
Membaca data tabel Katalog REST Iceberg:
Pelihat BigLake (
roles/biglake.viewer) pada resource -
Memublikasikan deskripsi sebagai aspek:
Editor Katalog Dataplex (
roles/dataplex.catalogEditor) pada resource -
Memublikasikan kueri sebagai aspek:
Pemilik Entri dan EntryLink Dataplex (
roles/dataplex.entryOwner) pada resource
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin yang diperlukan untuk menggunakan insight data. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk menggunakan insight data:
-
dataplex.datascans.create -
dataplex.datascans.get -
dataplex.datascans.getData -
dataplex.datascans.run
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Mengaktifkan API
Untuk menggunakan insight data, aktifkan API berikut di project Anda:
- Dataplex API
- BigQuery API
- Gemini for Google Cloud API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin
(roles/serviceusage.serviceUsageAdmin),
yang berisi izin serviceusage.services.enable. Pelajari cara memberikan
peran.
Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan Gemini for Google Cloud API, lihat Mengaktifkan Gemini for Google Cloud API di sebuah Google Cloud project.
Menyiapkan data
Untuk tabel BigLake, pastikan data Anda ada di Cloud Storage dan tabel BigLake telah dibuat.
Untuk tabel Katalog REST Iceberg, pastikan tabel Anda terdaftar di BigLake Metastore.
Menghasilkan insight di BigQuery
Insight data untuk set data, tabel, tampilan, tabel BigLake, dan tabel eksternal BigQuery dihasilkan menggunakan Gemini di BigQuery dan hanya dapat dihasilkan di BigQuery Studio.
Anda harus menyiapkan Gemini di BigQuery terlebih dahulu, lalu membuat insight. Setelah membuat insight, Anda dapat melihat dan mengubahnya di Katalog Pengetahuan.
Untuk mengetahui informasi selengkapnya tentang cara membuat insight di BigQuery, lihat dokumen berikut:
Membuat insight untuk tabel Katalog REST Iceberg
Di konsol Google Cloud , buka halaman Penelusuran Katalog Pengetahuan.
Di Filter, pilih BigLake.
Pilih tabel Iceberg REST Catalog yang ingin Anda buat insight-nya.
Klik tab Insights. Jika tab kosong, berarti insight untuk tabel ini belum dibuat.
Untuk membuat insight dan melampirkannya secara permanen ke tabel sebagai aspek, klik Buat dan publikasikan. Hal ini membuat insight dapat diindeks, dapat ditelusuri, dan dapat dilihat oleh pengguna lain di organisasi Anda dalam Katalog Pengetahuan.
Untuk membuat insight dan melihatnya sementara selama sesi saat ini, klik Buat tanpa memublikasikan. Gunakan opsi ini jika Anda hanya memerlukan analisis cepat data tanpa menyimpan metadata ke Knowledge Catalog.
Untuk mengetahui informasi selengkapnya tentang perbedaan antara mode Buat dan publikasikan dan Buat tanpa memublikasikan, lihat Mode untuk membuat insight data.
Pilih region untuk membuat insight, lalu klik Buat.
Proses pengisian insight memerlukan waktu beberapa menit.
Klik tab Insights dan tinjau hal berikut:
- Deskripsi: Ini adalah ringkasan buatan AI yang menjelaskan tujuan tabel dan menjelaskan kolom tertentu.
- Contoh kueri: Ini adalah daftar kueri SQL yang disesuaikan dan dirancang khusus untuk skema dan konten set data Anda.
Untuk melihat kueri SQL yang menjawab pertanyaan, klik pertanyaan.
Meninjau insight yang dihasilkan untuk resource
Untuk melihat hasil analisis yang dihasilkan untuk suatu resource, selesaikan langkah-langkah berikut:
Di konsol Google Cloud , buka halaman Knowledge Catalog Search.
Telusuri resource yang insight-nya ingin Anda lihat.
Di hasil penelusuran, klik resource untuk membuka halaman detail entri.
Tinjau Deskripsi dan Kueri yang dibuat untuk resource yang dipilih.
Untuk melihat grafik hubungan guna memahami cara titik data terhubung, klik tab Hubungan (Pratinjau). Anda hanya dapat melihat hubungan di tingkat tabel, bukan di tingkat set data.
Mengelola insight tabel
Setelah membuat dan memublikasikan insight tabel, Anda dapat meninjau dan mengelolanya sebagai aspek metadata di Katalog Pengetahuan. Insight tingkat tabel mencakup deskripsi tabel dan kolom, serta contoh kueri.
Memperbarui deskripsi yang dibuat untuk tabel
Anda hanya dapat memperbarui deskripsi tabel dan kolom menggunakan Dataplex API. Untuk melakukannya, gunakan metode entries.patch.
Memperbarui kueri yang dibuat untuk tabel
Anda dapat memperbarui kueri yang dihasilkan untuk tabel menggunakan Google Cloud konsol dan Dataplex API.
Konsol
Telusuri tabel yang kueri yang dihasilkan ingin Anda perbarui.
Di hasil penelusuran, klik tabel untuk membuka halaman detail entri.
Di bagian Queries, klik Edit.
Perbarui deskripsi kueri sesuai kebutuhan.
Mengelola kepemilikan: Secara default, Sumber disetel ke Agen. Jika Anda mengubah kueri dan mengubah sumber ke Pengguna, eksekusi pembuatan insight berikutnya tidak akan menggantikan perubahan Anda. Jika Sumber tetap Agen, kueri dapat diganti selama regenerasi.
Mengelola penggantian: Untuk mencegah semua kueri diganti selama penayangan ulang, Anda dapat menyetel opsi Dikelola pengguna ke Benar. Hal ini berlaku untuk seluruh kumpulan kueri untuk aspek metadata tersebut, sehingga memastikan tidak ada perubahan manual yang hilang.
REST
Untuk memperbarui kueri untuk tabel, gunakan metode entries.patch.
Memperbarui relasi yang dibuat untuk tabel
Anda dapat memperbarui hubungan hanya menggunakan Dataplex API. Untuk melakukannya, gunakan metode entries.patch.
Mengelola insight set data
Insight tingkat set data berfokus pada deskripsi tingkat tinggi dan kueri di seluruh set data.
Memperbarui deskripsi yang dibuat untuk set data
Anda dapat memperbarui deskripsi set data hanya menggunakan Dataplex API. Untuk melakukannya, gunakan metode entries.patch.
Memperbarui kueri yang dihasilkan untuk set data
Anda dapat memperbarui kueri yang dihasilkan untuk set data menggunakan Google Cloud konsol dan Dataplex API.
Konsol
Telusuri set data yang kueri yang dihasilkan ingin Anda perbarui.
Di hasil penelusuran, klik set data untuk membuka halaman detail entri.
Di bagian Queries, klik Edit.
Perbarui deskripsi sesuai kebutuhan.
Mengelola kepemilikan: Secara default, Sumber disetel ke Agen. Jika Anda mengubah kueri dan mengubah sumber ke Pengguna, eksekusi pembuatan insight berikutnya tidak akan menggantikan perubahan Anda. Jika Sumber tetap Agen, kueri dapat diganti selama regenerasi.
Mengelola penggantian: Untuk mencegah semua kueri diganti selama penayangan ulang, Anda dapat menyetel opsi Dikelola pengguna ke Benar. Hal ini berlaku untuk seluruh kumpulan kueri untuk aspek metadata tersebut, sehingga memastikan tidak ada perubahan manual yang hilang.
REST
Untuk memperbarui kueri set data, gunakan metode entries.patch.
Langkah berikutnya
Pelajari lebih lanjut insight data untuk data terstruktur.
Pelajari cara membuat insight untuk data tidak terstruktur.