Membuat insight set data

Dokumen ini menjelaskan cara membuat insight set data untuk set data BigQuery. Insight set data membantu Anda memahami hubungan antar tabel dalam set data dengan membuat grafik hubungan dan kueri antar-tabel.

Insight set data membantu Anda mempercepat eksplorasi set data dengan beberapa tabel dengan otomatis menemukan dan memvisualisasikan hubungan antar tabel dalam grafik, mengidentifikasi hubungan kunci utama dan kunci asing, serta membuat contoh kueri antar-tabel. Hal ini berguna untuk memahami struktur data tanpa dokumentasi, menemukan hubungan antar tabel yang ditentukan skema, berbasis penggunaan, atau disimpulkan AI, dan membuat kueri kompleks yang menggabungkan beberapa tabel.

Untuk mengetahui ringkasan insight tabel dan set data, lihat Ringkasan insight data.

Sebelum memulai

Insight data dibuat menggunakan Gemini di BigQuery. Untuk mulai membuat insight, Anda harus menyiapkan Gemini di BigQuery terlebih dahulu .

Mengaktifkan API

Untuk menggunakan insight data, aktifkan API berikut di project Anda: Dataplex API, BigQuery API, dan Gemini for Google Cloud API.

Peran yang diperlukan untuk mengaktifkan API

Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (roles/serviceusage.serviceUsageAdmin), yang berisi izin serviceusage.services.enable. Pelajari cara memberikan peran.

Aktifkan API

Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan Gemini for Google Cloud API, lihat Mengaktifkan Gemini for Google Cloud API di sebuah Google Cloud project.

Menyelesaikan pemindaian profil data

Untuk meningkatkan kualitas insight, buat hasil pembuatan profil data untuk tabel di set data Anda.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk membuat, mengelola, dan mengambil insight set data, minta administrator untuk memberi Anda peran IAM berikut:

  • Untuk membuat, mengelola, dan mengambil insight:
    • Dataplex DataScan Editor (roles/dataplex.dataScanEditor) atau Dataplex DataScan Administrator (roles/dataplex.dataScanAdmin) di project
    • BigQuery Data Editor (roles/bigquery.dataEditor) di tabel
    • Pengguna BigQuery (roles/bigquery.user) atau Pengguna BigQuery Studio (roles/bigquery.studioUser) di project.
  • Untuk melihat insight:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Untuk melihat izin yang benar-benar diperlukan untuk membuat insight, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

  • bigquery.datasets.get: membaca metadata set data
  • bigquery.jobs.create: membuat tugas
  • bigquery.tables.get: mendapatkan metadata tabel
  • bigquery.tables.getData: mendapatkan data dan metadata tabel
  • dataplex.datascans.create: membuat resource DataScan
  • dataplex.datascans.get: membaca metadata resource DataScan
  • dataplex.datascans.getData: membaca hasil eksekusi DataScan
  • dataplex.datascans.run: menjalankan DataScan sesuai permintaan

Membuat insight set data

  1. Di Google Cloud konsol, buka BigQuery Studio.

    Buka BigQuery Studio

  2. Di panel Explorer , pilih project, lalu set data yang ingin Anda buat insight-nya.

  3. Klik tab Insights.

  4. Klik Generate.

    Jika set data Anda berada di multi-region, Anda mungkin akan diminta untuk memilih region guna membuat insight. Pilih region yang sesuai dengan multi-region tempat pemindaian insight akan dibuat.

    Perlu waktu beberapa menit agar insight terisi. Kualitas insight akan meningkat jika tabel dalam set data memiliki hasil pembuatan profil data.

Setelah insight dibuat, BigQuery akan menampilkan deskripsi set data, grafik hubungan, tabel hubungan, dan contoh kueri antar-tabel.

Melihat dan menyimpan deskripsi set data

Gemini membuat deskripsi set data dalam bahasa alami, yang meringkas jenis tabel yang ada di dalamnya dan domain bisnis yang diwakilinya. Untuk menyimpan deskripsi ini ke metadata set data, klik Save to details.

Anda dapat mengedit deskripsi sebelum menyimpan detailnya.

Menjelajahi grafik hubungan

Grafik Relationships memberikan representasi visual tentang hubungan antar tabel dalam set data. Grafik ini menampilkan 10 tabel yang paling terhubung sebagai node, dengan garis yang mewakili hubungan antar tabel.

  • Untuk melihat detail hubungan, seperti kolom yang menggabungkan dua tabel, arahkan kursor ke tepi yang menghubungkan node tabel.
  • Untuk mengatur ulang grafik agar lebih mudah dilihat, tarik node tabel.

Menggunakan tabel hubungan

Relationship table mencantumkan hubungan yang ditemukan dalam format tabel. Setiap baris mewakili hubungan antara dua tabel, yang menampilkan tabel dan kolom sumber, serta tabel dan kolom tujuan. Kolom Source menunjukkan cara hubungan ditentukan:

  • LLM inferred. Hubungan yang disimpulkan oleh Gemini, berdasarkan nama dan deskripsi tabel dan kolom di seluruh set data.
  • Usage based. Hubungan yang diekstrak dari log kueri, berdasarkan gabungan yang sering digunakan.
  • Schema-defined. Hubungan yang berasal dari kunci utama dan kunci asing yang ada di skema tabel.

Anda dapat memfilter hubungan untuk tabel tertentu atau memberikan masukan tentang kualitas hubungan yang terdeteksi. Untuk mengekspor deskripsi dan hubungan set data yang dibuat ke file JSON, klik Export to JSON.

Menggunakan rekomendasi kueri

Berdasarkan hubungan yang ditemukan, Gemini membuat contoh kueri. Ini adalah pertanyaan dalam bahasa alami dengan kueri SQL yang sesuai yang menggabungkan beberapa tabel dalam set data.

  1. Untuk melihat kueri SQL, klik pertanyaan.

  2. Untuk membuka kueri di editor kueri BigQuery, klik Copy to query. Kemudian, Anda dapat menjalankan kueri atau mengubahnya.

  3. Untuk mengajukan pertanyaan lanjutan, klik Ask a follow-up, yang akan membuka kanvas data tanpa judul tempat Anda dapat berinteraksi dengan Gemini untuk menjelajahi data Anda.

Langkah berikutnya