Insight data Knowledge Catalog (sebelumnya Katalog Universal Dataplex) otomatis membuat deskripsi, diagram hubungan, dan kueri SQL dari metadata tabel dan set data Anda. Informasi ini membantu Anda memahami struktur, konten, dan hubungan data dengan cepat tanpa penyiapan manual yang ekstensif. Untuk menyelidiki lebih lanjut, Anda dapat mengajukan pertanyaan lanjutan di kanvas data.
Saat menjelajahi tabel baru yang tidak dikenal, analis data sering kali menghadapi masalah cold start tentang cara mulai menulis kueri. Masalah ini dapat mencakup ketidakpastian tentang struktur data dan pola utama dalam data. Fitur insight data Knowledge Catalog menawarkan cara otomatis untuk menjelajahi dan memahami data Anda. Hal ini membantu Anda menemukan pola, menilai kualitas data, dan melakukan analisis statistik.
Cara kerja insight data
Insight data menggunakan Gemini untuk menganalisis metadata Anda dan menghasilkan hal berikut:
Deskripsi: Ringkasan yang dibuat AI yang menjelaskan tujuan set data, struktur tabel, dan detail kolom tertentu.
Contoh kueri: Kueri SQL yang disesuaikan dan dirancang khusus untuk skema dan konten set data atau tabel Anda.
Diagram hubungan: Visualisasi yang menunjukkan koneksi dan dependensi antara tabel yang berbeda dalam set data Anda.
Resource yang didukung
Insight data tersedia untuk jenis data terstruktur berikut:
- Set data, tabel, dan tampilan BigQuery
- Tabel Google Cloud Lakehouse (termasuk Apache Iceberg)
- Tabel eksternal
- Tabel Katalog REST Iceberg
Contoh menjalankan insight
Insight data otomatis membuat kueri bahasa alami dan kueri SQL yang setara berdasarkan metadata tabel.
Pertimbangkan tabel bernama telco_churn dengan metadata berikut:
| Nama kolom | Jenis |
|---|---|
| CustomerID | STRING |
| Gender | STRING |
| Tenure | INT64 |
| InternetService | STRING |
| StreamingTV | STRING |
| OnlineBackup | STRING |
| Contract | STRING |
| TechSupport | STRING |
| PaymentMethod | STRING |
| MonthlyCharges | FLOAT |
| Churn | BOOLEAN |
Berikut adalah beberapa contoh kueri yang dihasilkan insight data untuk tabel ini:
Mengidentifikasi pelanggan yang telah berlangganan semua layanan premium dan telah menjadi pelanggan selama lebih dari 50 bulan.
SELECT CustomerID, Contract, Tenure FROM agentville_datasets.telco_churn WHERE OnlineBackup = 'Yes' AND TechSupport = 'Yes' AND StreamingTV = 'Yes' AND Tenure > 50;Mengidentifikasi layanan internet mana yang memiliki pelanggan yang paling banyak berhenti berlangganan.
SELECT InternetService, COUNT(DISTINCT CustomerID) AS total_customers FROM agentville_datasets.telco_churn WHERE Churn = TRUE GROUP BY InternetService ORDER BY total_customers DESC LIMIT 1;Mengidentifikasi tingkat berhenti berlangganan berdasarkan segmen di antara pelanggan bernilai tinggi.
SELECT Contract, InternetService, Gender, PaymentMethod, COUNT(DISTINCT CustomerID) AS total_customers, SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers, (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID)) * 100 AS churn_rate FROM agentville_datasets.telco_churn WHERE MonthlyCharges > 100 GROUP BY Contract, InternetService, Gender, PaymentMethod;
Mode untuk menghasilkan insight data
Saat menghasilkan insight data, Knowledge Catalog menyediakan dua mode:
| Mode | Deskripsi | Penggunaan |
|---|---|---|
| Buat dan publikasikan |
Mempertahankan insight data yang dihasilkan ke Knowledge Catalog sebagai aspek metadata. Anda harus memiliki izin yang diperlukan untuk memublikasikan. Saat Anda menggunakan Buat dan publikasikan, tindakan berikut akan terjadi:
|
Gunakan mode ini untuk dokumentasi data di seluruh perusahaan yang dipertahankan dan dapat digunakan kembali, atau saat membuat alur kerja tata kelola berbasis katalog |
| Buat tanpa memublikasikan |
Membuat insight data seperti deskripsi, pertanyaan bahasa alami, dan kueri SQL sesuai permintaan. Buat tanpa memublikasikan tidak memublikasikan insight ke Knowledge Catalog. |
Gunakan mode ini untuk eksplorasi ad hoc yang cepat guna menghindari katalog yang berantakan. |
Harga
Untuk mengetahui detail harga fitur ini, lihat Ringkasan harga Gemini di BigQuery.
Lokasi
Anda dapat menggunakan insight data di semua lokasi BigQuery. Untuk mempelajari tempat Gemini di BigQuery memproses data Anda, lihat Tempat Gemini di BigQuery memproses data Anda.
Batasan
- Untuk pelanggan multi-cloud, data dari cloud lain tidak tersedia.
- Insight data tidak mendukung jenis kolom
GeoatauJSON. - Menjalankan insight tidak menjamin presentasi kueri setiap saat. Untuk meningkatkan kemungkinan menghasilkan kueri yang lebih menarik, buat ulang insight di BigQuery Studio.
Langkah berikutnya
- Pelajari cara membuat insight di BigQuery.
- Pelajari cara membuat pemindaian pembuatan profil data.
- Pelajari cara menulis kueri dengan bantuan Gemini di BigQuery.