Panduan ini menunjukkan cara menggunakan analisis percakapan di BigQuery untuk mengkueri data di Google Cloud Lakehouse dengan perintah natural language.
Cara kerja analisis percakapan
Analisis percakapan menggunakan model bahasa besar (LLM) untuk memahami pertanyaan natural language Anda dan memetakannya ke skema tabel Anda. Prosesnya mengikuti langkah-langkah berikut:
- Penemuan skema: Sistem mengambil metadata dari katalog runtime Lakehouse untuk memahami struktur tabel, nama kolom, dan jenis data.
- Pembuatan SQL: LLM membuat kueri SQL yang kompatibel dengan mesin BigQuery dan format data yang mendasarinya.
- Eksekusi: BigQuery menjalankan kueri SQL yang dibuat langsung terhadap data format terbuka di Lakehouse.
- Respons: Hasilnya ditampilkan ke antarmuka percakapan, sering kali disertai ringkasan atau visualisasi.
Untuk mengetahui informasi selengkapnya tentang analisis percakapan, seperti mengelola agen data, harga, atau praktik terbaik, lihat Ringkasan analisis percakapan.
Format yang didukung
Analisis percakapan menerjemahkan pertanyaan natural language Anda menjadi kueri SQL. Analisis ini mendukung format tabel terbuka yang didukung oleh katalog runtime Lakehouse, seperti tabel Apache Iceberg.
Sebelum memulai
Sebelum dapat mengkueri data, daftarkan tabel eksternal Anda di katalog runtime Lakehouse. Katalog runtime Lakehouse bertindak sebagai hub terpadu yang menghubungkan BigQuery Studio ke data format terbuka eksternal Anda. Setelah terhubung, tabel akan menjadi aset yang dapat ditemukan dalam BigQuery.
Menganalisis tabel Lakehouse dengan agen analisis percakapan
Di konsol Google Cloud, buka Hub Agen BigQuery Studio.
Buat Agen Data atau mulai percakapan langsung dengan agen data yang ada.
Pilih tabel Anda.
Karena katalog runtime Lakehouse menyatukan semua format yang berbeda ini, pengalaman penemuan identik dengan menemukan tabel BigQuery standar.
Penelusuran: Saat menambahkan sumber pengetahuan, cari nama tabel Anda di antarmuka penelusuran dan pemilihan tabel. Anda dapat menggunakan kata kunci penelusuran untuk memfilter hasil, termasuk:
TABLE_NAMEcatalog: CATALOG_NAMEproject: PROJECT_IDnamespace: NAMESPACE_NAME
Verifikasi sumber: Perhatikan bagian set data dari nama yang sepenuhnya memenuhi syarat. Tabel yang dibuat oleh sumber eksternal dan dikelola oleh katalog runtime Lakehouse biasanya akan mengikuti format yang menggabungkan katalog dan namespace. Misalnya:
PROJECT_ID.lakehouse_catalog.finance_namespace.my_iceberg_tableatauPROJECT_ID.sap_catalog.sales.delta_table.Pilih: Tambahkan tabel yang dipilih ke konteks percakapan aktif Anda.
Ajukan pertanyaan dalam natural language. Sistem akan otomatis menerjemahkan perintah Anda menjadi kueri SQL gabungan.
Meningkatkan akurasi kueri
Untuk membantu analisis percakapan memahami skema dan terminologi Anda dengan lebih baik, gunakan opsi konfigurasi Agen Data. Opsi ini mencakup glosarium bisnis, kueri SQL yang diverifikasi, dan petunjuk sistem.
Langkah berikutnya
- Pelajari lebih lanjut analisis percakapan di BigQuery.
- Pelajari cara mendaftarkan tabel eksternal di katalog runtime Lakehouse.
- Pelajari lebih lanjut Agen Data.