Membuat kueri tabel Lakehouse dengan bahasa alami

Panduan ini menunjukkan cara menggunakan analisis percakapan di BigQuery untuk mengkueri data di Google Cloud Lakehouse dengan perintah natural language.

Cara kerja analisis percakapan

Analisis percakapan menggunakan model bahasa besar (LLM) untuk memahami pertanyaan natural language Anda dan memetakannya ke skema tabel Anda. Prosesnya mengikuti langkah-langkah berikut:

  1. Penemuan skema: Sistem mengambil metadata dari katalog runtime Lakehouse untuk memahami struktur tabel, nama kolom, dan jenis data.
  2. Pembuatan SQL: LLM membuat kueri SQL yang kompatibel dengan mesin BigQuery dan format data yang mendasarinya.
  3. Eksekusi: BigQuery menjalankan kueri SQL yang dibuat langsung terhadap data format terbuka di Lakehouse.
  4. Respons: Hasilnya ditampilkan ke antarmuka percakapan, sering kali disertai ringkasan atau visualisasi.

Untuk mengetahui informasi selengkapnya tentang analisis percakapan, seperti mengelola agen data, harga, atau praktik terbaik, lihat Ringkasan analisis percakapan.

Format yang didukung

Analisis percakapan menerjemahkan pertanyaan natural language Anda menjadi kueri SQL. Analisis ini mendukung format tabel terbuka yang didukung oleh katalog runtime Lakehouse, seperti tabel Apache Iceberg.

Sebelum memulai

Sebelum dapat mengkueri data, daftarkan tabel eksternal Anda di katalog runtime Lakehouse. Katalog runtime Lakehouse bertindak sebagai hub terpadu yang menghubungkan BigQuery Studio ke data format terbuka eksternal Anda. Setelah terhubung, tabel akan menjadi aset yang dapat ditemukan dalam BigQuery.

Menganalisis tabel Lakehouse dengan agen analisis percakapan

  1. Di konsol Google Cloud, buka Hub Agen BigQuery Studio.

    Buka Hub Agen

  2. Buat Agen Data atau mulai percakapan langsung dengan agen data yang ada.

  3. Pilih tabel Anda.

    Karena katalog runtime Lakehouse menyatukan semua format yang berbeda ini, pengalaman penemuan identik dengan menemukan tabel BigQuery standar.

    1. Penelusuran: Saat menambahkan sumber pengetahuan, cari nama tabel Anda di antarmuka penelusuran dan pemilihan tabel. Anda dapat menggunakan kata kunci penelusuran untuk memfilter hasil, termasuk:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Verifikasi sumber: Perhatikan bagian set data dari nama yang sepenuhnya memenuhi syarat. Tabel yang dibuat oleh sumber eksternal dan dikelola oleh katalog runtime Lakehouse biasanya akan mengikuti format yang menggabungkan katalog dan namespace. Misalnya: PROJECT_ID.lakehouse_catalog.finance_namespace.my_iceberg_table atau PROJECT_ID.sap_catalog.sales.delta_table.

    3. Pilih: Tambahkan tabel yang dipilih ke konteks percakapan aktif Anda.

  4. Ajukan pertanyaan dalam natural language. Sistem akan otomatis menerjemahkan perintah Anda menjadi kueri SQL gabungan.

Meningkatkan akurasi kueri

Untuk membantu analisis percakapan memahami skema dan terminologi Anda dengan lebih baik, gunakan opsi konfigurasi Agen Data. Opsi ini mencakup glosarium bisnis, kueri SQL yang diverifikasi, dan petunjuk sistem.

Langkah berikutnya