Membuat kueri data BigLake dengan bahasa alami

Panduan ini menunjukkan cara menggunakan analisis percakapan di BigQuery untuk mengkueri data di tabel BigLake dengan perintah bahasa natural. Dengan memanfaatkan Google CloudBigLake, Anda dapat berinteraksi dengan data Anda sendiri di BigLake seolah-olah data tersebut adalah tabel BigQuery standar.

Cara kerja analisis percakapan

Analisis percakapan menggunakan model bahasa besar (LLM) untuk memahami pertanyaan dalam bahasa alami Anda dan memetakannya ke skema tabel BigLake Anda. Prosesnya mengikuti langkah-langkah berikut:

  1. Penemuan skema: Sistem mengambil metadata dari metastore BigLake untuk memahami struktur tabel, nama kolom, dan jenis data.
  2. Pembuatan SQL: LLM membuat kueri SQL yang kompatibel dengan mesin BigQuery dan format data pokok.
  3. Eksekusi: BigQuery menjalankan kueri SQL yang dihasilkan secara langsung terhadap data format terbuka di BigLake.
  4. Respons: Hasil ditampilkan ke antarmuka percakapan, sering kali disertai dengan ringkasan atau visualisasi.

Untuk mengetahui informasi selengkapnya tentang analisis percakapan, seperti mengelola agen data, harga, atau praktik terbaik, lihat Ringkasan analisis percakapan.

Format yang didukung

Analisis percakapan menerjemahkan pertanyaan natural language Anda menjadi kueri SQL. Katalog ini mendukung format tabel terbuka yang didukung oleh metastore BigLake, seperti tabel Apache Iceberg.

Sebelum memulai

Sebelum dapat membuat kueri data, daftarkan tabel eksternal Anda di metastore BigLake. Metastore BigLake berfungsi sebagai hub terpadu yang menghubungkan BigQuery Studio ke data format terbuka eksternal Anda. Setelah terhubung, tabel menjadi aset yang dapat ditemukan dalam BigQuery.

Mengkueri tabel dengan analisis percakapan

  1. Di konsol Google Cloud , buka BigQuery Studio Agents Hub.

    Buka Hub Agen

  2. Buat Agen Data atau mulai percakapan langsung dengan agen data yang ada.

  3. Pilih tabel BigLake Anda.

    Karena metastore BigLake menyatukan semua format yang berbeda ini, pengalaman penemuan identik dengan menemukan tabel BigQuery standar.

    1. Penelusuran: Saat Anda menambahkan sumber pengetahuan, cari nama tabel Anda di antarmuka penelusuran dan pemilihan tabel. Anda dapat menggunakan kata kunci penelusuran untuk memfilter hasil, termasuk:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Verifikasi sumber: Perhatikan bagian set data dari nama yang sepenuhnya memenuhi syarat. Tabel BigLake yang dibuat oleh sumber eksternal dan dikelola oleh metastore BigLake biasanya akan mengikuti format yang menggabungkan katalog dan namespace. Misalnya PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table atau PROJECT_ID.sap_catalog.sales.delta_table.

    3. Pilih: Tambahkan tabel BigLake yang dipilih ke konteks percakapan aktif Anda.

  4. Ajukan pertanyaan dalam bahasa alami. Sistem akan otomatis menerjemahkan perintah Anda menjadi kueri SQL gabungan.

Meningkatkan akurasi kueri

Untuk membantu analisis percakapan lebih memahami skema dan terminologi BigLake Anda, gunakan opsi konfigurasi Agen Data. Opsi ini mencakup glosarium bisnis, kueri SQL terverifikasi, dan petunjuk sistem.

Langkah berikutnya