Ringkasan analisis percakapan
Analisis percakapan di BigQuery memungkinkan Anda melakukan percakapan dengan agen tentang data Anda menggunakan bahasa alami. Untuk mendapatkan jawaban tentang data Anda, Anda dapat melakukan hal berikut:
- Buat agen data yang secara otomatis menentukan konteks data dan petunjuk pemrosesan kueri untuk sekumpulan sumber pengetahuan, seperti tabel, tampilan, grafik, atau fungsi yang ditentukan pengguna (UDF) yang Anda pilih.
- Jika diperlukan, Anda dapat membuat konteks dan petunjuk untuk agen dalam bentuk metadata tabel dan kolom kustom, petunjuk kepada agen untuk menafsirkan dan membuat kueri data, atau dengan membuat kueri terverifikasi (sebelumnya dikenal sebagai kueri emas) untuk mengonfigurasi agen data agar dapat menjawab pertanyaan secara efektif untuk kasus penggunaan tertentu.
Sebelum menyesuaikan agen, sebaiknya Anda terlebih dahulu menggunakan konteks dan petunjuk yang dibuat agen.
Berikut beberapa contoh konteks dan petunjuk yang Anda berikan kepada agen:
- Context. Agen data untuk analisis penjualan dapat dikonfigurasi untuk memahami bahwa "performer terbaik" merujuk pada tenaga penjual dengan pendapatan tertinggi, bukan hanya kesepakatan yang paling banyak diselesaikan.
- Petunjuk. Anda dapat menginstruksikan agen data untuk selalu memfilter data ke kuartal terbaru saat ditanya tentang "tren", atau mengelompokkan hasil menurut "kategori produk" secara default.
Setelah membuat agen data, Anda dapat melakukan percakapan dengan agen tersebut untuk mengajukan pertanyaan tentang data BigQuery menggunakan bahasa alami. Anda juga dapat membuat percakapan langsung dengan satu atau beberapa sumber data untuk menjawab pertanyaan dasar yang hanya diajukan satu kali.
Analisis percakapan didukung oleh Gemini for Google Cloud dan mendukung beberapa fungsi AI dan ML BigQuery. Untuk mengetahui informasi selengkapnya, lihat Dukungan AI dan ML BigQuery.
Pelajari cara dan waktu Gemini untuk Google Cloud menggunakan data Anda.
Agen data
Agen data terdiri dari satu atau beberapa sumber pengetahuan, dan serangkaian petunjuk khusus untuk kasus penggunaan guna memproses data tersebut. Saat membuat agen data, Anda dapat mengonfigurasinya menggunakan opsi berikut:
- Gunakan sumber pengetahuan seperti tabel, tampilan, dan UDF dengan agen data. Anda juga dapat terhubung ke tabel Lakehouse sebagai sumber. Untuk mengetahui informasi selengkapnya, lihat Membuat kueri data Lakehouse dengan bahasa alami.
- Berikan metadata tabel dan kolom kustom untuk mendeskripsikan data dengan cara yang paling tepat untuk kasus penggunaan tertentu.
- Berikan petunjuk untuk menafsirkan dan membuat kueri data, seperti
mendefinisikan hal berikut:
- Sinonim dan istilah bisnis untuk nama kolom
- Kolom dan default terpenting untuk pemfilteran dan pengelompokan
- Buat kueri terverifikasi yang dapat digunakan agen data untuk membentuk struktur respons agen dan mempelajari logika bisnis yang digunakan organisasi Anda. Kueri terverifikasi sebelumnya dikenal sebagai kueri emas. Kueri yang diverifikasi dapat menggunakan fungsi AI dan ML BigQuery yang didukung dan mendukung parameter kueri.
- Buat istilah glosarium kustom BigQuery untuk setiap agen atau impor istilah glosarium bisnis dari Knowledge Catalog. Istilah ini membantu agen menafsirkan perintah pengguna. Untuk mendapatkan saran tentang kapan harus menggunakan setiap jenis, lihat Membuat atau meninjau istilah glosarium.
Mengelola agen data
Anda dapat membuat, mengelola, dan menggunakan jenis agen data berikut di tab Katalog Agen di konsol Google Cloud :
- Agen contoh yang telah ditentukan sebelumnya untuk setiap project Google Cloud .
- Daftar agen yang Anda buat, buat drafnya, dan publikasikan.
- Daftar agen yang dibuat dan dibagikan kepada Anda oleh orang lain.
Untuk mengetahui informasi selengkapnya, lihat Membuat agen data.
Layanan lain dalam project yang mendukung agen data, seperti Conversational Analytics API dan Data Studio, dapat mengakses agen data yang Anda buat di BigQuery. Anda juga dapat mengakses agen yang dibuat di konsol Google Cloud dengan memanggilnya menggunakan Conversational Analytics API.
Percakapan
Percakapan adalah chat yang dipertahankan dengan agen data atau sumber data. Anda dapat mengajukan pertanyaan multi-bagian kepada agen data yang menggunakan istilah umum seperti "penjualan" atau "paling populer", tanpa harus menentukan nama kolom tabel atau menentukan kondisi untuk memfilter data. Anda juga dapat mengajukan pertanyaan tentang data yang ada di objek seperti PDF. Agen dapat menentukan sumber data mana yang akan dikueri dan memanfaatkan pengoptimalan, seperti partisi tabel atau indeks penelusuran, saat membuat respons.
Respons chat yang ditampilkan kepada Anda menyediakan fitur berikut:
- Jawaban atas pertanyaan Anda dalam bentuk teks, kode, atau gambar (multimodal). Jawaban dapat mencakup fungsi AI dan ML BigQuery yang didukung.
- Membuat diagram jika sesuai.
- Penalaran agen di balik hasil.
- Metadata tentang percakapan, seperti agen dan sumber data yang digunakan.
Saat Anda membuat percakapan langsung dengan sumber data, Conversational Analytics API menafsirkan pertanyaan Anda tanpa konteks dan petunjuk pemrosesan yang ditawarkan agen data. Oleh karena itu, hasil percakapan langsung bisa kurang akurat. Gunakan agen data untuk kasus yang memerlukan akurasi lebih tinggi.
Anda dapat membuat dan mengelola percakapan di BigQuery menggunakan konsolGoogle Cloud . Untuk mengetahui informasi selengkapnya, lihat Menganalisis data dengan percakapan.
Dukungan AI dan ML BigQuery
Analisis percakapan mendukung fungsi AI berikut sebagai respons terhadap percakapan dengan agen data dan sumber data, serta dalam kueri SQL terverifikasi yang Anda buat.
AI.FORECASTAI.DETECT_ANOMALIESAI.KEY_DRIVERSAI.GENERATEAI.IFAI.SCOREAI.CLASSIFYAI.SIMILARITYAI.SEARCH
Anda harus memiliki izin yang diperlukan untuk menjalankan kueri AI generatif.
Agen hanya menggunakan fungsi AI.SEARCH pada tabel yang mengaktifkan
pembuatan sematan mandiri. Jika tidak, agen akan menggunakan fungsi AI.SIMILARITY, yang memerlukan pembuatan sematan real-time.
Kasus penggunaan
Untuk mengaktifkan fungsi yang didukung, gunakan fungsi tersebut dengan cara berikut:
- Saat membuat agen dan menambahkan kueri terverifikasi—misalnya, jika Anda adalah ilmuwan data yang menyiapkan laporan berulang—Anda dapat menggunakan fungsi AI yang didukung dalam kueri terverifikasi untuk menjelaskan default dan mengotomatiskan laporan.
- Saat Anda mengajukan pertanyaan tingkat tinggi tentang data kepada agen, dalam percakapan, atau dalam kueri terverifikasi menggunakan kata kunci, agen akan membuat SQL sebagai respons terhadap pertanyaan Anda.
Tabel berikut menunjukkan contoh perintah sekali jalan yang mengaktifkan penggunaan fungsi AI atau ML:
| Kasus penggunaan | Contoh penggunaan | Set data publik |
|---|---|---|
| Perkiraan | "Prediksi jumlah perjalanan untuk bulan depan." | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| Deteksi anomali | "Temukan pencilan dalam perjalanan per hari untuk tahun 2018 menggunakan tahun 2017 sebagai dasar." | bigquery-public-data.san_francisco_bikeshare.bikeshare_trips |
| Faktor pendorong utama | "Identifikasi pendorong utama perubahan volume perjalanan antara tahun 2017 dan 2018." | bigquery-public-data.austin_bikeshare.bikeshare_trips |
| Pembuatan teks LLM | "Untuk setiap artikel dalam kategori 'olahraga', ringkas kolom isi dalam 1-2 kalimat." | bigquery-public-data.bbc_news.fulltext |
| Pemfilteran semantik | "Untuk artikel dalam kategori teknologi, filter untuk menemukan artikel yang membahas terobosan dalam kecerdasan buatan." | bigquery-public-data.bbc_news.fulltext |
| Penskoran semantik | "Untuk artikel dalam kategori hiburan, berikan rating yang menunjukkan tingkat sentimen positifnya." | bigquery-public-data.bbc_news.fulltext |
| Kategorisasi semantik | "Beri setiap ulasan dengan tag fokus utama pengulas: Akting, Alur Cerita, Sinematografi, Penyutradaraan, atau Lainnya" | bigquery-public-data.imdb.reviews |
| Penelusuran semantik | "Temukan 5 ulasan teratas yang paling cocok dengan 'thriller psikologis yang membangun ketegangan'" | bigquery-public-data.imdb.reviews |
Dukungan grafik
Analisis percakapan mendukung penggunaan grafik sebagai sumber data. Saat Anda mengajukan pertanyaan tentang grafik, agen akan membuat kueri GQL atau SQL untuk menjawabnya. Agen dapat menggunakan deskripsi dan sinonim yang Anda tentukan pada label dan properti grafik untuk meningkatkan kualitas hasil. Agen juga dapat memanfaatkan ukuran yang ditentukan pada grafik Anda untuk melakukan agregasi multi-level. Jika respons menyertakan jalur grafik, visualisasi grafik akan diberikan.
Misalnya, Anda dapat menggunakan contoh agen Look Graph di BigQuery pada halaman Agen untuk mengajukan pertanyaan yang mirip dengan berikut ini tentang grafik bigquery-public-data.thelook_ecommerce.graph:
Which product is most popular among 25-year-olds?Show me the connection between bow tie orders and distribution centers
Batasan
Batasan berikut berlaku saat Anda menggunakan grafik sebagai sumber data:
- Anda dapat menggunakan paling banyak satu grafik sebagai sumber data per agen atau percakapan.
- Anda tidak dapat menggabungkan tabel dan grafik sebagai sumber data.
Keamanan
Anda dapat mengelola akses ke analisis percakapan di BigQuery menggunakan peran dan izin IAM Conversational Analytics API. Untuk mengetahui informasi tentang peran yang diperlukan untuk operasi tertentu, lihat peran yang diperlukan agen data dan peran yang diperlukan percakapan.
Analisis percakapan mencakup fitur dan perlindungan keamanan berikut:
- Aplikasi ini hanya dapat mengakses data dan resource yang izin aksesnya Anda miliki.
- API ini mematuhi kontrol keamanan VPC-SC.
- Pengguna ini tidak dapat melakukan operasi tulis dan tidak dapat menjalankan kueri DML.
- Tidak dapat menjalankan fungsi jarak jauh.
- Fitur ini hanya dapat mengakses sumber pengetahuan yang Anda pilih secara eksplisit.
- Histori percakapan Anda hanya dibagikan kepada Anda. Anda tidak dapat membagikannya kepada pengguna lain.
- Saat membuat agen data, Anda harus memiliki akses untuk membuat kueri setiap sumber pengetahuan yang Anda tambahkan.
Lokasi
Analisis percakapan mendukung tiga lokasi yang mengatur penyimpanan resource agen dan percakapan, serta lokasi yang digunakan untuk pemrosesan ML:
- MREP AS
- MREP Uni Eropa
- Global
Perilaku default berikut berlaku saat Anda membuat agen dan percakapan:
- Jika semua sumber pengetahuan Anda berasal dari wilayah di Amerika Serikat, maka MREP Amerika Serikat akan digunakan.
- Jika semua sumber pengetahuan Anda berasal dari wilayah di Uni Eropa, maka MREP Uni Eropa akan digunakan.
- Jika tidak, lokasi global akan digunakan.
Saat membuat agen, Anda dapat memilih lokasi lain secara opsional. Setelah menyimpan agen, Anda tidak dapat mengubah lokasinya.
Agen yang dibuat sebelum 4 Juni 2026 berada di lokasi global.
Harga
Anda akan dikenai biaya sesuai dengan harga komputasi BigQuery untuk kueri yang dijalankan saat Anda membuat agen data dan melakukan percakapan dengan agen data atau sumber data. Untuk mengetahui informasi selengkapnya, baca artikel tentang harga agen.
Praktik terbaik
Ikuti praktik terbaik berikut saat Anda menggunakan analisis percakapan:
Lakukan pembersihan data pada tabel Anda sebelum menambahkannya sebagai sumber data.
Gabungkan tabel terkait dalam tampilan dan gunakan tampilan tersebut sebagai sumber data, bukan mengandalkan agen untuk menentukan cara yang tepat untuk menggabungkan data Anda.
Jalankan pemindaian profil pada data Anda.
Tentukan cakupan agen Anda. Agen dengan cakupan luas dapat mengalami konflik petunjuk, output yang ambigu, dan performa yang tidak konsisten. Jika agen Anda memerlukan lebih dari 20 sumber data, digunakan di seluruh tim yang memiliki definisi metrik yang berbeda, atau memprioritaskan satu jenis hasil dengan mengorbankan jenis hasil lainnya, pertimbangkan untuk membuat agen tambahan.
Berikan konteks kepada agen Anda. Prioritaskan jenis konteks dengan cara berikut:
- Kueri terverifikasi. SQL deterministik yang dijalankan saat cocok dengan perintah pengguna.
- Glosarium. Definisi istilah yang menautkan kolom ke konteks semantik.
- Petunjuk agen. Aturan dan definisi perilaku global yang ditulis menggunakan bahasa alami, seperti definisi kalender fiskal atau aturan pemformatan.
Tambahkan deskripsi tabel dan kolom ke tabel Anda.
Jangan menduplikasi definisi glosarium di Knowledge Catalog dan glosarium kustom BigQuery.
Tetapkan batas pembelanjaan level project, level pengguna, dan level kueri untuk mengelola biaya agen Anda.
Ajukan pertanyaan yang efektif dalam percakapan Anda.
Pahami cara kerja retensi dan penghapusan data untuk agen data dan percakapan.
Batasan
Untuk mengetahui informasi selengkapnya tentang batasan pada kueri, percakapan, data, dan visualisasi, lihat Batasan umum Conversational Analytics API.
Kuota bersama dinamis
Kuota Bersama Dinamis (DSQ) di Gemini Enterprise Agent Platform mengelola kapasitas untuk model Gemini. Tidak seperti kuota konvensional, DSQ memungkinkan Anda mengakses kumpulan resource bersama yang besar tanpa batas per project tetap untuk throughput model.
Performa, seperti latensi, dapat bervariasi bergantung pada beban sistem secara keseluruhan. Selama waktu permintaan tinggi di seluruh kumpulan bersama, Anda mungkin sesekali mengalami error 429 Resource Exhausted sementara. Error ini menunjukkan bahwa kapasitas kumpulan bersama dibatasi untuk sementara, tetapi bukan berarti Anda telah mencapai batas kuota tertentu di project Anda. Untuk memeriksa kapasitas, coba lagi permintaan setelah beberapa saat.
Mengidentifikasi dan menganalisis kueri yang dibuat agen
Tugas BigQuery yang dijalankan oleh agen data mencakup label tertentu. Dengan label ini, Anda dapat mengidentifikasi, memfilter, dan menganalisis tugas agen.
Anda dapat menggunakan label ini untuk tugas berikut:
- Memfilter laporan penagihan menurut label untuk memahami biaya agen.
- Mengaudit aktivitas agen.
- Menganalisis performa kueri.
Mengidentifikasi label agen data di konsol Google Cloud
BigQuery menerapkan label ke tugas yang dijalankan oleh agen data. Untuk mendapatkan kunci label untuk pemfilteran dan analisis lainnya, lihat kunci label di Google Cloud konsol.
Untuk melihat kunci label agen data, ikuti langkah-langkah berikut:
Di konsol Google Cloud , lihat detail tugas.
Di panel Detail tugas kueri, temukan bagian Label dan cari label yang diawali dengan
ca, sepertica-bq-job: true.
Menganalisis tugas yang dibuat agen
Gunakan label untuk menganalisis tugas yang dihasilkan agen. Misalnya, untuk memeriksa jumlah tugas yang dijalankan oleh agen data, jalankan kueri berikut terhadap tampilan INFORMATION_SCHEMA.JOBS:
SELECT
COUNT(*) AS job_count
FROM
`PROJECT_ID`.`region-REGION`.INFORMATION_SCHEMA.JOBS
WHERE
EXISTS (
SELECT 1
FROM UNNEST(labels) AS label
WHERE label.key = 'ca-bq-job' AND label.value = 'true'
);
Ganti kode berikut:
PROJECT_ID: Google Cloud Project ID Anda.REGION: region tempat tugas Anda berjalan (misalnya,usataueu).
Langkah berikutnya
- Pelajari lebih lanjut Conversational Analytics API.
- Buat agen data.
- Menganalisis data dengan percakapan.
- Menggunakan Analytics percakapan dengan Lakehouse
- Pelajari cara memfilter resource menggunakan label.