Arsitektur dan konsep utama Conversational Analytics API

Dokumen ini menjelaskan konsep utama untuk menggunakan Conversational Analytics API (geminidataanalytics.googleapis.com), yang memungkinkan Anda membuat dan berinteraksi dengan agen data yang menggunakan natural language untuk menjawab pertanyaan tentang data terstruktur Anda. Dokumen ini menjelaskan arsitektur agen, alur kerja umum, mode percakapan, peran Identity and Access Management (IAM), dan desain sistem multi-agen.

Cara kerja agen data

Agen data Conversational Analytics API menggunakan konteks (informasi dan data bisnis), yang Anda berikan, dan alat (seperti SQL dan Python) untuk menafsirkan pertanyaan natural language dan membuat respons dari data terstruktur Anda.

Diagram berikut mengilustrasikan tahapan alur kerja agen saat pengguna mengajukan pertanyaan:

Diagram arsitektur Conversational Analytics API, yang menunjukkan alur dari input pengguna melalui mesin penalaran, hingga output akhir.

Seperti yang ditunjukkan dalam diagram, saat pengguna mengajukan pertanyaan, agen akan memproses permintaan dalam tahapan berikut:

  1. Input: Pengguna mengirimkan pertanyaan dalam natural language, beserta konteks tambahan yang Anda berikan sebelumnya.
  2. Sumber data: Agen terhubung ke data Anda di Looker, BigQuery, dan Looker Studio untuk kemampuan chat. Agen juga dapat mengkueri data dari database AlloyDB, GoogleSQL untuk Spanner, Cloud SQL untuk MySQL, dan Cloud SQL untuk PostgreSQL menggunakan metode QueryData.
  3. Mesin penalaran: Inti agen memproses pertanyaan pengguna menggunakan alat yang tersedia untuk membuat jawaban.
  4. Output: Agen menampilkan aliran pesan, yang dapat berisi teks, data, atau diagram. Untuk beberapa sumber data, pesan teks memberikan insight langkah demi langkah tentang penalaran agen, melaporkan progres tindakan, atau memberikan jawaban akhir atas kueri Anda.

Alur kerja untuk mendesain dan menggunakan agen

Conversational Analytics API mendukung alur kerja untuk pembuat agen (yang membangun dan mengonfigurasi agen) dan untuk konsumen agen (yang berinteraksi dengan agen yang ada).

Diagram berikut mengilustrasikan proses menyeluruh, dari penyiapan awal oleh pembuat agen hingga interaksi akhir dengan konsumen agen:

Alur kerja end-to-end untuk desain dan penggunaan agen, mulai dari tugas kreator seperti membuat dan membagikan hingga tugas pengguna data seperti berinteraksi dengan agen.

Bagian berikut menjelaskan alur kerja untuk pembuat agen dan konsumen agen secara lebih mendetail.

Alur kerja pembuat agen

Pembuat agen bertanggung jawab untuk menyiapkan dan mengonfigurasi agen. Alur kerja ini melibatkan langkah-langkah berikut:

  1. Membuat agen: Pembuat memulai dengan membuat agen baru dan memberikan konteks yang diperlukan, termasuk petunjuk sistem dan koneksi ke sumber data. Langkah ini sangat penting untuk memungkinkan agen memahami dan menjawab pertanyaan pengguna secara efektif.
  2. Membagikan agen: Setelah agen dikonfigurasi, pembuat membagikannya kepada pengguna lain dan menetapkan kontrol akses berbasis peran yang sesuai untuk mengelola izin.

Alur kerja konsumen agen

Konsumen agen biasanya adalah pengguna bisnis yang perlu mendapatkan jawaban dari agen yang dikonfigurasi. Alur kerja ini melibatkan langkah-langkah berikut:

  1. Menemukan agen: Pengguna memulai dengan menemukan agen yang telah dibagikan kepadanya.
  2. Mengajukan pertanyaan: Pengguna mengajukan pertanyaan dalam natural language. Pertanyaan ini dapat berupa satu kueri atau bagian dari percakapan multi-giliran.
  3. Agen "berpikir": Mesin penalaran agen memproses pertanyaan. Mesin penalaran menggunakan pengetahuan yang telah ditentukan sebelumnya dan alat agen yang tersedia (seperti SQL, Python, dan diagram) dalam "reasoning loop" untuk menentukan cara terbaik menjawab pertanyaan.
  4. Agen merespons: Agen menampilkan aliran pesan, yang dapat berisi teks, data, atau diagram. Untuk beberapa sumber data, pesan teks memberikan insight langkah demi langkah tentang penalaran agen, melaporkan progres tindakan, atau memberikan jawaban akhir atas kueri Anda.

Mode percakapan

Agen Conversational Analytics API mendukung mode percakapan yang berbeda yang menentukan cara agen menangani histori percakapan dan persistensi konteks di seluruh interaksi. Mode percakapan berikut tersedia:

  • Mode tanpa status: Agen tidak menyimpan histori percakapan. Setiap interaksi diperlakukan secara independen. Mode ini berguna untuk aplikasi yang tidak memerlukan Anda untuk mempertahankan konteks di beberapa giliran.
  • Mode dengan status: Agen mempertahankan konteks dan histori percakapan, sehingga memungkinkan interaksi yang lebih kontekstual. Mode ini berguna untuk aplikasi yang memerlukan Anda untuk mempertahankan konteks di beberapa giliran. Sebaiknya gunakan mode dengan status untuk akurasi yang lebih baik dan respons yang dipersonalisasi.

Pilih mode percakapan berdasarkan persyaratan aplikasi Anda untuk histori percakapan dan persistensi konteks.

Berbagai mode chat untuk agen Conversational Analytics API.

Peran IAM

Peran IAM mengontrol siapa yang dapat membuat, mengelola, membagikan, dan berinteraksi dengan agen Conversational Analytics API. Tabel berikut menjelaskan peran IAM utama untuk Conversational Analytics API:

Peran Cakupan umum Hal yang diaktifkan oleh peran Siapa yang dapat menggunakan peran ini
Pembuat Agen Data Gemini Data Analytics (roles/geminidataanalytics.dataAgentCreator) Project Membuat agen dan mewarisi izin pemilik pada agen. Analis data
Pemilik Agen Data Gemini Data Analytics (roles/geminidataanalytics.dataAgentOwner) Project, Agen Mengedit, membagikan, atau menghapus agen dengan pengguna lain. Analis data senior
Editor Agen Data Gemini Data Analytics (roles/geminidataanalytics.dataAgentEditor) Agen, Project Memperbarui konfigurasi atau konteks agen. Analis data junior
Pengguna Agen Data Gemini Data Analytics (roles/geminidataanalytics.dataAgentUser) Agen, Project Chat dengan agen. Pemasar, pemilik toko
Penampil Agen Data Gemini Data Analytics (roles/geminidataanalytics.dataAgentViewer) Project, Agen Mencantumkan agen dan mendapatkan detailnya. Anda tidak dapat mengedit agen. Semua pengguna
Pengguna Kueri Data Gemini Data Analytics (roles/geminidataanalytics.queryDataUser) Project Mengkueri data dari sumber database yang didukung menggunakan metode QueryData. Developer aplikasi, Analis data
Pengguna Chat Tanpa Status Gemini Data Analytics (roles/geminidataanalytics.dataAgentStatelessUser) Project Chat dengan agen tanpa penyimpanan konteks atau histori percakapan. Semua pengguna

Sistem dengan beberapa agen

Anda dapat mendesain sistem yang kompleks dengan mengintegrasikan beberapa agen Conversational Analytics API. Pola umumnya adalah menggunakan agen "pengatur" utama yang mendelegasikan tugas ke satu atau beberapa agen khusus yang menangani domain tertentu, seperti data penjualan atau pemasaran. Pendekatan ini memungkinkan Anda membangun sistem yang dapat menangani berbagai pertanyaan dengan menggabungkan kekuatan beberapa agen.

Diagram berikut mengilustrasikan pola multi-agen ini dan menunjukkan cara agen utama dapat mendelegasikan pertanyaan data ke agen Conversational Analytics khusus:

Agen orkestrator utama mendelegasikan pertanyaan data ke agen penjualan khusus, yang kemudian memberikan jawaban kepada pengguna.

Alur kerja umum untuk sistem multi-agen melibatkan langkah-langkah berikut:

  1. Pengguna bisnis atau analis data mengajukan pertanyaan dalam natural language, seperti "Tampilkan tiga toko teratas berdasarkan pendapatan".
  2. Agen "pengatur" utama mendelegasikan permintaan ke agen khusus yang sesuai.
  3. Agen khusus menerima permintaan yang didelegasikan, terhubung ke sumber data yang relevan, menggunakan alatnya untuk membuat kueri dan diagram SQL yang diperlukan, serta membuat respons.
  4. Respons agen khusus ditampilkan kepada pengguna, seperti "Toko 4, 9, dan 3 memiliki pendapatan tertinggi. Berikut diagramnya".

Langkah berikutnya

Setelah memahami konsep inti Conversational Analytics API, pelajari cara menerapkan fitur ini: