Pemantauan online memungkinkan Anda terus menilai kualitas agen dalam produksi. Pendekatan proaktif ini membantu Anda mengidentifikasi penyimpangan kualitas—penurunan performa agen yang dapat diamati seiring waktu—yang disebabkan oleh perubahan perilaku pengguna atau data eksternal. Dengan mengonfigurasi Monitor Online, Anda dapat memberi skor pada rekaman aktivitas live secara asinkron menggunakan metrik standar dan kustom, sehingga memastikan agen Anda tetap andal dan sesuai dengan standar performa Anda.
Sebelum memulai
Untuk mengaktifkan pemantauan online bagi agen Anda, pastikan persyaratan berikut terpenuhi:
- Deploy agen Anda seperti yang dijelaskan dalam Men-deploy agen.
- Pastikan Cloud Trace diaktifkan untuk project Anda.
- (Opsional) Jika Anda berencana membuat monitor secara terprogram, lihat halaman Mengevaluasi agen untuk mengetahui petunjuk inisialisasi Agent Platform SDK.
Persyaratan telemetri
Pemantauan online mengharuskan agen Anda mengekspor sinyal OpenTelemetry tertentu untuk memberikan konteks yang diperlukan untuk evaluasi:
Rentang pemanggilan agen: Harus menyertakan atribut berikut:
gen_ai.agent.name: ID untuk agen.gen_ai.agent.description: Deskripsi singkat tentang tujuan agen.gen_ai.conversation.id: ID unik untuk sesi percakapan tertentu.
Peristiwa inferensi: Peristiwa
gen_ai.client.inference.operation.detailsharus merekam:gen_ai.input.messages: Perintah yang dikirim ke agen.gen_ai.output.messages: Respons yang dihasilkan oleh agen.gen_ai.system_instructions: Perintah sistem yang mendasarinya.gen_ai.tool.definitions: Metadata tentang alat apa pun yang tersedia untuk agen.
Jika Anda menggunakan Agent Development Kit, Anda harus mengaktifkan kemampuan telemetri ini dengan menetapkan variabel lingkungan berikut:
OTEL_SEMCONV_STABILITY_OPT_IN='gen_ai_latest_experimental'
OTEL_INSTRUMENTATION_GENAI_CAPTURE_MESSAGE_CONTENT='EVENT_ONLY'
Merekam media di Cloud Storage
Jika agen Anda menggunakan data multimodal, seperti gambar atau dokumen besar, sebaiknya rekam input dan output dalam bucket Cloud Storage, bukan menyematkannya langsung dalam rentang rekaman aktivitas. Konfigurasi variabel lingkungan berikut untuk mengaktifkannya:
OTEL_INSTRUMENTATION_GENAI_UPLOAD_FORMAT='jsonl'
OTEL_INSTRUMENTATION_GENAI_COMPLETION_HOOK='upload'
OTEL_INSTRUMENTATION_GENAI_UPLOAD_BASE_PATH='gs://STORAGE_BUCKET_NAME/PATH'
Untuk mengetahui informasi selengkapnya, lihat Mengumpulkan perintah dan respons multimodal.
Cara kerja monitor online
Monitor Online berjalan pada loop evaluasi terjadwal, biasanya setiap 10 menit. Loop mengikuti langkah-langkah berikut:
- Kueri: Mengambil sampel data dari Cloud Trace dan Cloud Logging berdasarkan filter Anda.
- Evaluasi: Menjalankan metrik yang dikonfigurasi menggunakan Layanan Evaluasi Platform Agen Gemini Enterprise.
- Pelaporan: Menulis hasil kembali ke Cloud Logging dan mengekspor skor numerik ke Cloud Monitoring.
Membuat monitor online
Di konsol Google Cloud , buka halaman Agent Platform > Agents > Evaluation.
Pilih tab Online monitors, lalu klik New monitor.
Tentukan Rekaman Aktivitas Filter:
- Mesin agen: Pilih agen yang ingin Anda pantau dari dropdown.
- Kriteria filter: Pilih apakah akan mengevaluasi Semua rekaman aktivitas untuk agen atau menerapkan Kriteria filter tertentu.
Tentukan Kriteria Filter (jika menggunakan rekaman aktivitas yang difilter):
- Pemeriksaan Awal: Pilih jangka waktu (misalnya, 1 hari terakhir) untuk melihat pratinjau rekaman aktivitas produksi yang cocok dengan filter Anda.
- Filter: Masukkan kriteria untuk menargetkan traffic tertentu. Anda dapat memfilter menurut
properti seperti
Duration(misalnya,Duration > 2) atauToken usage.
Konfigurasi Metrik: Tambahkan metrik yang ingin Anda lacak secara berkelanjutan, seperti Keamanan.
Menetapkan Pengambilan Sampel:
- Persentase pengambilan sampel: Tentukan persentase traffic live yang harus dievaluasi.
- Sampel maks per proses: Tetapkan batas untuk mengelola biaya evaluasi.
Klik Create.
Mengelola monitor
Setelah membuat pemantau, Anda dapat mengelolanya dari daftar Pemantau online:
- Tombol Status: Klik Opsi lainnya more_vert lalu pilih Aktifkan atau Nonaktifkan untuk menjeda evaluasi tanpa menghapus konfigurasi.
- Jeda dan Lanjutkan: Gunakan Opsi lainnya more_vert untuk menghentikan evaluasi sementara.
- Duplikat: Buat monitor baru dengan setelan yang telah diisi sebelumnya dari monitor yang ada.
- Melihat Rekaman Aktivitas: Klik link Lihat rekaman aktivitas di kolom Rekaman aktivitas yang diambil sampelnya untuk monitor guna langsung membuka rekaman aktivitas yang difilter di tab Rekaman aktivitas agen.
Melihat hasil di dasbor kemampuan pengamatan
Untuk melihat metrik evaluasi bersama sinyal performa lainnya:
- Di konsol Google Cloud , buka halaman Agent Platform > Agents.
- Di menu navigasi kiri, pilih Deployment.
Pilih agen Anda.
Di tampilan Dasbor, pilih subbagian Evaluasi untuk melihat diagram deret waktu untuk metrik yang dikonfigurasi, seperti kualitas respons, keamanan, dan rasio halusinasi.
Memecahkan masalah monitor online
Jika Monitor Online Anda aktif, tetapi tidak ada hasil yang muncul di dasbor:
- Verifikasi Telemetri: Pastikan agen Anda mengekspor rentang dan peristiwa OpenTelemetry yang diperlukan dengan benar. Periksa Cloud Trace untuk melihat apakah live trace berisi atribut
gen_ai.. - Periksa Filter: Tinjau kriteria filter monitor Anda. Gunakan fitur Pemeriksaan Awal untuk mengonfirmasi bahwa filter Anda cocok dengan traffic produksi.
- Periksa Log Internal: Monitor Online menulis informasi diagnostik ke
Cloud Logging. Anda dapat menemukan log ini dengan menelusuri ID monitor di Logs Explorer:
sh resource.type="aiplatform.googleapis.com/OnlineEvaluator" resource.labels.online_evaluator_id="YOUR_MONITOR_ID"