Memory Bank Vertex AI Agent Engine memungkinkan Anda membuat memori jangka panjang secara dinamis berdasarkan percakapan pengguna dengan agen Anda. Memori jangka panjang adalah informasi yang dipersonalisasi yang dapat diakses di beberapa sesi untuk pengguna tertentu. Agen dapat menggunakan memori untuk mempersonalisasi respons kepada pengguna dan menciptakan kesinambungan lintas sesi.
Ringkasan
Bank Memori membantu Anda mengelola memori, sehingga Anda dapat mempersonalisasi cara agen berinteraksi dengan pengguna dan mengelola jendela konteks. Untuk setiap cakupan, Bank Memori mempertahankan kumpulan memori yang terisolasi. Setiap memori adalah informasi mandiri yang independen dan dapat digunakan untuk memperluas konteks yang tersedia bagi agen Anda. Contoh:
{
"name": "projects/.../locations/.../reasoningEngines/.../memories/...",
"scope": {
"agent_name": "My agent"
},
"fact": "I use Memory Bank to manage my memories."
}
Bank Memori mencakup fitur berikut:
Pembuatan memori: Buat, perbaiki, dan kelola memori menggunakan model bahasa besar (LLM).
Ekstraksi Memori: Mengekstrak hanya informasi paling penting dari data sumber untuk dipertahankan sebagai memori.
Konsolidasi Memori: Mengonsolidasi informasi yang baru diekstrak dengan memori yang ada, sehingga memori dapat berkembang seiring dengan penyerapan informasi baru. Anda juga dapat menggabungkan kenangan yang telah diekstrak sebelumnya (seperti informasi yang dianggap penting oleh agen atau manusia dalam loop) dengan kenangan yang ada.
Pembuatan Asinkron: Kenangan dapat dibuat di latar belakang, sehingga agen Anda tidak perlu menunggu hingga pembuatan kenangan selesai.
Ekstraksi yang Dapat Disesuaikan: Konfigurasi informasi yang dianggap penting oleh Bank Memori dengan memberikan topik tertentu dan contoh sedikit tembakan.
Pemahaman Multimodal: Memproses informasi multimodal untuk membuat dan mempertahankan insight tekstual.
Penyimpanan dan Pengambilan Terkelola: Manfaatkan penyimpanan memori yang terkelola sepenuhnya, persisten, dan dapat diakses.
Isolasi data di seluruh identitas: Konsolidasi dan pengambilan memori diisolasi ke identitas tertentu.
Penyimpanan Persisten dan Dapat Diakses: Menyimpan memori yang dapat diakses dari beberapa lingkungan, termasuk Vertex AI Agent Engine Runtime, lingkungan lokal Anda, atau opsi deployment lainnya.
Penelusuran Kemiripan: Mengambil kenangan menggunakan penelusuran kemiripan yang dibatasi ke identitas tertentu.
Masa Berakhir Otomatis: Tetapkan time to live (TTL) pada kenangan untuk memastikan informasi yang sudah tidak berlaku dihapus secara otomatis. Konfigurasi instance Bank Memori Anda sehingga TTL diterapkan secara otomatis ke kenangan yang dimasukkan atau dibuat.
Integrasi agen: Hubungkan Memory Bank ke agen Anda, sehingga agen dapat mengatur panggilan untuk membuat dan mengambil memori.
Integrasi Agent Development Kit (ADK): Atur panggilan dari agen berbasis ADK Anda menggunakan alat ADK bawaan dan
VertexAiMemoryBankService
untuk membaca dan menulis ke Memory Bank.Framework lain: Bungkus kode Bank Memori Anda dalam alat dan callback untuk mengatur pembuatan dan pengambilan memori.
Kasus penggunaan
Anda dapat menggunakan Memory Bank untuk mengubah interaksi agen stateless menjadi pengalaman kontekstual dan stateful di mana agen mengingat, mempelajari, dan beradaptasi dari waktu ke waktu. Bank Memori ideal untuk aplikasi yang memerlukan:
Personalisasi Jangka Panjang: Buat pengalaman yang disesuaikan dengan setiap pengguna. Memory Bank mencakup memori ke identitas tertentu, sehingga memungkinkan agen mengingat preferensi, histori, dan detail penting pengguna di beberapa sesi.
- Contoh: Agen layanan pelanggan yang mengingat informasi penting dari tiket dukungan dan preferensi produk pengguna sebelumnya tanpa perlu bertanya lagi.
Ekstraksi Pengetahuan yang didukung LLM: Gunakan saat Anda perlu mengidentifikasi dan mempertahankan informasi terpenting dari percakapan atau konten multimodal secara otomatis tanpa intervensi manual.
- Contoh: Agen riset yang membaca serangkaian makalah teknis dan membangun memori gabungan dari temuan, metodologi, dan kesimpulan utama.
Konteks Dinamis & Berkembang: Gunakan Bank Memori saat Anda memerlukan sumber pengetahuan yang tidak statis. Memory Bank dirancang untuk terus mengintegrasikan informasi baru dari agen Anda, menyempurnakan dan memperbarui memori yang tersimpan saat data baru tersedia. Hal ini memastikan konteks yang digunakan agen Anda selalu terbaru dan akurat. Sementara RAG memiliki pusat informasi eksternal yang statis, Memory Bank dapat berkembang berdasarkan konteks yang diberikan oleh agen.
Contoh penggunaan
Anda dapat menggunakan Memory Bank dengan Sesi Agent Engine Vertex AI untuk membuat kenangan dari sesi tersimpan menggunakan proses berikut:
(Sesi)
CreateSession
: Di awal setiap percakapan, buat sesi baru. Histori percakapan yang digunakan oleh agen dicakup ke sesi ini. Sesi berisi urutan kronologis pesan dan tindakan (SessionEvents
) untuk interaksi antara pengguna dan agen Anda. Semua sesi harus memiliki ID pengguna; kenangan yang diekstrak (lihatGenerateMemories
) untuk sesi ini dipetakan ke pengguna ini.(Sesi)
AppendEvent
: Saat pengguna berinteraksi dengan agen, peristiwa (seperti pesan pengguna, respons agen, tindakan alat) diupload ke Sesi. Peristiwa ini mempertahankan histori percakapan dan membuat catatan percakapan yang dapat digunakan untuk menghasilkan memori.(Sesi)
ListEvents
: Saat pengguna berinteraksi dengan agen, agen akan mengambil histori percakapan.(Bank Memori) Membuat atau menghasilkan kenangan:
GenerateMemories
: Pada interval tertentu (seperti di akhir setiap sesi atau di akhir setiap giliran), agen dapat memicu pembuatan memori menggunakan histori percakapan. Fakta tentang pengguna diekstrak secara otomatis dari histori percakapan sehingga tersedia untuk sesi saat ini atau mendatang.CreateMemory
: Agen Anda dapat menulis kenangan langsung ke Bank Memori. Misalnya, agen dapat memutuskan kapan memori harus ditulis dan informasi apa yang harus disimpan (memori sebagai alat). GunakanCreateMemory
jika Anda ingin agen Anda memiliki lebih banyak kontrol atas fakta yang diekstrak.
(Bank Memori)
RetrieveMemories
: Saat pengguna berinteraksi dengan agen Anda, agen dapat mengambil memori yang disimpan tentang pengguna tersebut. Anda dapat mengambil semua kenangan (pengambilan sederhana) atau hanya kenangan yang paling relevan dengan percakapan saat ini (pengambilan penelusuran kesamaan). Kemudian, Anda dapat menyisipkan kenangan yang diambil ke dalam perintah Anda.
Panduan Memulai
Mulai menggunakan Memory Bank dengan panduan memulai berikut:
Panduan memulai menggunakan REST API: Ikuti panduan memulai REST API untuk melakukan panggilan API langsung ke Sesi Vertex AI Agent Engine dan Bank Memori.
Panduan memulai menggunakan Agent Development Kit (ADK): Ikuti panduan memulai Agent Development Kit (ADK) jika Anda ingin agen ADK mengatur panggilan ke Sesi Vertex AI Agent Engine dan Memory Bank untuk Anda.
Risiko keamanan injeksi perintah
Selain tanggung jawab keamanan yang diuraikan dalam Tanggung jawab bersama Vertex AI, pertimbangkan risiko injeksi perintah dan peracunan memori yang dapat memengaruhi agen Anda saat menggunakan memori jangka panjang. Keracunan memori terjadi saat informasi palsu disimpan di Bank Memori. Kemudian, agen dapat beroperasi pada informasi palsu atau berbahaya ini dalam sesi mendatang.
Untuk mengurangi risiko keracunan memori, Anda dapat melakukan hal berikut:
Model Armor: Gunakan Model Armor untuk memeriksa perintah yang dikirim ke Memory Bank atau dari agen Anda.
Pengujian adversarial: Uji aplikasi LLM Anda secara proaktif untuk mengetahui kerentanan injeksi perintah dengan menyimulasikan serangan. Hal ini biasanya dikenal sebagai "red teaming".
Eksekusi sandbox: Jika agen memiliki kemampuan untuk mengeksekusi atau berinteraksi dengan sistem eksternal atau penting, tindakan ini harus dilakukan di lingkungan sandbox dengan kontrol akses yang ketat dan peninjauan manual.
Untuk mengetahui informasi selengkapnya, lihat Pendekatan Google untuk Agen AI yang Aman.
Langkah berikutnya
- Siapkan Bank Memori.
- Mulai cepat dengan Agent Development Kit.
- Mulai cepat dengan Vertex AI Agent Engine SDK.