Halaman ini menjelaskan cara Memorystore for Redis Cluster mendukung penyimpanan dan pembuatan kueri data vektor untuk aplikasi AI generatif, seperti Retrieval Augmented Generation (RAG) dan LangChain, dengan menggunakan kapabilitas penelusuran vektor.
Menggunakan penelusuran vektor untuk AI generatif dengan LangChain
Penelusuran vektor di Memorystore for Redis Cluster kompatibel dengan framework LLM open source LangChain. Menggunakan penelusuran vektor dengan LangChain memungkinkan Anda membuat solusi untuk kasus penggunaan berikut:
- RAG
- Cache LLM
- Mesin pemberi saran
- Penelusuran semantik
- Penelusuran kemiripan gambar
Manfaat penelusuran vektor untuk AI generatif di Memorystore for Redis Cluster
Keuntungan menggunakan Memorystore untuk menyimpan data AI generatif Anda, dibandingkan dengan database Google Cloud lain, adalah kecepatan nya. Penelusuran vektor di Memorystore for Redis Cluster memanfaatkan kueri multi-thread, sehingga menghasilkan throughput kueri (QPS) yang tinggi dengan latensi rendah.
Pendekatan untuk menggunakan penelusuran vektor untuk AI generatif di Memorystore for Redis Cluster
Memorystore juga menyediakan dua pendekatan penelusuran yang berbeda untuk membantu Anda menemukan keseimbangan yang tepat antara kecepatan dan akurasi. Opsi Hierarchical Navigable Small World (HNSW) memberikan hasil perkiraan yang cepat—cocok untuk set data besar di mana kecocokan terdekat sudah cukup. Jika Anda memerlukan presisi absolut, pendekatan FLAT akan menghasilkan jawaban yang tepat, meskipun mungkin memerlukan waktu yang sedikit lebih lama untuk diproses.
Jika Anda ingin mengoptimalkan aplikasi untuk kecepatan baca dan tulis data vektor tercepat, Memorystore for Redis Cluster mungkin merupakan opsi terbaik untuk Anda.