En esta página, se describe cómo Memorystore para Valkey admite el almacenamiento y la consulta de datos de vectores para aplicaciones de IA generativa, como la generación mejorada por recuperación (RAG) y LangChain, a través de las capacidades de búsqueda de vectores.
Usa la búsqueda de vectores para la IA generativa con LangChain
La búsqueda de vectores en Memorystore para Valkey es compatible con el framework de LLM de código abierto LangChain. Usar la búsqueda de vectores con LangChain te permite crear soluciones para los siguientes casos de uso:
- RAG
- Caché de LLM
- Motor de recomendaciones
- Búsqueda semántica
- Búsqueda de imágenes similares
Beneficios de la búsqueda de vectores para la IA generativa en Memorystore for Valkey
La ventaja de usar Memorystore para almacenar tus datos de IA generativa, en comparación con otras bases de datos Google Cloud , es su velocidad. La búsqueda de vectores en Memorystore para Valkey aprovecha las consultas de subprocesos múltiples, lo que genera una alta capacidad de procesamiento de consultas (QPS) con baja latencia.
Enfoques para usar la búsqueda vectorial para la IA generativa en Memorystore para Valkey
Memorystore también proporciona dos enfoques de búsqueda distintos para ayudarte a encontrar el equilibrio adecuado entre velocidad y precisión. La opción de mundo pequeño navegable jerárquico (HNSW) ofrece resultados rápidos y aproximados, ideal para grandes conjuntos de datos en los que una coincidencia cercana es suficiente. Si necesitas precisión absoluta, el enfoque de FLAT produce respuestas exactas, aunque el procesamiento puede tardar un poco más.
Si deseas optimizar tu aplicación para obtener las velocidades de lectura y escritura de datos vectoriales más rápidas, es probable que Memorystore para Valkey sea la mejor opción para ti.