En esta página se describe cómo Memorystore para Valkey admite el almacenamiento y las consultas de datos vectoriales para aplicaciones de IA generativa, como la generación aumentada por recuperación (RAG) y LangChain, mediante el uso de las funciones de búsqueda vectorial.
Usar la búsqueda vectorial para la IA generativa con LangChain
La búsqueda vectorial en Memorystore para Valkey es compatible con el framework de LLM de código abierto LangChain. Si usas la búsqueda vectorial con LangChain, puedes crear soluciones para los siguientes casos prácticos:
- RAG
- Caché de LLM
- Motor de recomendaciones
- Búsqueda semántica
- Búsqueda de imágenes similares
Ventajas de la búsqueda vectorial para la IA generativa en Memorystore for Valkey
La ventaja de usar Memorystore para almacenar tus datos de IA generativa en comparación con otras bases de datos es su velocidad. Google Cloud La búsqueda vectorial en Memorystore para Valkey aprovecha las consultas multihilo, lo que da como resultado un alto rendimiento de consultas (QPS) con una latencia baja.
Métodos para usar la búsqueda vectorial en la IA generativa en Memorystore for Valkey
Memorystore también ofrece dos enfoques de búsqueda distintos para ayudarte a encontrar el equilibrio adecuado entre velocidad y precisión. La opción Hierarchical
Navigable Small World (HNSW) ofrece resultados rápidos y aproximados, ideales
para conjuntos de datos grandes en los que una coincidencia cercana es suficiente. Si necesitas una precisión absoluta, el enfoque FLAT ofrece respuestas exactas, aunque puede que tarde un poco más en procesarse.
Si quieres optimizar tu aplicación para que tenga las velocidades de lectura y escritura de datos vectoriales más rápidas, Memorystore for Valkey es probablemente la mejor opción para ti.