Esta página descreve como o Memorystore for Redis Cluster oferece suporte ao armazenamento e à consulta de dados vetoriais para aplicativos de IA generativa, como a geração aumentada por recuperação (RAG, na sigla em inglês) e o LangChain, usando recursos de pesquisa vetorial.
Usar a pesquisa vetorial para IA generativa com o LangChain
A pesquisa vetorial no Memorystore para Redis Cluster é compatível com o framework de LLM de código aberto LangChain. O uso da pesquisa vetorial com o LangChain permite criar soluções para os seguintes casos de uso:
- RAG
- Cache de LLM
- Mecanismo de recomendação
- Pesquisa semântica
- Pesquisa de similaridade de imagens
Benefícios da pesquisa vetorial para IA generativa no Memorystore para Redis Cluster
A vantagem de usar o Memorystore para armazenar dados de IA generativa , em comparação com outros bancos de dados Google Cloud , é a velocidade. A pesquisa vetorial no Memorystore para Redis Cluster aproveita consultas multithread, resultando em alta taxa de transferência de consultas (QPS) com baixa latência.
Abordagens para usar a pesquisa vetorial para IA generativa no Memorystore para Redis Cluster
O Memorystore também oferece duas abordagens de pesquisa distintas para ajudar você a encontrar o equilíbrio certo entre velocidade e precisão. A opção Hierarchical Navigable Small World (HNSW) oferece resultados rápidos e aproximados, ideal para grandes conjuntos de dados em que uma correspondência próxima é suficiente. Se você precisar de precisão absoluta, a abordagem FLAT produz respostas exatas, embora possa levar um pouco mais de tempo para processar.
Se você quiser otimizar seu aplicativo para as velocidades de leitura e gravação de dados vetoriais mais rápidas, o Memorystore para Redis Cluster provavelmente será a melhor opção.