Cette page explique comment Memorystore pour Redis permet de stocker et d'interroger des données vectorielles pour les applications d'IA générative, telles que la génération augmentée par récupération (RAG) et LangChain, à l'aide de fonctionnalités de recherche vectorielle.
Utiliser la recherche vectorielle pour l'IA générative avec LangChain
La recherche vectorielle sur Memorystore pour Redis est compatible avec le framework LLM Open Source LangChain. L'utilisation de la recherche vectorielle avec LangChain vous permet de créer des solutions pour les cas d'utilisation suivants :
- RAG
- Cache LLM
- Moteur de recommandations
- Recherche sémantique
- Recherche de similarités dans les images
Avantages de la recherche vectorielle pour l'IA générative dans Memorystore pour Redis
L'avantage d'utiliser Memorystore pour stocker vos données d'IA générative , par rapport à d'autres bases de données Google Cloud , est sa vitesse. La recherche vectorielle sur Memorystore pour Redis exploite les requêtes multithread, ce qui permet d'obtenir un débit de requêtes élevé (RPS) avec une faible latence.
Approches pour utiliser la recherche vectorielle pour l'IA générative dans Memorystore pour Redis
Memorystore propose également deux approches de recherche distinctes pour vous aider à trouver le juste équilibre entre vitesse et précision. L'option Hierarchical Navigable Small World (HNSW) fournit des résultats rapides et approximatifs. Elle est idéale pour les grands ensembles de données où une correspondance proche suffit. Si vous avez besoin d'une précision absolue, l'approche FLAT produit des réponses exactes, mais le traitement peut prendre un peu plus de temps.
Si vous souhaitez optimiser votre application pour obtenir les vitesses de lecture et d'écriture des données vectorielles les plus rapides, Memorystore pour Redis est probablement la meilleure option pour vous.