Pour savoir comment créer des index ScaNN, consultez Créer un index ScaNN.
Limites
Avant de commencer à ajuster vos index ScaNN, tenez compte de la limite suivante :
- Le nombre de
num_leavesest limité à 30 millions.
Avant de commencer
Si vous souhaitez créer un index ScaNN à quatre niveaux, vous devez d'abord activer la fonctionnalité Preview pour votre instance AlloyDB. Pour activer la fonctionnalité d'aperçu, choisissez l'une des deux méthodes suivantes :
Activez le flag de base de données
scann.enable_preview_features.Pour en savoir plus sur la configuration des flags de base de données, consultez Configurer des flags de base de données AlloyDB Omni.
Définissez le flag de base de données
scann.max_allowed_num_levelsau niveau de la session sur3.SET scann.max_allowed_num_levels = 3;
Index arborescent à deux niveaux
Pour appliquer des recommandations qui vous aideront à trouver les valeurs optimales de num_leaves et num_leaves_to_search pour votre ensemble de données, suivez ces étapes recommandées :
- Pour créer l'index
ScaNNoptimisé pour les cas suivants, définissez le paramètrenum_leavessur la valeur suivante, où "rows" correspond au nombre de lignes dans la table indexée :- balanced index build time and quality défini sur
num_leavespoursqrt(rows). - quality définit num_leaves sur rows/100.
- balanced index build time and quality défini sur
- Exécutez vos requêtes de test en augmentant la valeur de
scann.num_of_leaves_to_searchjusqu'à ce que vous atteigniez la plage de rappel cible (par exemple, 95 %). Pour en savoir plus sur l'analyse de vos requêtes, consultez Analyser vos requêtes. - Notez le ratio entre
scann.num_leaves_to_searchetnum_leaves, qui sera utilisé dans les étapes suivantes. Ce ratio fournit une approximation de l'ensemble de données qui vous aidera à atteindre le rappel cible.
Si vous travaillez avec des vecteurs de grande dimension (500 dimensions ou plus) et que vous souhaitez améliorer le rappel, essayez d'ajuster la valeur descann.pre_reordering_num_neighbors. La valeur par défaut est définie sur50 * K, oùKcorrespond à la limite que vous avez définie dans votre requête. - Si votre RPS est trop faible une fois que vos requêtes ont atteint un rappel cible, procédez comme suit :
- Recréez l'index en augmentant la valeur de
num_leavesetscann.num_leaves_to_searchen suivant les conseils ci-dessous :- Définissez
num_leavessur un facteur plus élevé de la racine carrée du nombre de lignes. Par exemple, si l'index anum_leavesdéfini sur la racine carrée du nombre de lignes, essayez de le définir sur le double de la racine carrée. Si la valeur est déjà double, essayez de la définir sur le triple de la racine carrée. - Augmentez
scann.num_leaves_to_searchsi nécessaire pour maintenir son ratio avecnum_leaves, que vous avez noté à l'étape 3. - Définissez
num_leavessur une valeur inférieure ou égale au nombre de lignes divisé par 100.
- Définissez
- Exécutez à nouveau les requêtes de test.
Pendant que vous exécutez les requêtes de test, essayez de réduire
scann.num_leaves_to_searchpour trouver une valeur qui augmente le RPS tout en conservant un rappel élevé. Essayez différentes valeurs descann.num_leaves_to_searchsans reconstruire l'index.
- Recréez l'index en augmentant la valeur de
- Répétez l'étape 4 jusqu'à ce que la RPS et la plage de rappel aient atteint des valeurs acceptables.
Index arborescent à trois niveaux
En plus des recommandations pour l'index ScaNN de l'arborescence à deux niveaux, suivez les conseils ci-dessous.
Pour appliquer des recommandations afin de trouver la valeur optimale des paramètres d'index num_leaves et max_num_levels, procédez comme suit :
Créez l'index
ScaNNavec les combinaisonsnum_leavesetmax_num_levelssuivantes en fonction de vos objectifs de performances :- Équilibrer la durée de la compilation et la qualité de l'index : définissez
max_num_levelssur2etnum_leavessurpower(rows, ⅔). - Optimiser pour la qualité : définissez
max_num_levelssur2etnum_leavessurrows/100.
- Équilibrer la durée de la compilation et la qualité de l'index : définissez
Exécutez vos requêtes de test. Pour en savoir plus sur l'analyse des requêtes, consultez Analyser vos requêtes.
Notez le ratio entre
scann.num_leaves_to_searchetnum_leaves, car vous en aurez besoin dans les étapes suivantes. Ce ratio fournit une approximation de l'ensemble de données qui vous aidera à atteindre votre rappel cible.
Si vous travaillez avec des vecteurs de grande dimension (500 dimensions ou plus) et que vous souhaitez améliorer le rappel, essayez d'ajuster la valeur de scann.pre_reordering_num_neighbors. La valeur par défaut est définie sur 50 * K, où K correspond à la limite que vous avez définie dans votre requête.
Si votre RPS est trop faible une fois que vos requêtes ont atteint un rappel cible, procédez comme suit :
- Recréez l'index en augmentant la valeur de
num_leavesetscann.num_leaves_to_searchen suivant les conseils ci-dessous : - Définissez
num_leavessur un facteur plus élevé depower(rows, ⅔). Par exemple, si l'index est défini surnum_leavespourpower(rows, ⅔), essayez de le définir sur le double depower(rows, ⅔). Si la valeur est déjà le double depower(rows, ⅔), essayez de la définir sur le triple. - Augmentez
scann.num_leaves_to_searchsi nécessaire pour maintenir son ratio avecnum_leaves, que vous avez noté à l'étape 3. - Définissez une valeur inférieure ou égale à
rows/100pournum_leaves. - Exécutez à nouveau les requêtes de test. Pendant que vous exécutez les requêtes de test, essayez de réduire
scann.num_leaves_to_searchpour trouver une valeur qui augmente le RPS tout en conservant un rappel élevé. Essayez différentes valeurs descann.num_leaves_to_searchsans reconstruire l'index.
- Recréez l'index en augmentant la valeur de
Répétez l'étape 4 jusqu'à ce que la RPS et la plage de rappel aient atteint des valeurs acceptables.
Index arborescent à quatre niveaux
En plus des recommandations pour les index arborescents à trois niveaux, suivez les conseils ci-dessous pour trouver la valeur optimale pour num_leaves et max_num_levels :
Créez un index ScaNN avec les combinaisons
num_leavesetmax_num_levelssuivantes en fonction de vos objectifs de performances :Équilibrez la durée de la compilation et la qualité de l'index : définissez
max_num_levelssur3etnum_leavessurpower(ROWS, 3/4).Optimiser pour la qualité : définissez
max_num_levelssur3etnum_leavessurROWS/100.
Exécutez vos requêtes de test. Pour en savoir plus sur l'analyse des requêtes, consultez Analyser vos requêtes.
Notez le ratio entre
scann.num_leaves_to_searchetnum_leaves. Vous utiliserez ce ratio pour atteindre votre rappel cible lors des étapes suivantes.Si vous travaillez avec des vecteurs de grande dimension (500 dimensions ou plus) et que vous souhaitez améliorer le rappel, essayez d'ajuster la valeur de
scann.pre_reordering_num_neighbors.Si vos RPS sont trop faibles après que vos requêtes ont atteint un rappel cible, recréez l'index en augmentant la valeur de
num_leavesetscann.num_leaves_to_searchen suivant les conseils ci-dessous :Définissez
num_leavessur un facteur plus élevé depower(ROWS, 3/4). Par exemple, si l'index anum_leavesdéfini surpower(ROWS, 3/4), essayez de le définir sur le double. Si la valeur est déjà double, essayez de la définir sur triple.Augmentez
scann.num_leaves_to_searchsi nécessaire pour maintenir son ratio avecnum_leaves, que vous avez noté à l'étape 3.Définissez une valeur inférieure ou égale à
ROWS/100pournum_leaves.Exécutez à nouveau les requêtes de test. Lorsque vous exécutez les requêtes de test, essayez de réduire
scann.num_leaves_to_search. Trouvez une valeur qui augmente le RPS tout en conservant un rappel élevé. Essayez différentes valeurs descann.num_leaves_to_searchsans reconstruire l'index.
Répétez l'étape 4 jusqu'à ce que la plage de rappel et les RPS atteignent des valeurs acceptables.
Améliorer le rappel pour les recherches filtrées
Lorsque vous effectuez une recherche vectorielle des k plus proches voisins (KNN) qui inclut un filtre, il peut arriver que la requête renvoie moins de résultats que ceux demandés dans la clause LIMIT. Cela peut entraîner ce que l'on appelle un rappel insuffisant, qui est plus susceptible de se produire lorsque vous utilisez des filtres très sélectifs. Cela se produit parce que les partitions ou feuilles initiales que ScaNN recherche ne contiennent pas suffisamment de vecteurs répondant aux conditions de filtre.
Pour résoudre ce problème, AlloyDB Omni propose une fonctionnalité qui permet à la recherche de s'étendre de manière dynamique au-delà de l'ensemble initial de feuilles afin de trouver suffisamment de résultats correspondants.
Fonctionnement du streaming
Vous pouvez activer la fonctionnalité de streaming en définissant le paramètre scann.satisfy_limit sur relaxed_order. Lorsqu'il est activé, l'analyse vectorielle continue de rechercher des partitions feuilles supplémentaires jusqu'à ce qu'elle trouve suffisamment de résultats pour répondre au LIMIT de votre requête, ce qui améliore le rappel.
Pour éviter qu'une recherche ne se poursuive trop longtemps et pour contrôler l'impact sur les performances, vous pouvez utiliser le paramètre scann.max_pct_leaves_to_search. Ce paramètre sert de protection en définissant une limite supérieure au pourcentage de feuilles totales qu'une requête peut visiter. La valeur par défaut est 15%.
Quand utiliser le streaming ?
Pensez à utiliser la fonctionnalité de streaming dans les cas suivants :
- Vous utilisez des filtres avec vos recherches vectorielles.
- Vous constatez que vos requêtes renvoient moins de résultats que prévu en fonction de votre clause
LIMIT.
En activant scann.satisfy_limit, vous pouvez améliorer le rappel de vos recherches filtrées. Il est également recommandé de configurer scann.max_pct_leaves_to_search pour trouver un équilibre entre le rappel et les performances des requêtes.
Maintenance des index
Si votre table est sujette à des mises à jour ou des insertions fréquentes, nous vous recommandons de réindexer périodiquement l'index ScaNN existant afin d'améliorer la précision du rappel.
Vous pouvez surveiller les métriques d'index pour afficher les modifications apportées aux distributions ou mutations de vecteurs depuis la création de l'index, puis le réindexer en conséquence. Pour en savoir plus sur les métriques, consultez Afficher les métriques d'index vectoriel.