Cette page décrit la version 17.5.0 d'AlloyDB Omni à l'aide de l'option de déploiement Kubernetes. Choisissez une autre option de déploiement.

Bonnes pratiques pour ajuster les index ScaNN

Sélectionnez une version de la documentation :

Cette page fournit des recommandations sur la façon d'ajuster les paramètres d'index AlloyDB Omni pour obtenir un équilibre optimal entre le rappel et les RPS. Les paramètres recommandés pour l'index ScaNN (Scalable Approximate Nearest Neighbor) diffèrent selon que vous choisissez de créer un index arborescent à deux ou trois niveaux.

Création d'index ScaNN

Pour en savoir plus, consultez la documentation de référence sur l'index ScaNN.

Index arborescent à deux niveaux

Pour appliquer des recommandations qui vous aideront à trouver les valeurs optimales de num_leaves et num_leaves_to_search pour votre ensemble de données, suivez les étapes recommandées ci-dessous :

Pour créer l'index ScaNN optimisé pour les cas suivants, définissez le paramètre num_leaves sur la valeur suivante, où "rows" correspond au nombre de lignes dans la table indexée :
- balanced index build time and quality défini sur num_leaves = sqrt(rows).
- quality définit num_leaves sur rows/100.
Exécutez vos requêtes de test en augmentant la valeur de scann.num_of_leaves_to_search jusqu'à ce que vous atteigniez la plage de rappel cible (par exemple, 95 %). Pour en savoir plus sur l'analyse de vos requêtes, consultez Analyser vos requêtes.
Notez le ratio entre scann.num_leaves_to_search et num_leaves, qui sera utilisé dans les étapes suivantes. Ce ratio fournit une approximation de l'ensemble de données qui vous aidera à atteindre le rappel cible.

Si vous travaillez avec des vecteurs de grande dimension (500 dimensions ou plus) et que vous souhaitez améliorer le rappel, essayez d'ajuster la valeur de scann.pre_reordering_num_neighbors. La valeur par défaut est définie sur 500 * K, où K correspond à la limite que vous avez définie dans votre requête.
Si votre RPS est trop faible après que vos requêtes ont atteint un rappel cible, procédez comme suit :
1. Recréez l'index en augmentant la valeur de num_leaves et scann.num_leaves_to_search en suivant les conseils ci-dessous :
  - Définissez num_leaves sur un facteur plus élevé de la racine carrée du nombre de lignes. Par exemple, si l'index a num_leaves défini sur la racine carrée du nombre de lignes, essayez de le définir sur le double de la racine carrée. Si la valeur est déjà doublée, essayez de la tripler.
  - Augmentez scann.num_leaves_to_search si nécessaire pour maintenir son ratio avec num_leaves, que vous avez noté à l'étape 3.
  - Définissez num_leaves sur une valeur inférieure ou égale au nombre de lignes divisé par 100.
2. Exécutez à nouveau les requêtes de test. Pendant que vous exécutez les requêtes de test, essayez de réduire scann.num_leaves_to_search pour trouver une valeur qui augmente le RPS tout en conservant un rappel élevé. Essayez différentes valeurs de scann.num_leaves_to_search sans reconstruire l'index.
Répétez l'étape 4 jusqu'à ce que la RPS et la plage de rappel aient atteint des valeurs acceptables.

Index arborescent à trois niveaux

En plus des recommandations pour l'index ScaNN de l'arborescence à deux niveaux, suivez les conseils ci-dessous.

Pour appliquer des recommandations afin de trouver la valeur optimale des paramètres d'index num_leaves et max_num_levels, procédez comme suit :

Créez l'index ScaNN avec les combinaisons num_leaves et max_num_levels suivantes en fonction de vos objectifs de performances :
- Équilibrer le temps de compilation et la qualité de l'index : définissez max_num_levels sur 2 et num_leaves sur power(rows, ⅔).
- Optimiser pour la qualité : définissez max_num_levels sur 2 et num_leaves sur rows/100.
Exécutez vos requêtes de test. Pour en savoir plus sur l'analyse des requêtes, consultez Analyser vos requêtes.
Notez le ratio entre scann.num_leaves_to_search et num_leaves, car vous en aurez besoin dans les étapes suivantes. Ce ratio fournit une approximation de l'ensemble de données qui vous aidera à atteindre votre rappel cible.

Si vous travaillez avec des vecteurs de grande dimension (500 dimensions ou plus) et que vous souhaitez améliorer le rappel, essayez d'ajuster la valeur de scann.pre_reordering_num_neighbors. La valeur par défaut est définie sur 500 * K, où K correspond à la limite que vous avez définie dans votre requête.

Si votre RPS est trop faible une fois que vos requêtes ont atteint un rappel cible, procédez comme suit :
- Recréez l'index en augmentant la valeur de num_leaves et scann.num_leaves_to_search en suivant les conseils ci-dessous :
- Définissez num_leaves sur un facteur plus élevé de power(rows, ⅔). Par exemple, si l'index est défini sur num_leaves pour power(rows, ⅔), essayez de le définir sur le double de power(rows, ⅔). Si la valeur est déjà doublée, essayez de la tripler.power(rows, ⅔)
- Augmentez scann.num_leaves_to_search si nécessaire pour maintenir son ratio avec num_leaves, que vous avez noté à l'étape 3.
- Définissez une valeur inférieure ou égale à rows/100 pour num_leaves.
- Exécutez à nouveau les requêtes de test. Pendant que vous exécutez les requêtes de test, essayez de réduire scann.num_leaves_to_search pour trouver une valeur qui augmente le RPS tout en conservant un rappel élevé. Essayez différentes valeurs de scann.num_leaves_to_search sans reconstruire l'index.
Répétez l'étape 4 jusqu'à ce que la RPS et la plage de rappel aient atteint des valeurs acceptables.

Maintenance des index

Si votre table est sujette à des mises à jour ou des insertions fréquentes, nous vous recommandons de réindexer régulièrement l'index ScaNN existant afin d'améliorer la précision du rappel. Vous pouvez surveiller les métriques d'index pour afficher les modifications apportées aux distributions de vecteurs ou aux mutations de vecteurs depuis la création de l'index, puis réindexer en conséquence. Pour en savoir plus sur les métriques, consultez Métriques d'index vectoriel.

Étapes suivantes

Faites vos premiers pas avec les embeddings vectoriels à l'aide d'AlloyDB AI.

Bonnes pratiques pour ajuster les index ScaNN Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.