Pour accéder à un tutoriel pas-à-pas sur l'implémentation de la recherche vectorielle de bout en bout, consultez le guide sur la façon d'effectuer une recherche vectorielle.
Paramètres de réglage
Les paramètres d'index et de requête suivants sont utilisés pour trouver le bon équilibre entre rappel et requêtes par seconde (RPS).
| Paramètre de réglage | Description | Type d'option |
|---|---|---|
mode |
Définit l'index ScaNN comme un index réglé automatiquement ou manuellement
index. Les options disponibles sont les suivantes :
Pour en savoir plus, consultez Créer un index ScaNN. |
Création d'index (facultatif) |
max_num_levels |
Nombre maximal de niveaux de centroïdes de l'arborescence de clustering en K-moyennes. Pour
savoir comment définir cette valeur, consultez
Régler un index ScaNN.
Les valeurs disponibles sont les suivantes :
Si vous définissez |
Création d'index (facultatif) |
num_leaves |
Nombre de partitions à appliquer à cet index. La valeur maximale est
30000000. Pour en savoir plus sur le choix de cette valeur, consultez
Régler un index ScaNN
et
Bonnes pratiques pour ajuster les index ScaNN.
|
Création d'index (obligatoire pour les index réglés manuellement ) |
quantizer |
Type de quantificateur à utiliser pour l'arborescence k-moyennes. La valeur par défaut est définie sur SQ8, ce qui permet d'améliorer les performances des requêtes avec une perte de rappel minimale (généralement inférieure à 1 % ou 2 %).Définissez la valeur sur FLAT si un rappel de 99 % ou plus est requis. |
Création d'index (facultatif) |
scann.enable_pca |
Active l'analyse des composants principaux (ACP), une technique de réduction de la dimensionnalité utilisée pour réduire automatiquement
la taille de l'embedding lorsque cela est possible. Cette option est activée par défaut. Définissez-la sur false si vous constatez une détérioration du rappel. |
Création d'index (facultatif) |
auto_maintenance |
Gère automatiquement un index ScaNN afin que, à mesure que votre ensemble de données augmente, AlloyDB Omni analyse et mette à jour les centroïdes, et divise les grandes partitions aberrantes. Cela améliore automatiquement le RPS et les résultats de recherche. Pour en savoir plus, consultez Gérer les index automatiquement. |
Création d'index (facultatif) |
scann.pct_leaves_to_search |
Gère automatiquement le nombre de partitions qu'un index vectoriel recherche. Pour en savoir plus, consultez Pourcentage de recherche de partitions. | |
scann.num_leaves_to_search
|
Nombre absolu de partitions à rechercher. Cela vous permet de trouver un compromis entre
le rappel de requête et le RPS. La valeur par défaut est de 1% de
Des valeurs plus élevées améliorent le rappel de requête, mais réduisent le RPS. De même, des valeurs plus faibles entraînent un rappel de requête moins bon, mais un meilleur RPS. |
Environnement d'exécution de requêtes (facultatif) |
scann.pre_reordering_num_neighbors
|
Spécifie le nombre de voisins candidats à prendre en compte lors des étapes de réorganisation une fois que la recherche initiale a identifié un ensemble de candidats. Définissez ce paramètre sur une valeur supérieure au nombre de voisins que vous souhaitez que la requête renvoie. Des valeurs plus élevées améliorent le rappel, mais réduisent le RPS.
La valeur par défaut est |
Environnement d'exécution de requêtes (facultatif) |
scann.num_search_threads |
Nombre de threads de recherche pour la recherche multithread. Cela peut aider à réduire la latence des requêtes uniques, car plusieurs threads sont utilisés pour la recherche ScaNN ANN dans les applications sensibles à la latence. Ce paramètre n'améliore pas la latence des requêtes individuelles si la base de données est déjà liée au processeur. La valeur par défaut est 2. |
Environnement d'exécution de requêtes (facultatif) |
|
Lorsque ce paramètre est défini sur relaxed_order, le flag de base de données corrige un rappel insuffisant. Un rappel insuffisant peut se produire lorsque le rappel observé d'une requête est inférieur au rappel cible, ce qui est plus probable lors de l'utilisation de filtres. Ce paramètre permet d'atteindre le rappel cible en autorisant l'analyse vectorielle à poursuivre la recherche au-delà de la limite num_leaves_to_search jusqu'à ce qu'un nombre suffisant de résultats soit trouvé. |
Environnement d'exécution de requêtes (facultatif) |
|
Ce flag de base de données définit une limite supérieure sur le pourcentage de feuilles totales qui peuvent être visitées pour les requêtes que vous exécutez avec scann.satisfy_limit activé. Il s'agit de la seule limite supérieure GUC disponible, qui s'applique aux modes de recherche automatique et manuelle. Elle empêche la recherche de dépasser la limite, ce qui pourrait dégrader considérablement les performances. Cela s'applique lorsque scann.satisfy_limit est activé.Vous pouvez définir ce paramètre sur n'importe quelle valeur comprise entre 0 et 100. La valeur par défaut est 15%. Cette valeur par défaut est basée sur le principe selon lequel, si une recherche doit examiner plus de 15% des feuilles, le filtre est probablement suffisamment sélectif pour que la recherche du voisin le plus proche approximative (ANN) ne soit pas avantageuse, ce qui fait du pré-filtrage du voisin le plus proche (KNN) un choix plus approprié. |
Environnement d'exécution de requêtes (facultatif) |