Paramètres de réglage
Les paramètres d'index et options de base de données ci-après sont utilisés ensemble pour trouver le bon équilibre entre rappel et requêtes par seconde (RPS).
| Paramètre de réglage | Description | Type d'option |
|---|---|---|
max_num_levels |
Nombre maximal de niveaux de centroïdes de l'arborescence de clustering en K-moyennes.
|
Création d'index (facultatif) |
num_leaves |
Nombre de partitions à appliquer à cet index. Le nombre de partitions que vous appliquez lors de la création d'un index a une incidence sur les performances de l'index. En augmentant le nombre de partitions pour un nombre défini de vecteurs, vous créez un index plus précis, ce qui améliore le rappel et les performances des requêtes. Toutefois, cela se fait au détriment de la durée de création des index. Étant donné que les arbres à trois niveaux se construisent plus rapidement que ceux à deux niveaux, vous pouvez augmenter num_leaves_value lorsque vous créez un index d'arborescence à trois niveaux pour améliorer les performances.
|
Création d'un index (obligatoire) |
quantizer |
Type de quantificateur à utiliser pour l'arborescence k-moyennes. La valeur par défaut est définie sur SQ8, ce qui permet d'améliorer les performances des requêtes avec une perte de rappel minimale (généralement inférieure à 1 % ou 2 %).Définissez la valeur sur FLAT si un rappel de 99 % ou plus est requis. |
Création d'index (facultatif) |
scann.enable_inline_filtering |
Permet la prise en charge du filtrage intégré, qui interroge vos données et applique des filtres directement dans une opération de recherche de similarité vectorielle. Ces requêtes de similarité vectorielle utilisent des filtres sur les mêmes tables de base de données et effectuent une évaluation complète des filtres lors du calcul de la distance pour l'identification des voisins les plus proches. Cette option est désactivée par défaut. Pour activer le filtrage intégré, définissez ce paramètre sur true. Si vous constatez une baisse des performances, définissez la valeur sur false.Cette option est disponible en version preview. |
Durée d'exécution de la requête (facultatif) |
scann.enable_pca |
Active l'analyse des composants principaux (ACP), une technique de réduction de la dimensionnalité utilisée pour réduire automatiquement la taille de l'embedding lorsque cela est possible. Cette option est activée par défaut. Définissez-la sur false si vous constatez une détérioration du rappel. |
Création d'index (facultatif) |
scann.num_leaves_to_search |
Ce flag de base de données contrôle le nombre absolu de feuilles ou de partitions à rechercher, ce qui vous permet d'obtenir un compromis entre rappel et nombre de requêtes par seconde. La valeur par défaut est de 1 % de la valeur définie dans num_leaves. Une valeur plus élevée entraînera un meilleur rappel, mais le nombre de requêtes par seconde sera plus faible. De même, une valeur plus faible entraînera un rappel plus faible, mais le RPS sera en ce cas plus élevé. |
Durée d'exécution de la requête (facultatif) |
scann.pre_reordering_num_neighbors |
Lorsqu'il est défini, le flag de base de données spécifie le nombre de voisins candidats à prendre en compte lors des étapes de réorganisation après que la recherche initiale a identifié un ensemble de candidats. Définissez ce paramètre sur une valeur supérieure au nombre de voisins que vous souhaitez que la requête renvoie. Une valeur plus élevée améliore le rappel, mais réduit le nombre de requêtes par seconde. Définissez cette valeur sur 0 pour désactiver le réordonnancement. La valeur par défaut est 0 si l'ACP n'est pas activée lors de la création de l'index. Sinon, la valeur par défaut est 50 x K, où K correspond à la valeur "LIMIT" spécifiée dans la requête. |
Durée d'exécution de la requête (facultatif) |
scann.num_search_threads |
Nombre de threads de recherche pour la recherche multithread. Cela peut aider à réduire la latence des requêtes uniques, car plusieurs threads sont utilisés pour la recherche ScaNN ANN dans les applications sensibles à la latence. Ce paramètre n'améliore pas la latence des requêtes individuelles si la base de données est déjà liée au processeur. La valeur par défaut est 2. |
Durée d'exécution de la requête (facultatif) |