Para informações sobre como criar índices do ScaNN, consulte Criar um índice do ScaNN.
Limites
Antes de começar a ajustar seus índices do ScaNN, reconheça o seguinte limite:
num_leavestem um limite de 30 milhões.
Antes de começar
Se você quiser criar um índice ScaNN de quatro níveis, primeiro ative o recurso Prévia para sua instância do AlloyDB. Para ativar o recurso de prévia, escolha um dos dois métodos a seguir:
Ative a flag de banco de dados
scann.enable_preview_features.Para mais informações sobre como configurar flags de banco de dados, consulte Configurar flags de banco de dados do AlloyDB Omni.
Defina a flag de banco de dados
scann.max_allowed_num_levelsno nível da sessão como3.SET scann.max_allowed_num_levels = 3;
Índice de árvore de dois níveis
Para aplicar recomendações que ajudam a encontrar os valores ideais de num_leaves e num_leaves_to_search para seu conjunto de dados, siga estas etapas recomendadas:
- Para criar o índice
ScaNNotimizado para os casos a seguir, defina o parâmetronum_leavescom o valor abaixo, em que "rows" é o número de linhas na tabela indexada:- tempo de build e qualidade de índice equilibrados definem
num_leavescomosqrt(rows). - quality define num_leaves como rows/100.
- tempo de build e qualidade de índice equilibrados definem
- Execute as consultas de teste, aumentando o valor de
scann.num_of_leaves_to_searchaté atingir o intervalo de recall desejado, por exemplo, 95%. Para mais informações sobre como analisar suas consultas, consulte Analisar suas consultas. - Anote a proporção entre
scann.num_leaves_to_searchenum_leaves, que será usada nas próximas etapas. Essa proporção fornece uma aproximação do conjunto de dados que vai ajudar você a alcançar a acurácia desejada.
Se você estiver trabalhando com vetores de alta dimensão (500 dimensões ou mais) e quiser melhorar a acurácia, ajuste o valor descann.pre_reordering_num_neighbors. O valor padrão é definido como50 * K, em queKé o limite definido na consulta. - Se a QPS estiver muito baixa depois que as consultas atingirem uma meta de recall, siga estas etapas:
- Recrie o índice, aumentando o valor de
num_leavesescann.num_leaves_to_searchde acordo com as seguintes orientações:- Defina
num_leavescomo um fator maior da raiz quadrada da contagem de linhas. Por exemplo, se o índice tivernum_leavesdefinido como a raiz quadrada da contagem de linhas, tente definir como o dobro da raiz quadrada. Se o valor já for duplo, tente definir como o triplo da raiz quadrada. - Aumente
scann.num_leaves_to_searchconforme necessário para manter a proporção comnum_leaves, que você anotou na etapa 3. - Defina
num_leavescomo um valor menor ou igual à contagem de linhas dividida por 100.
- Defina
- Execute as consultas de teste novamente.
Enquanto executa as consultas de teste, experimente reduzir
scann.num_leaves_to_searche encontre um valor que aumente as QPS e mantenha o recall alto. Teste valores diferentes descann.num_leaves_to_searchsem recriar o índice.
- Recrie o índice, aumentando o valor de
- Repita a etapa 4 até que o QPS e o intervalo de recall atinjam valores aceitáveis.
Índice de árvore de três níveis
Além das recomendações para o índice de árvore de dois níveis ScaNN, use as orientações a seguir.
Para aplicar recomendações e encontrar o valor ideal dos parâmetros de índice num_leaves e max_num_levels, siga estas etapas:
Crie o índice
ScaNNcom as seguintes combinações denum_leavesemax_num_levelscom base nas suas metas de performance:- equilibrar tempo de build e qualidade do índice: defina
max_num_levelscomo2enum_leavescomopower(rows, ⅔). - Otimizar para qualidade: defina
max_num_levelscomo2enum_leavescomorows/100.
- equilibrar tempo de build e qualidade do índice: defina
Execute suas consultas de teste. Para mais informações sobre como analisar consultas, consulte Analisar suas consultas.
Anote a proporção entre
scann.num_leaves_to_searchenum_leavesque será usada nas próximas etapas. Essa proporção fornece uma aproximação do conjunto de dados que vai ajudar você a alcançar a acurácia desejada.
Se você estiver trabalhando com vetores de alta dimensão (500 dimensões ou mais) e quiser melhorar o recall, ajuste o valor de scann.pre_reordering_num_neighbors. O valor padrão é definido como 50 * K, em que K é o limite definido na consulta.
Se a QPS estiver muito baixa depois que as consultas atingirem uma meta de recall, siga estas etapas:
- Recrie o índice, aumentando o valor de
num_leavesescann.num_leaves_to_searchde acordo com as seguintes orientações: - Defina
num_leavescomo um fator maior depower(rows, ⅔). Por exemplo, se o índice tivernum_leavesdefinido comopower(rows, ⅔), tente definir como o dobro depower(rows, ⅔). Se o valor já for o dobro, tente definir como o triplo depower(rows, ⅔). - Aumente
scann.num_leaves_to_searchconforme necessário para manter a proporção comnum_leaves, que você anotou na etapa 3. - Defina
num_leavescom um valor menor ou igual arows/100. - Execute as consultas de teste novamente. Enquanto executa as consultas de teste, experimente reduzir
scann.num_leaves_to_searche encontre um valor que aumente as QPS e mantenha o recall alto. Teste valores diferentes descann.num_leaves_to_searchsem recriar o índice.
- Recrie o índice, aumentando o valor de
Repita a etapa 4 até que o QPS e o intervalo de recall atinjam valores aceitáveis.
Índice de árvore de quatro níveis
Além das recomendações para índices de árvore de três níveis, use as orientações a seguir para encontrar o valor ideal de num_leaves e max_num_levels:
Crie um índice ScaNN com as seguintes combinações de
num_leavesemax_num_levelscom base nas suas metas de performance:Equilibre o tempo de build e a qualidade do índice: defina
max_num_levelscomo3enum_leavescomopower(ROWS, 3/4).Otimize para qualidade: defina
max_num_levelscomo3enum_leavescomoROWS/100.
Execute suas consultas de teste. Para mais informações sobre como analisar consultas, consulte Analisar suas consultas.
Anote a proporção entre
scann.num_leaves_to_searchenum_leaves. Use essa proporção para alcançar a meta de recall nas etapas subsequentes.Se você estiver trabalhando com vetores de alta dimensão (500 dimensões ou mais) e quiser melhorar o recall, ajuste o valor de
scann.pre_reordering_num_neighbors.Se o QPS estiver muito baixo depois que as consultas atingirem uma meta de recall, recrie o índice, aumentando o valor de
num_leavesescann.num_leaves_to_searchde acordo com as orientações a seguir:Defina
num_leavescomo um fator maior depower(ROWS, 3/4). Por exemplo, se o índice tivernum_leavesdefinido comopower(ROWS, 3/4), tente definir o dobro desse valor. Se o valor já for duplo, tente definir como triplo.Aumente
scann.num_leaves_to_searchconforme necessário para manter a proporção comnum_leaves, que você observou na etapa três.Defina
num_leavescom um valor menor ou igual aROWS/100.Execute as consultas de teste novamente. Enquanto você executa as consultas de teste, tente reduzir
scann.num_leaves_to_search. Encontre um valor que aumente o QPS e mantenha o recall alto. Teste valores diferentes descann.num_leaves_to_searchsem recriar o índice.
Repita a etapa quatro até que o intervalo de recall e o QPS atinjam valores aceitáveis.
Melhorar a recuperação de pesquisas filtradas
Ao realizar uma pesquisa de vetor de vizinho k-mais próximo (KNN) que inclui um filtro, você pode encontrar situações em que a consulta retorna menos resultados do que o solicitado na cláusula LIMIT. Isso pode levar ao que é conhecido como recall insuficiente e é mais provável que ocorra ao usar filtros altamente seletivos. Isso acontece porque as partições ou folhas iniciais que o ScaNN pesquisa não contêm vetores suficientes que atendam às condições do filtro.
Para resolver isso, o AlloyDB Omni oferece um recurso que permite que a pesquisa se expanda dinamicamente além do conjunto inicial de folhas para encontrar resultados correspondentes suficientes.
Como funciona o streaming
Para ativar a funcionalidade de streaming, defina o parâmetro scann.satisfy_limit como relaxed_order. Quando ativada, a verificação de vetor continua pesquisando outras partições de folha até encontrar resultados suficientes para atender ao LIMIT da sua consulta, melhorando assim o recall.
Para evitar que uma pesquisa continue por muito tempo e controlar o impacto no desempenho, use o parâmetro scann.max_pct_leaves_to_search. Essa configuração funciona como uma proteção ao definir um limite superior para a porcentagem do total de folhas que uma consulta pode visitar. O valor padrão é 15%.
Quando usar o streaming
Considere usar o recurso de transmissão quando:
- Você usa filtros com suas pesquisas vetoriais.
- Você percebe que suas consultas retornam menos resultados do que o esperado com base na cláusula
LIMIT.
Ao ativar o scann.satisfy_limit, você melhora a recuperação das suas pesquisas filtradas. Também é recomendável configurar scann.max_pct_leaves_to_search para alcançar o equilíbrio entre recall e desempenho da consulta.
Manutenção de índice
Se a sua tabela está sujeita a atualizações ou inserções frequentes, recomendamos reindexar periodicamente o índice ScaNN atual para melhorar a acurácia de recall.
Você pode monitorar as métricas de índice para visualizar mudanças nas distribuições de vetores ou mutações de vetores desde que o índice foi criado e, em seguida, reindexá-lo corretamente. Para mais informações sobre métricas, consulte Visualizar métricas de índice vetorial.