O Google usa tecnologia de IA na tradução de conteúdos para seu idioma de preferência. As traduções com IA podem ter erros.

Crie um índice ScaNN

Esta página descreve como usar incorporações armazenadas para gerar índices e consultar incorporações usando o índice ScaNN com o AlloyDB for PostgreSQL. Para mais informações sobre o armazenamento de incorporações, consulte o artigo Armazene incorporações de vetores.

AlloyDB alloydb_scann, uma extensão do PostgreSQL desenvolvida pela Google que implementa um índice de vizinhos mais próximos altamente eficiente com tecnologia do algoritmo ScaNN.

O índice ScaNN é um índice de quantização baseado em árvores para a pesquisa aproximada do vizinho mais próximo. Oferece um tempo de criação de índice mais baixo e uma menor ocupação de memória em comparação com o HNSW. Além disso, oferece QPS mais rápidas em comparação com o HNSW com base na carga de trabalho.

Antes de começar

Antes de poder começar a criar índices, tem de concluir os seguintes pré-requisitos.

Os vetores de incorporação são adicionados a uma tabela na sua base de dados do AlloyDB.
A extensão vector baseada no pgvector, expandida pela Google para o AlloyDB, e a extensão alloydb_scann estão instaladas:
```
CREATE EXTENSION IF NOT EXISTS alloydb_scann CASCADE;
```
Nota: pode usar a extensão alloydb_scann com bases de dados compatíveis com o PostgreSQL 14, 15, 16 e 17.
Se quiser criar índices ScaNN otimizados automaticamente, certifique-se de que a flag scann.enable_preview_features está ativada. Se não quiser ativar as funcionalidades de pré-visualização ou para instâncias de produção, pode criar um índice ScaNN com parâmetros específicos.

Nota: não recomendamos a ativação de funcionalidades de pré-visualização em instâncias de produção.

Crie um índice ScaNN ajustado automaticamente

Com a funcionalidade de indexação automática, pode simplificar a criação de índices para criar automaticamente índices otimizados para o desempenho da pesquisa ou tempos de criação de índices equilibrados e desempenho da pesquisa.

Quando usa o modo AUTO, só tem de especificar o nome da tabela e a coluna de incorporação, juntamente com a função de distância que quer usar. Pode otimizar o índice para o desempenho da pesquisa ou equilibrar os tempos de criação do índice e o desempenho da pesquisa.

Também existe uma opção para usar o modo MANUAL para criar índices com controlo detalhado sobre outros parâmetros de otimização de índices.

Crie um índice ScaNN no modo AUTO

Seguem-se alguns pontos a ter em atenção antes de criar índices no modo AUTO:

O AlloyDB não consegue criar um índice ScaNN para tabelas com dados insuficientes.
Não pode definir parâmetros de criação de índices, como num_leaves, quando cria índices no modo AUTO.
A manutenção automática está ativada por predefinição para todos os índices criados no modo AUTO.

Para criar um índice no modo AUTO, ative a flag da funcionalidade scann.enable_zero_knob_index_creation. Isto ativa a manutenção automática. Depois de ativar o sinalizador, execute o seguinte comando:

  CREATE INDEX INDEX_NAME ON TABLE
  USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (mode='AUTO');

Substitua o seguinte:

INDEX_NAME: o nome do índice que quer criar, por exemplo, my-scann-index. Os nomes dos índices são partilhados na sua base de dados. Verifique se cada nome de índice é exclusivo para cada tabela na sua base de dados.
TABLE: a tabela à qual adicionar o índice.
EMBEDDING_COLUMN: a coluna que armazena dados de vector.
DISTANCE_FUNCTION: a função de distância a usar com este índice. Selecione uma das seguintes opções:
- Distância L2: l2
- Produto escalar: dot_product
- Distância do cosseno: cosine
OPTIMIZATION (Opcional): por predefinição, é criado um índice otimizado para a pesquisa. Definido para uma das seguintes opções:
- SEARCH_OPTIMIZED (Predefinição): para otimizar a capacidade de memorização da pesquisa vetorial e a latência da pesquisa vetorial a um custo de um tempo de criação do índice mais longo.
- BALANCED: para criar um índice que equilibre o tempo de criação do índice e o desempenho da pesquisa.

Crie um índice `ScaNN` no modo MANUAL

Se ativou a flag scann.enable_preview_features e quiser um controlo detalhado sobre os parâmetros de otimização, pode criar o índice no modo MANUAL.

Para criar um índice ScaNN no modo MANUAL, execute o seguinte comando:

  CREATE INDEX INDEX_NAME ON TABLE
  USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (mode='MANUAL', num_leaves=NUM_LEAVES_VALUE, quantizer =QUANTIZER, max_num_levels=MAX_NUM_LEVELS);

Substitua o seguinte:

INDEX_NAME: o nome do índice que quer criar, por exemplo, my-scann-index. Os nomes dos índices são partilhados na sua base de dados. Verifique se cada nome de índice é exclusivo para cada tabela na sua base de dados.
TABLE: a tabela à qual adicionar o índice.
EMBEDDING_COLUMN: a coluna que armazena dados de vector.
DISTANCE_FUNCTION: a função de distância a usar com este índice. Selecione uma das seguintes opções:
- Distância L2: l2
- Produto escalar: dot_product
- Distância do cosseno: cosine
NUM_LEAVES_VALUE: o número de partições a aplicar a este índice. Definido para qualquer valor entre 1 e 10 milhões. Para mais informações sobre como escolher este valor, consulte o artigo Ajuste um índice ScaNN.
QUANTIZER: o tipo de quantizador a usar. Tenha em atenção que o índice ScaNN pode ser carregado no motor de colunas para acelerar ainda mais a pesquisa vetorial. As opções disponíveis são as seguintes:
- SQ8: oferece um equilíbrio entre o desempenho das consultas e a perda mínima de capacidade de memorização, normalmente inferior a 1 a 2%. Este é o valor predefinido.
- AH: o AH é até 4 vezes mais comprimido em comparação com o SQ8. Tenha isto em consideração para um desempenho de consulta potencialmente melhor quando o motor de colunas está ativado e os dados do índice e da tabela são preenchidos no motor de colunas, sujeitos ao respetivo tamanho configurado. Para mais informações, consulte o artigo Práticas recomendadas para otimizar o ScaNN.
- FLAT: oferece a mais elevada capacidade de memorização de 99% ou superior à custa do desempenho da pesquisa.
MAX_NUM_LEVELS: o número máximo de níveis da árvore de agrupamento K-means. Defina como 1(predefinição) para a quantização baseada em árvore de dois níveis e defina como 2 para a quantização baseada em árvore de três níveis.

Pode adicionar outros parâmetros de criação de índice ou de tempo de execução de consultas para otimizar o índice. Para mais informações, consulte o artigo Ajuste um índice de ScaNN.

Crie um índice `ScaNN` com parâmetros específicos

Se a sua aplicação tiver requisitos específicos para tempos de criação de índice e de recolha, pode criar o índice manualmente. Pode criar um índice de árvore de dois ou três níveis com base na sua carga de trabalho. Para mais informações sobre a otimização de parâmetros, consulte o artigo Otimize um ScaNNíndice.

Índice de árvore de dois níveis

Para aplicar um índice de árvore de dois níveis usando o algoritmo ScaNN a uma coluna que contenha incorporações de vetores armazenadas, execute a seguinte consulta DDL:

CREATE INDEX INDEX_NAME ON TABLE
USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
WITH (num_leaves=NUM_LEAVES_VALUE, quantizer =QUANTIZER);

Substitua o seguinte:

INDEX_NAME: o nome do índice que quer criar, por exemplo, my-scann-index. Os nomes dos índices são partilhados na base de dados. Certifique-se de que cada nome de índice é exclusivo para cada tabela na sua base de dados.
TABLE: a tabela à qual adicionar o índice.
EMBEDDING_COLUMN: uma coluna que armazena vector dados.
DISTANCE_FUNCTION: a função de distância a usar com este índice. Selecione uma das seguintes opções:
- Distância L2: l2
- Produto escalar: dot_product
- Distância do cosseno: cosine
NUM_LEAVES_VALUE: o número de partições a aplicar a este índice. Definido para qualquer valor entre 1 e 10 milhões. Para mais informações sobre como escolher este valor, consulte o artigo Ajuste um índice ScaNN.
QUANTIZER: o tipo de quantizador a usar. Tenha em atenção que o índice ScaNN pode ser carregado no motor de colunas para acelerar ainda mais a pesquisa vetorial. As opções disponíveis são as seguintes:
- SQ8: oferece um equilíbrio entre o desempenho das consultas e a perda mínima de capacidade de memorização, normalmente inferior a 1 a 2%. Este é o valor predefinido.
- AH: o AH é até 4 vezes mais comprimido em comparação com o SQ8. Tenha isto em consideração para um desempenho de consulta potencialmente melhor quando o motor de colunas está ativado e os dados do índice e da tabela são preenchidos no motor de colunas, sujeitos ao respetivo tamanho configurado. Para mais informações, consulte o artigo Práticas recomendadas para otimizar o ScaNN.
- FLAT: oferece a mais elevada capacidade de memorização de 99% ou superior à custa do desempenho da pesquisa.

Índice de árvore de três níveis

Para criar um índice de árvore de três níveis usando o algoritmo ScaNN numa coluna que contenha incorporações de vetores armazenadas, execute a seguinte consulta DDL:

CREATE INDEX INDEX_NAME ON TABLE
  USING scann (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (num_leaves=NUM_LEAVES_VALUE, max_num_levels = 2);

Depois de criar o índice, pode executar consultas de pesquisa de vizinhos mais próximos que usam o índice seguindo as instruções em Faça uma consulta de vizinhos mais próximos com um determinado texto.

Os parâmetros de índice têm de ser definidos para encontrar o equilíbrio certo entre as consultas por segundo e a capacidade de memorização. Para mais informações sobre a otimização do índice ScaNN, consulte o artigo Otimize um ScaNN índice.

Para criar este índice numa coluna de incorporação que usa o tipo de dados real[] em vez de vector, converta a coluna no tipo de dados vector:

CREATE INDEX INDEX_NAME ON TABLE
USING scann (CAST(EMBEDDING_COLUMN AS vector(DIMENSIONS)) DISTANCE_FUNCTION)
WITH (num_leaves=NUM_LEAVES_VALUE, max_num_levels = MAX_NUM_LEVELS);

Substitua DIMENSIONS pela largura dimensional da coluna de incorporação. Para mais informações sobre como encontrar as dimensões, consulte a função vector_dims em Funções vetoriais.

Para conseguir uma experiência de pesquisa consistente, ative a manutenção automática quando criar um índice ScaNN. Para mais informações, consulte o artigo Mantenha os índices de vetores. Esta funcionalidade está disponível na pré-visualização.

Para ver o progresso da indexação, use a vista pg_stat_progress_create_index:

SELECT * FROM pg_stat_progress_create_index;

A coluna phase mostra o estado atual da criação do índice. Após a conclusão da fase de criação do índice, a linha do índice não fica visível.

Para ajustar o índice de modo a ter um equilíbrio médio entre a capacidade de memorização e as consultas por segundo, consulte o artigo Ajuste um índice ScaNN.

Forçar a criação de índices em tabelas vazias ou pequenas

O AlloyDB tem validações para impedir a criação de um índice ScaNN numa tabela vazia ou numa tabela com muito poucas linhas, uma vez que isto pode levar a um desempenho abaixo do ideal. No entanto, em alguns cenários de desenvolvimento ou testes, pode ter de criar um índice numa tabela vazia ou pequena. Pode aplicar a criação de índices nestes casos.

Para forçar a geração do índice, conclua os seguintes passos:

Defina o parâmetro ao nível da sessão scann.allow_blocked_operations creation como true na base de dados:
```
SET scann.allow_blocked_operations = true;
```
Atribua o privilégio SUPERUSER ao utilizador que executa estas consultas na base de dados:
```
CREATE USER USER_NAME WITH SUPERUSER PASSWORD PASSWORD;
```
Substitua o seguinte:
- USER_NAME: o nome do utilizador ao qual quer conceder o privilégio.
- PASSWORD: a palavra-passe do utilizador.

Crie índices em paralelo

Para criar o índice mais rapidamente, o AlloyDB pode gerar automaticamente vários trabalhadores paralelos, consoante o conjunto de dados e o tipo de índice que escolher.

A criação do índice paralelo é frequentemente acionada se estiver a criar um índice ScaNN de 3 níveis ou se o seu conjunto de dados exceder 100 milhões de linhas.

Embora o AlloyDB otimize automaticamente o número de trabalhadores paralelos, pode ajustar os trabalhadores paralelos através dos parâmetros de planeamento de consultas do PostgreSQL max_parallel_maintenance_workers, max_parallel_workers e min_parallel_table_scan_size.

Execute uma consulta

Depois de armazenar e indexar as incorporações na sua base de dados, pode começar a consultar os seus dados. Não pode executar consultas de pesquisa em massa através da extensão alloydb_scann.

Para encontrar os vizinhos semânticos mais próximos de um vetor de incorporação, pode executar a seguinte consulta de exemplo, em que define a mesma função de distância que usou durante a criação do índice.

  SELECT * FROM TABLE
  ORDER BY EMBEDDING_COLUMN DISTANCE_FUNCTION_QUERY 'EMBEDDING'
  LIMIT ROW_COUNT

Substitua o seguinte:

TABLE: a tabela que contém a incorporação para comparar com o texto.
INDEX_NAME: o nome do índice que quer usar, por exemplo, my-scann-index.
EMBEDDING_COLUMN: a coluna que contém as incorporações armazenadas.
DISTANCE_FUNCTION_QUERY: a função de distância a usar com esta consulta. Escolha uma das seguintes opções com base na função de distância usada ao criar o índice:
- Distância L2: <->
- Produto interno: <#>
- Distância do cosseno: <=>
EMBEDDING: o vetor de incorporação para o qual quer encontrar os vizinhos semânticos armazenados mais próximos.
ROW_COUNT: o número de linhas a devolver.

Especifique 1 se quiser apenas a melhor correspondência única.

Também pode usar a função embedding() para traduzir o texto num vetor. Uma vez que embedding() devolve uma matriz real, tem de converter explicitamente a chamada embedding() em vector antes de a aplicar a um dos operadores de vizinhos mais próximos (por exemplo, <-> para a distância L2). Em seguida, estes operadores podem usar o índice ScaNN para encontrar as linhas da base de dados com as incorporações semanticamente mais semelhantes.

Crie um índice ScaNN Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Antes de começar

Crie um índice ScaNN ajustado automaticamente

Crie um índice ScaNN no modo AUTO

Crie um índice ScaNN no modo MANUAL

Crie um índice ScaNN com parâmetros específicos

Índice de árvore de dois níveis

Índice de árvore de três níveis

Forçar a criação de índices em tabelas vazias ou pequenas

Crie índices em paralelo

Execute uma consulta

O que se segue?

Crie um índice ScaNN

Crie um índice `ScaNN` no modo MANUAL

Crie um índice `ScaNN` com parâmetros específicos