Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Criar um índice IVFFLAT

Nesta página, descrevemos como usar embeddings armazenados para gerar índices e consultar embeddings usando um índice IVFFlat com o AlloyDB. Para mais informações sobre como armazenar embeddings, consulte Armazenar embeddings de vetor.

Antes de começar

Antes de começar a criar índices, conclua os seguintes pré-requisitos.

Os vetores de embedding são adicionados a uma tabela no banco de dados do AlloyDB.
A versão 0.5.0 ou mais recente da extensão vector, baseada em pgvector e estendida pelo Google para o AlloyDB, está instalada.
```
CREATE EXTENSION IF NOT EXISTS vector;
```

Criar um índice `IVFFlat`

O pgvector padrão também oferece uma versão do índice IVF chamada IVFFlat que oferece um tempo de build mais rápido e tem um consumo de memória menor em comparação com o índice hnsw.

Para criar um índice IVFFlat, siga estas etapas:

CREATE INDEX INDEX_NAME ON TABLE
  USING ivfflat (EMBEDDING_COLUMN DISTANCE_FUNCTION)
  WITH (lists = LIST_COUNT);

Substitua:

INDEX_NAME: o nome do índice que você quer criar, por exemplo, my-ivf-index.
TABLE: a tabela em que o índice será adicionado.
EMBEDDING_COLUMN: uma coluna que armazena dados de vector.
DISTANCE_FUNCTION: a função de distância a ser usada com esse índice. Escolha uma destas opções:
- Distância de L2: vector_l2_ops
- Produto interno: vector_ip_ops
- Distância do cosseno: vector_cosine_ops
LIST_COUNT: o número de listas a serem usadas com esse índice. Para mais informações sobre como decidir esse valor, consulte Ajustar um índice IVFFlat.

Para criar esse índice em uma coluna de incorporação que usa o tipo de dados real[] em vez de vector, converta a coluna no tipo de dados vector:

CREATE INDEX INDEX_NAME ON TABLE
  USING ivfflat (CAST(EMBEDDING_COLUMN AS vector(DIMENSIONS)))'}} DISTANCE_FUNCTION)
  WITH (lists = LIST_COUNT);

Substitua DIMENSIONS pela largura dimensional da coluna de embedding. Para mais informações sobre como encontrar as dimensões, consulte a função vector_dims em Funções de vetor.

Para conferir o progresso da indexação, use a visualização pg_stat_progress_create_index:

SELECT * FROM pg_stat_progress_create_index;

A coluna phase mostra o estado atual da criação do índice.

Para ajustar o índice para um recall e um QPS equilibrados, consulte Ajustar um índice IVFFlat.

Executar uma consulta

Depois de armazenar e indexar os embeddings no banco de dados, você pode começar a consultar usando a funcionalidade de consulta pgvector.

Para encontrar os vizinhos semânticos mais próximos de um vetor de embedding, execute a consulta de exemplo a seguir, em que você define a mesma função de distância usada durante a criação do índice.

  SELECT * FROM TABLE
    ORDER BY EMBEDDING_COLUMN DISTANCE_FUNCTION_QUERY ['EMBEDDING']
    LIMIT ROW_COUNT

Substitua o seguinte:

TABLE: a tabela que contém o embedding com o qual você vai comparar o texto.
INDEX_NAME: o nome do índice que você quer usar. Por exemplo, my-scann-index.
EMBEDDING_COLUMN: a coluna que contém os embeddings armazenados.
DISTANCE_FUNCTION_QUERY: a função de distância a ser usada com essa consulta. Escolha uma das seguintes opções com base na função de distância usada ao criar o índice:
- Distância de L2: <->
- Produto interno: <#>
- Distância do cosseno: <=>
EMBEDDING: o vetor de embedding para encontrar os vizinhos semânticos armazenados mais próximos.
ROW_COUNT: o número de linhas que serão retornadas.

Especifique 1 se você quiser apenas a melhor correspondência.

Para mais exemplos de consultas, consulte Consultas.

Você também pode usar a função embedding() para traduzir o texto em um vetor. Você aplica o vetor a um dos operadores de vizinho mais próximo pgvector, <-> para distância L2, para encontrar as linhas do banco de dados com os embeddings mais semanticamente semelhantes.

Como embedding() retorna uma matriz real, é necessário transmitir explicitamente a chamada embedding() para vector para usar esses valores com operadores pgvector.

Criar um índice IVFFLAT Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Antes de começar

Criar um índice IVFFlat

Executar uma consulta

A seguir

Criar um índice IVFFLAT

Criar um índice `IVFFlat`