Risolvere i problemi relativi agli errori dell'indice ScaNN

Questo documento descrive gli errori che potresti riscontrare durante la generazione di un indice ScaNN. Vengono forniti anche esempi di errori e correzioni consigliate.

Come soluzione alternativa generale, puoi disattivare la generazione di questi errori e continuare a generare l'indice. Per saperne di più, vedi Forzare la creazione di indici su tabelle vuote o di piccole dimensioni.

Impossibile creare l'indice ScaNN con una tabella vuota

Descrizione

Quando tenti di generare un indice su una tabella senza dati o di troncare una tabella con un indice ScaNN generato, si verifica il seguente errore:

ERROR: Cannot create ScaNN index "[INDEX_NAME]" for table "[TABLE_NAME]", error: FAILED_PRECONDITION: Cannot create ScaNN index "[INDEX_NAME]" with empty table "[TABLE_NAME]". Once the table is populated with data, create the index. See documentation to bypass this validation.

Query di esempio che causano l'errore

  • Esempio di query A

    create table t1 (a INT, b VECTOR(512));
    CREATE TABLE
    create index on t1 using ScaNN(b cosine) with (num_leaves = 10, quantizer = 'sq8');
    
  • Esempio di query B

    truncate t1;
    

Prima di generare un indice ScaNN, assicurati che la tabella sia popolata con i vettori di incorporamento.

Impossibile creare l'indice ScaNN

Descrizione

Quando tenti di generare un indice in una tabella con poche righe compilate, si verifica il seguente errore:

ERROR: Cannot create ScaNN index "[INDEX_NAME]" for table "[TABLE_NAME]", error: INVALID_ARGUMENT: Number of rows ([ACTUAL]) must be larger than ([EXPECTED]).

Query di esempio che causa l'errore

create table t1 (a INT, b VECTOR(512));
CREATE TABLE
insert into t1 select (random()*1e9)::int, random_vector(512) from generate_series(1, 5);
INSERT 0 5
create index on t1 using scann(b cosine) with (num_leaves = 100, quantizer = 'sq8');

Assicurati che la tabella sia compilata con i vettori di incorporamento prima di generare un indice ScaNN. Ti consigliamo che il numero di righe nella tabella sia maggiore del valore definito nel parametro num_leaves.

Impossibile creare un indice ScaNN per una tabella con una sola riga

Descrizione

Questo errore si è verificato perché ScaNN (e la maggior parte degli indici ANN come IVFFlat) ha bisogno di un set di addestramento per creare le sue strutture interne (cluster/foglie). Quando inserisci esattamente una riga , viene visualizzato il seguente errore:

ERROR: Cannot create ScaNN index "[INDEX_NAME]" for table "[TABLE_NAME]", error: INVALID_ARGUMENT: Number of samples "[NUM_SAMPLES]" must be larger than 1 and the number of leaves "[NUM_LEAVES]"

Query di esempio che causa l'errore

create table t1 (a INT, b VECTOR(512));
CREATE TABLE
insert into t1 select (random()*1e9)::int, random_vector(512) from generate_series(1, 1);
INSERT 0 1
create index on t1 using scann(b cosine) with (num_leaves = 1, quantizer = 'sq8');

Assicurati che la tabella sia popolata con i vettori di incorporamento prima di generare un indice ScaNN. Ti consigliamo che il numero di righe nella tabella sia:

  • Maggiore di 1
  • Maggiore del valore definito nel parametro num_leaves

Impossibile creare l'indice ScaNN nella tabella di partizione principale

Descrizione

Se hai creato tabelle partizionate da una tabella padre, la creazione di un indice ScaNN sulla tabella padre genera il seguente errore:

ERROR: Cannot create ScaNN index "[INDEX_NAME]" for parent partition table "[TABLE_NAME]". Create ScaNN indexes on the child tables instead. See documentation to bypass this validation.

Query di esempio che causa l'errore

create table t1 (a INT, b VECTOR(512)) partition by range(a);
CREATE TABLE
CREATE TABLE t1_one_ten PARTITION of t1 for values from (1) to (10);
CREATE TABLE
insert into t1_one_ten select (random()*1e9)::int, random_vector(512) from generate_series(1, 100);
INSERT 0 100
CREATE TABLE t1_eleven_twenty PARTITION of t1 for values from (11) to (20);
CREATE TABLE
insert into t1_eleven_twenty select (random()*1e9)::int, random_vector(512) from generate_series(1, 100);
INSERT 0 100
create index on t1 using scann(b cosine) with (num_leaves = 10, quantizer = 'sq8');
  • Non puoi generare un indice ScaNN nella tabella principale di una tabella partizionata.
  • Devi generare gli indici ScaNN nella tabella partizionata.