Questo documento descrive gli errori che potresti riscontrare durante la generazione di un indice ScaNN. Vengono forniti anche esempi di errori e correzioni consigliate.
Come soluzione alternativa generale, puoi disattivare la generazione di questi errori e continuare a generare l'indice. Per saperne di più, vedi Forzare la creazione di indici su tabelle vuote o di piccole dimensioni.
Impossibile creare l'indice ScaNN con una tabella vuota
Descrizione
Quando tenti di generare un indice su una tabella senza dati o di troncare una tabella con un indice ScaNN generato, si verifica il seguente errore:
ERROR: Cannot create ScaNN index "[INDEX_NAME]" for table "[TABLE_NAME]", error: FAILED_PRECONDITION: Cannot create ScaNN index "[INDEX_NAME]" with empty table "[TABLE_NAME]". Once the table is populated with data, create the index. See documentation to bypass this validation.
Query di esempio che causano l'errore
Esempio di query A
create table t1 (a INT, b VECTOR(512)); CREATE TABLE create index on t1 using ScaNN(b cosine) with (num_leaves = 10, quantizer = 'sq8');Esempio di query B
truncate t1;
Correzione consigliata
Prima di generare un indice ScaNN, assicurati che la tabella sia popolata con i vettori di incorporamento.
Impossibile creare l'indice ScaNN
Descrizione
Quando tenti di generare un indice in una tabella con poche righe compilate, si verifica il seguente errore:
ERROR: Cannot create ScaNN index "[INDEX_NAME]" for table "[TABLE_NAME]", error: INVALID_ARGUMENT: Number of rows ([ACTUAL]) must be larger than ([EXPECTED]).
Query di esempio che causa l'errore
create table t1 (a INT, b VECTOR(512));
CREATE TABLE
insert into t1 select (random()*1e9)::int, random_vector(512) from generate_series(1, 5);
INSERT 0 5
create index on t1 using scann(b cosine) with (num_leaves = 100, quantizer = 'sq8');
Correzione consigliata
Assicurati che la tabella sia compilata con i vettori di incorporamento prima di generare un indice ScaNN. Ti consigliamo che il numero di righe nella tabella sia maggiore
del valore definito nel parametro num_leaves.
Impossibile creare un indice ScaNN per una tabella con una sola riga
Descrizione
Questo errore si è verificato perché ScaNN (e la maggior parte degli indici ANN come IVFFlat) ha bisogno di un set di addestramento per creare le sue strutture interne (cluster/foglie). Quando inserisci esattamente una riga , viene visualizzato il seguente errore:
ERROR: Cannot create ScaNN index "[INDEX_NAME]" for table "[TABLE_NAME]", error: INVALID_ARGUMENT: Number of samples "[NUM_SAMPLES]" must be larger than 1 and the number of leaves "[NUM_LEAVES]"
Query di esempio che causa l'errore
create table t1 (a INT, b VECTOR(512));
CREATE TABLE
insert into t1 select (random()*1e9)::int, random_vector(512) from generate_series(1, 1);
INSERT 0 1
create index on t1 using scann(b cosine) with (num_leaves = 1, quantizer = 'sq8');
Correzione consigliata
Assicurati che la tabella sia popolata con i vettori di incorporamento prima di generare un indice ScaNN. Ti consigliamo che il numero di righe nella tabella sia:
- Maggiore di 1
- Maggiore del valore definito nel parametro
num_leaves
Impossibile creare l'indice ScaNN nella tabella di partizione principale
Descrizione
Se hai creato tabelle partizionate da una tabella padre, la creazione di un indice ScaNN sulla tabella padre genera il seguente errore:
ERROR: Cannot create ScaNN index "[INDEX_NAME]" for parent partition table "[TABLE_NAME]". Create ScaNN indexes on the child tables instead. See documentation to bypass this validation.
Query di esempio che causa l'errore
create table t1 (a INT, b VECTOR(512)) partition by range(a);
CREATE TABLE
CREATE TABLE t1_one_ten PARTITION of t1 for values from (1) to (10);
CREATE TABLE
insert into t1_one_ten select (random()*1e9)::int, random_vector(512) from generate_series(1, 100);
INSERT 0 100
CREATE TABLE t1_eleven_twenty PARTITION of t1 for values from (11) to (20);
CREATE TABLE
insert into t1_eleven_twenty select (random()*1e9)::int, random_vector(512) from generate_series(1, 100);
INSERT 0 100
create index on t1 using scann(b cosine) with (num_leaves = 10, quantizer = 'sq8');
Correzione consigliata
- Non puoi generare un indice
ScaNNnella tabella principale di una tabella partizionata. - Devi generare gli indici
ScaNNnella tabella partizionata.