Gestisci tabelle, viste materializzate e indici ScaNN
In base al tuo workload, puoi aggiungere manualmente colonne all'archivio colonne o eliminare alcune o tutte le colonne di una tabella o di una vista materializzata dall'archivio colonne. La valutazione delle query utilizza automaticamente i dati colonnari archiviati per rispondere alle query.
Allo stesso modo, puoi aggiungere manualmente un indice ScaNN al motore colonnare per velocizzare la ricerca vettoriale. Ciò consente di eseguire ricerche efficienti del vicino più prossimo su set di dati di grandi dimensioni di vector embedding.
Quando scegli le tabelle, le viste materializzate e le colonne da aggiungere al column store, considera sia le dimensioni del column store sia la forma del workload. I candidati ideali per la selezione includono tabelle o viste di grandi dimensioni che vengono scansionate di frequente. All'interno di queste tabelle o viste, identifica eventuali indici non univoci di grandi dimensioni utilizzati dal carico di lavoro OLAP. Puoi aggiungere le colonne di questi indici all'archivio colonne ed eliminare potenzialmente gli indici, eliminando così il costo delle prestazioni associato alla loro manutenzione nell'istanza primaria.
Utilizza uno dei seguenti metodi per gestire i contenuti del motore colonnare:
- Gestire i contenuti del column store aggiornando i flag di database
- Gestire i contenuti dello column store utilizzando le funzioni SQL
Consulta Quali dati puoi aggiungere all'archivio colonne per informazioni sui tipi di dati e sulle origini dati che puoi utilizzare quando aggiungi tabelle, colonne e viste materializzate all'archivio colonne.
Gestire i contenuti dello column store aggiornando i flag del database
Puoi gestire manualmente i contenuti dello column store aggiornando il flag del database google_columnar_engine.relations. Il flag ha un singolo valore che specifica tutte le origini dati dello column store. Durante il riavvio, le colonne specificate in questo flag vengono popolate automaticamente nel column store.
Puoi utilizzare questo flag insieme alla suddivisione automatica in colonne. Se il
motore di suddivisione in colonne ha memoria disponibile dopo aver compilato le colonne che
specifichi tramite il flag google_columnar_engine.relations, allora
la suddivisione automatica in colonne aggiunge altre colonne all'archivio colonne, in base
alle necessità.
Per saperne di più sull'impostazione dei flag di database, consulta Configura i flag di database di AlloyDB Omni.
Aggiungere colonne utilizzando i flag
Per aggiungere colonne all'archivio colonne, definisci il flag
google_columnar_engine.relations. Imposta il relativo valore su un elenco di elementi separati da virgole, in cui ogni elemento specifica un elenco di colonne da includere in una tabella
specifica, in questo formato:
DATABASE_NAME.SCHEMA_NAME.TABLE_NAME(COLUMN_LIST)
Sostituisci quanto segue:
DATABASE_NAME: il database contenente le colonne da aggiungere al column store.
SCHEMA_NAME: lo schema che identifica le tabelle o le viste materializzate da aggiungere al column store, ad esempio
public.TABLE_NAME: la tabella o la vista materializzata contenente le colonne da aggiungere al column store.
COLUMN_LIST: un elenco separato da virgole delle colonne da aggiungere al column store.
Per aggiungere tutte le colonne di una tabella o di una vista materializzata, ometti l'elenco delle colonne:
DATABASE_NAME.SCHEMA_NAME.TABLE_NAME
Sintassi SQL quando si utilizza google_columnar_engine.relations
L'esempio seguente mostra come utilizzare il comando ALTER SYSTEM per aggiungere due colonne nello schema public al datastore colonne.
ALTER SYSTEM SET google_columnar_engine.relations='DATABASE_NAME.public.TABLE_NAME(COLUMN_1,COLUMN_2)';Eliminare colonne utilizzando i flag
Per eliminare colonne dall'archivio colonne, imposta un nuovo valore per il
flag google_columnar_engine.relations descritto nella sezione precedente,
omettendo le colonne che vuoi eliminare.
Per eliminare tutte le colonne dall'archivio colonne, deseleziona il flag
google_columnar_engine.relations.
Per saperne di più sull'impostazione dei flag di database, consulta Configura i flag di database di AlloyDB Omni.
Gestire i contenuti del column store utilizzando le funzioni SQL
Puoi gestire manualmente i contenuti del column store utilizzando le funzioni SQL.
Stima i requisiti di spazio dell'archivio colonne
Esegui la funzione SQL google_columnar_engine_estimate per stimare la quantità totale di spazio necessaria per una relazione nel motore colonnare.
Client psql
SELECT google_columnar_engine_estimate(
relation => 'TABLE_NAME',
columns => 'COLUMN_LIST'
);
-
Sostituisci quanto segue:
-
TABLE_NAME: una stringa contenente il nome della tabella o della vista materializzata. Se la tabella o la vista si trova in uno schema diverso da public, specifica il nome dello schema, un punto e il nome della tabella o della vista; ad esempio,'myschema.mytable'. -
COLUMN_LIST: una stringa contenente un elenco separato da virgole e sensibile alle maiuscole e minuscole dei nomi delle colonne che vuoi aggiungere. Se vuoi aggiungere tutte le colonne della tabella o della vista materializzata all'archivio colonne, ometti questo parametro.
Aggiungere colonne utilizzando le funzioni SQL
Esegui la funzione SQL google_columnar_engine_add per aggiungere colonne
al column store.
Questo metodo aggiunge le colonne specificate all'archivio colonne e gestisce le colonne solo nel nodo connesso. Le nuove colonne non vengono mantenute all'interno dello store durante i riavvii dell'istanza.
Questo metodo non modifica il flag del database google_columnar_engine.relations. La columnarizzazione automatica non prende in considerazione le colonne aggiunte da questa funzione SQL.
Client psql
SELECT google_columnar_engine_add(
relation => 'TABLE_NAME',
columns => 'COLUMN_LIST'
);
-
Sostituisci quanto segue:
- "TABLE_NAME": una stringa contenente il nome della tabella o della
vista materializzata. Se la tabella o la vista si trova in uno schema diverso da
public, specifica il nome dello schema, un punto e il nome della tabella o della vista; ad esempio,'myschema.mytable'. - "COLUMN_LIST": una stringa contenente un elenco separato da virgole e sensibile alle maiuscole e minuscole dei nomi delle colonne che vuoi aggiungere. Se vuoi aggiungere tutte le colonne della tabella o della vista materializzata all'archivio colonne, ometti questo parametro.
Eliminare colonne utilizzando le funzioni SQL
Esegui la funzione SQL google_columnar_engine_drop nel seguente modo:
Client psql
SELECT google_columnar_engine_drop(
relation => 'TABLE_NAME',
columns => 'COLUMN_LIST'
);
- "TABLE_NAME": una stringa contenente il nome della tabella o della
vista materializzata. Se la tabella o la vista si trova in uno schema diverso da
public, specifica il nome dello schema, un punto e il nome della tabella o della vista; ad esempio,'myschema.mytable'. - "COLUMN_LIST": una stringa contenente un elenco separato da virgole e sensibile alle maiuscole e minuscole dei nomi delle colonne che vuoi aggiungere. Se vuoi aggiungere tutte le colonne della tabella o della vista materializzata all'archivio colonne, ometti questo parametro.
Puoi utilizzare la funzione google_columnar_engine_drop per rimuovere le colonne aggiunte
modificando il flag del database google_columnar_engine.relations. Tuttavia, quando
lo fai, queste colonne vengono aggiunte di nuovo all'archivio colonnare al riavvio dell'istanza.
Gestire gli indici ScaNN nel motore colonnare
Per accelerare la ricerca vettoriale, puoi caricare gli indici ScaNN nella cache degli indici del motore colonnare.
Aggiungi, rimuovi e verifica gli indici ScaNN utilizzando le funzioni SQL
Puoi aggiungere, rimuovere e verificare manualmente gli indici ScaNN dalla cache dell'indice utilizzando le funzioni SQL. L'aggiunta di un indice alla cache può accelerare le query di ricerca vettoriale.
Aggiungere un indice ScaNN
Per aggiungere un indice specifico alla cache degli indici del motore colonnare, utilizza la seguente funzione SQL:
SELECT google_columnar_engine_add_index(index => 'SCANN_INDEX_NAME');
Sostituisci SCANN_INDEX_NAME con il nome dell'indice ScaNN che vuoi aggiungere alla cache dell'indice del motore di colonne.
Rimuovere un indice ScaNN
Per eliminare un indice ScaNN specifico dal motore colonnare, utilizza la seguente funzione SQL:
SELECT google_columnar_engine_drop_index(index => 'SCANN_INDEX_NAME');
Sostituisci SCANN_INDEX_NAME con il nome dell'indice ScaNN che vuoi rimuovere.
Verificare l'utilizzo del motore colonnare
Per verificare se le scansioni dell'indice vettoriale utilizzano il motore colonnare, esegui il comando EXPLAIN ANALYZE con l'opzione COLUMNAR_ENGINE:
EXPLAIN (ANALYZE TRUE, SCANN TRUE, COSTS FALSE, TIMING FALSE, SUMMARY FALSE, VERBOSE FALSE, COLUMNAR_ENGINE TRUE)
SELECT * FROM t ORDER BY val <=> '[0.5,0.5,0.5,0.5]' LIMIT 100;
Il comando restituisce un piano di query simile al seguente:
Index Scan using t_ix3 on t t_1 (actual rows=100 loops=1)
Order By: (val <=> '[0.5,0.5,0.5,0.5]'::vector)
Limit: 100
ScaNN Info: (... columnar engine nodes hit=6...)
Columnar Engine ScaNN Info: (index found=true)
La presenza di columnar engine nodes hit e Columnar Engine ScaNN Info: (index found=true) nell'output conferma che il motore colonnare viene utilizzato per la query.