Per informazioni su come utilizzare la ricerca vettoriale filtrata per perfezionare le ricerche di similarità, consulta Ricerca vettoriale filtrata in AlloyDB Omni.
Per scoprire come eseguire una ricerca vettoriale con gli embedding di Vertex AI, consulta Iniziare a utilizzare il vector embedding con l'AI di AlloyDB Omni.
Obiettivi
- Crea un cluster AlloyDB Omni e un'istanza principale.
- Connettiti al database e installa le estensioni richieste.
- Crea una tabella
producte una tabellaproduct inventory. - Inserisci i dati nelle tabelle
producteproduct inventoryed esegui una ricerca vettoriale di base. - Crea un indice ScaNN nella tabella dei prodotti.
- Esegui una ricerca vettoriale di base.
- Esegui una ricerca vettoriale complessa con un filtro e un join.
Costi
In questo documento, utilizzi i seguenti componenti fatturabili di Google Cloud:
Per generare una stima dei costi in base all'utilizzo previsto, utilizza il calcolatore prezzi.
I nuovi Google Cloud utenti potrebbero essere idonei a usufruire di una prova senza costi.
Al termine delle attività descritte in questo documento, puoi evitare la fatturazione continua eliminando le risorse che hai creato. Per ulteriori informazioni, consulta Liberare spazio.
Prerequisiti
Completa i seguenti prerequisiti prima di eseguire una ricerca vettoriale:
- Installa AlloyDB AI in AlloyDB Omni
-
Esegui AlloyDB Omni e connettiti
come utente
postgres. -
Installa le estensioni
vector,alloydb_scannegoogle_ml_integration.CREATE EXTENSION IF NOT EXISTS vector; CREATE EXTENSION IF NOT EXISTS alloydb_scann; CREATE EXTENSION IF NOT EXISTS google_ml_integration CASCADE;
Inserisci i dati di inventario dei prodotti ed esegui una ricerca vettoriale di base
Esegui la seguente istruzione per creare una tabella
productche:- Memorizza le informazioni sul prodotto di base.
- Include una colonna vettoriale
embeddingche calcola e memorizza un vettore di embedding per la descrizione di ogni prodotto.
CREATE TABLE product ( id INT PRIMARY KEY, name VARCHAR(255) NOT NULL, description TEXT, category VARCHAR(255), color VARCHAR(255), embedding vector(768) GENERATED ALWAYS AS (embedding('text-embedding-005', description)) STORED );Se necessario, puoi visualizzare i log e risolvere i problemi relativi agli errori.
Esegui la seguente query per creare una tabella
product_inventoryche memorizza le informazioni sull'inventario disponibile e sui prezzi corrispondenti. Le tabelleproduct_inventoryeproductvengono utilizzate in questo tutorial per eseguire query di ricerca vettoriale complesse.CREATE TABLE product_inventory ( id INT PRIMARY KEY, product_id INT REFERENCES product(id), inventory INT, price DECIMAL(10,2) );Esegui la seguente query per inserire i dati dei prodotti nella tabella
product:INSERT INTO product (id, name, description,category, color) VALUES (1, 'Stuffed Elephant', 'Soft plush elephant with floppy ears.', 'Plush Toys', 'Gray'), (2, 'Remote Control Airplane', 'Easy-to-fly remote control airplane.', 'Vehicles', 'Red'), (3, 'Wooden Train Set', 'Classic wooden train set with tracks and trains.', 'Vehicles', 'Multicolor'), (4, 'Kids Tool Set', 'Toy tool set with realistic tools.', 'Pretend Play', 'Multicolor'), (5, 'Play Food Set', 'Set of realistic play food items.', 'Pretend Play', 'Multicolor'), (6, 'Magnetic Tiles', 'Set of colorful magnetic tiles for building.', 'Construction Toys', 'Multicolor'), (7, 'Kids Microscope', 'Microscope for kids with different magnification levels.', 'Educational Toys', 'White'), (8, 'Telescope for Kids', 'Telescope designed for kids to explore the night sky.', 'Educational Toys', 'Blue'), (9, 'Coding Robot', 'Robot that teaches kids basic coding concepts.', 'Educational Toys', 'White'), (10, 'Kids Camera', 'Durable camera for kids to take pictures and videos.', 'Electronics', 'Pink'), (11, 'Walkie Talkies', 'Set of walkie talkies for kids to communicate.', 'Electronics', 'Blue'), (12, 'Karaoke Machine', 'Karaoke machine with built-in microphone and speaker.', 'Electronics', 'Black'), (13, 'Kids Drum Set', 'Drum set designed for kids with adjustable height.', 'Musical Instruments', 'Blue'), (14, 'Kids Guitar', 'Acoustic guitar for kids with nylon strings.', 'Musical Instruments', 'Brown'), (15, 'Kids Keyboard', 'Electronic keyboard with different instrument sounds.', 'Musical Instruments', 'Black'), (16, 'Art Easel', 'Double-sided art easel with chalkboard and whiteboard.', 'Arts & Crafts', 'White'), (17, 'Finger Paints', 'Set of non-toxic finger paints for kids.', 'Arts & Crafts', 'Multicolor'), (18, 'Modeling Clay', 'Set of colorful modeling clay.', 'Arts & Crafts', 'Multicolor'), (19, 'Watercolor Paint Set', 'Watercolor paint set with brushes and palette.', 'Arts & Crafts', 'Multicolor'), (20, 'Beading Kit', 'Kit for making bracelets and necklaces with beads.', 'Arts & Crafts', 'Multicolor'), (21, '3D Puzzle', '3D puzzle of a famous landmark.', 'Puzzles', 'Multicolor'), (22, 'Race Car Track Set', 'Race car track set with cars and accessories.', 'Vehicles', 'Multicolor'), (23, 'RC Monster Truck', 'Remote control monster truck with oversized tires.', 'Vehicles', 'Green'), (24, 'Train Track Expansion Set', 'Expansion set for wooden train tracks.', 'Vehicles', 'Multicolor');(Facoltativo) Esegui la seguente query per verificare che i dati siano stati inseriti nella tabella
product:SELECT * FROM product;Esegui la seguente query per inserire i dati di inventario nella tabella
product_inventory:INSERT INTO product_inventory (id, product_id, inventory, price) VALUES (1, 1, 9, 13.09), (2, 2, 40, 79.82), (3, 3, 34, 52.49), (4, 4, 9, 12.03), (5, 5, 36, 71.29), (6, 6, 10, 51.49), (7, 7, 7, 37.35), (8, 8, 6, 10.87), (9, 9, 7, 42.47), (10, 10, 3, 24.35), (11, 11, 4, 10.20), (12, 12, 47, 74.57), (13, 13, 5, 28.54), (14, 14, 11, 25.58), (15, 15, 21, 69.84), (16, 16, 6, 47.73), (17, 17, 26, 81.00), (18, 18, 11, 91.60), (19, 19, 8, 78.53), (20, 20, 43, 84.33), (21, 21, 46, 90.01), (22, 22, 6, 49.82), (23, 23, 37, 50.20), (24, 24, 27, 99.27);Esegui la seguente query di ricerca vettoriale che tenta di trovare prodotti simili alla parola
music. Ciò significa che, anche se la parolamusicnon è menzionata esplicitamente nella descrizione del prodotto, il risultato mostra i prodotti pertinenti alla query:SELECT * FROM product ORDER BY embedding <=> embedding('text-embedding-005', 'music')::vector LIMIT 3;Il risultato della query è il seguente:

L'esecuzione di una ricerca vettoriale di base senza creare un indice utilizza la ricerca esatta del vicino più prossimo (KNN), che fornisce un richiamo efficiente. Su larga scala, l'utilizzo di KNN potrebbe influire sulle prestazioni. Per prestazioni migliori delle query, ti consigliamo di utilizzare l'indice ScaNN per la ricerca approssimativa del vicino più prossimo (ANN), che fornisce un richiamo elevato con latenze ridotte.
Senza creare un indice, AlloyDB Omni utilizza per impostazione predefinita la ricerca esatta del vicino più prossimo (KNN).
Per saperne di più sull'utilizzo di ScaNN su larga scala, consulta Iniziare a utilizzare il vector embedding con l'AI di AlloyDB.
Crea un indice ScaNN ottimizzato manualmente nella tabella dei prodotti
Esegui la seguente query per creare un indice ScaNN product_index nella tabella product:
CREATE INDEX product_index ON product
USING scann (embedding cosine)
WITH (mode='MANUAL', num_leaves=4);
Per saperne di più sulla creazione di un indice ScaNN, consulta Crea un indice ScaNN.
Esegui una ricerca vettoriale
Esegui la seguente query di ricerca vettoriale che tenta di trovare prodotti simili alla query in linguaggio naturale
music. Anche se la parola music non è inclusa nella
descrizione del prodotto, il risultato mostra i prodotti pertinenti alla query:
SET LOCAL scann.num_leaves_to_search = 2;
SELECT * FROM product
ORDER BY embedding <=> embedding('text-embedding-005', 'music')::vector
LIMIT 3;
I risultati della query sono i seguenti:

Il parametro della query scann.num_leaves_to_search controlla il numero di nodi foglia cercati durante una ricerca di similarità. I valori dei parametri num_leaves e
scann.num_leaves_to_search consentono di raggiungere un equilibrio tra
prestazioni e richiamo.
Esegui una ricerca vettoriale che utilizza un filtro e un join
Puoi eseguire query di ricerca vettoriale filtrate in modo efficiente anche quando utilizzi l'indice ScaNN. Esegui la seguente query di ricerca vettoriale complessa, che restituisce risultati pertinenti che soddisfano le condizioni della query, anche con i filtri:
SET LOCAL scann.num_leaves_to_search = 2;
SELECT * FROM product p
JOIN product_inventory pi ON p.id = pi.product_id
WHERE pi.price < 80.00
ORDER BY embedding <=> embedding('text-embedding-005', 'music')::vector
LIMIT 3;
Accelera la ricerca vettoriale filtrata
Puoi utilizzare l'archivio di contenuti del motore colonnare per migliorare il rendimento delle ricerche di similarità vettoriale, in particolare le ricerche del vicino più prossimo (KNN), se combinate con il filtraggio dei predicati altamente selettivo, ad esempio utilizzando LIKE, nei database. In questa sezione, utilizzi l'estensione vector e
l'estensione
google_columnar_engine di AlloyDB Omni.
Per saperne di più sul funzionamento del motore colonnare, consulta
Panoramica del motore colonnare.
I miglioramenti del rendimento derivano dall'efficienza integrata del motore colonnare nella scansione di set di dati di grandi dimensioni e nell'applicazione di filtri, come i predicati LIKE, unita alla sua capacità, grazie al supporto vettoriale, di prefiltrare le righe. Questa funzionalità riduce il numero di sottoinsiemi di dati necessari per i calcoli successivi della distanza vettoriale KNN e aiuta a ottimizzare le query analitiche complesse che coinvolgono il filtraggio standard e la ricerca vettoriale.
L'archivio colonnare offre due opzioni per gestire i suoi contenuti:
- Gestisci automaticamente i contenuti dell'archivio colonnare: le nuove istanze di AlloyDB Omni utilizzano per impostazione predefinita la columnarizzazione automatica. In alternativa, puoi eseguire manualmente la funzionalità di columnarizzazione automatica.
- Gestisci manualmente i contenuti dell'archivio colonnare: se devi gestire manualmente le colonne nell'archivio colonnare per il tuo carico di lavoro, puoi disattivare la columnarizzazione automatica.
Per confrontare il tempo di esecuzione di una ricerca vettoriale KNN filtrata da un predicato LIKE prima e dopo l'attivazione del motore colonnare, segui questi passaggi:
-
Abilita l'estensione
vectorper supportare i tipi di dati e le operazioni vettoriali. Esegui le seguenti istruzioni per creare una tabella di esempio (items) con un ID, una descrizione di testo e una colonna di embedding vettoriale a 512 dimensioni.CREATE EXTENSION IF NOT EXISTS vector; CREATE TABLE items ( id SERIAL PRIMARY KEY, description TEXT, embedding VECTOR(512) );
-
Popola i dati eseguendo le seguenti istruzioni per inserire 1 milione righe nella tabella di esempio
items.-- Simplified example of inserting matching (~0.1%) and non-matching data INSERT INTO items (description, embedding) SELECT CASE WHEN g % 1000 = 0 THEN 'product_' || md5(random()::text) || '_common' -- ~0.1% match ELSE 'generic_item_' || g || '_' || md5(random()::text) -- ~99.9% don't match END, (SELECT array_agg(random()) FROM generate_series(1, 512))::vector FROM generate_series(1, 999999) g;
-
Misura il rendimento di base della ricerca di similarità vettoriale senza il motore colonnare.
SELECT id, description, embedding <-> '[...]' AS distance FROM items WHERE description LIKE '%product_%_common%' ORDER BY embedding <-> '[...]' LIMIT 100;
-
Abilita il motore colonnare e il supporto vettoriale.
-
Abilita i
google_columnar_engine.enabledegoogle_columnar_engine.enable_vector_supportflag di database.ALTER SYSTEM SET google_columnar_engine.enabled = 'on'; ALTER SYSTEM SET google_columnar_engine.enable_vector_support = 'on';
-
Riavvia AlloyDB Omni
systemctl restart alloydbomni18
-
-
Aggiungi la tabella
itemsal motore colonnare:SELECT google_columnar_engine_add('items');
-
Misura il rendimento della ricerca di similarità vettoriale utilizzando il motore colonnare. Esegui di nuovo la query che hai eseguito in precedenza per misurare il rendimento di base
SELECT id, description, embedding <-> '[...]' AS distance FROM items WHERE description LIKE '%product_%_common%' ORDER BY embedding <-> '[...]' LIMIT 100;
-
Per verificare se la query è stata eseguita con il motore colonnare, esegui il seguente comando:
explain (analyze) SELECT id, description, embedding <-> '[...]' AS distance FROM items WHERE description LIKE '%product_%_common%' ORDER BY embedding <-> '[...]' LIMIT 100;
Libera spazio
Per disinstallare AlloyDB Omni, consulta Gestisci e monitora AlloyDB Omni.