Archivia, indicizza ed esegui query sui vettori
L'estensione pgvector di PostgreSQL
è personalizzata per AlloyDB e viene chiamata vector.
Supporta l'archiviazione degli embedding generati in una colonna vettoriale. L'estensione aggiunge anche il supporto per la funzionalità di quantizzazione scalare per creare indici IVF. Puoi anche creare un indice IVFFlat o un indice HSNW disponibili con pgvector.
Per saperne di più sull'archiviazione dei vettori, consulta Archiviare gli embedding vettoriali.
Oltre all'estensione personalizzata vector, AlloyDB
include l'estensione alloydb_scann che implementa un indice di vicini più vicini altamente efficiente
basato sull'algoritmo ScaNN.
Per saperne di più sulla creazione di indici e sull'esecuzione di query sui vettori, consulta Creare indici ed eseguire query sui vettori.
Ottimizzare il rendimento delle query vettoriali
Puoi ottimizzare gli indici per bilanciare le query al secondo (QPS) e il richiamo con le query. Per saperne di più sull'ottimizzazione degli indici, consulta Ottimizzare il rendimento delle query vettoriali.
Generare embedding e previsioni di testo
AlloyDB AI estende la sintassi di PostgreSQL con due funzioni per eseguire query sui modelli utilizzando l'estensione google_ml_integration:
Richiama le previsioni per chiamare un modello utilizzando SQL all'interno di una transazione.
Genera embedding per consentire a un LLM di tradurre i prompt di testo in vettori numerici.
Puoi utilizzare la
embedding()funzione per eseguire query sui modelli Vertex AI, mentre lagoogle_ml.embedding()funzione può essere utilizzata per eseguire query sui modelli registrati di Vertex AI, ospitati e di terze parti.Puoi quindi applicare questi embedding vettoriali come input alle funzioni
pgvector. Sono inclusi i metodi per confrontare e ordinare i campioni di testo in base alla loro distanza semantica relativa.
Utilizzare i modelli nel cloud con Vertex AI
Puoi configurare AlloyDB Omni in modo che funzioni con Vertex AI.
In questo modo, le tue applicazioni avranno i seguenti vantaggi:
Le applicazioni possono richiamare le previsioni utilizzando qualsiasi modello archiviato in Vertex AI Model Garden a cui hanno accesso.
Le applicazioni possono generare embedding utilizzando l'LLM
text-embedding-005dei modelli in inglese.