- Semplificando la dichiarazione dell'intento: i requisiti (come tabella, colonna di testo o richiamo target) vengono dichiarati utilizzando le funzioni SQL.
- Automatizzando le best practice: genera comandi SQL ottimizzati, noti anche come consigli, per configurare il workload vettoriale utilizzando la specifica vettoriale definita e un algoritmo di ottimizzazione automatica ottimizzato che calcola la configurazione ottimale dell'indice.
- Fornendo trasparenza e controllo: fornisce spiegazioni chiare per ogni consiglio durante l'automazione delle attività che ti consentono di esaminare, modificare e applicare i consigli al tuo ritmo.
- Consentendo la prototipazione rapida: ti consente di eseguire rapidamente il deployment di una configurazione di ricerca vettoriale ottimizzata, riducendo il tempo che intercorre tra il concetto e la produzione.
- Concentrandosi sulla facilità d'uso: semplifica la complessità della ricerca semantica, colmando il divario tra i requisiti aziendali e di progettazione.
Con Vector assist, puoi creare applicazioni end-to-end con funzionalità di ricerca semantica con una configurazione semplificata.
Come funziona Vector assist
Vector assist richiede di definire le specifiche vettoriali. Il framework utilizza queste specifiche vettoriali, note anche come specifiche vettoriali, per generare i passaggi necessari per creare un indice vettoriale. Vector assist restituisce i passaggi necessari per eseguire il deployment del workload vettoriale come consigli. Ogni volta che modifichi le specifiche vettoriali, Vector assist rigenera i consigli.
Dopo aver generato l'indice vettoriale utilizzando questi passaggi consigliati, puoi utilizzare Vector assist per generare query di ricerca ottimizzate.
Specifiche di Vector assist
La configurazione delle specifiche dell'indice vettoriale, o specifiche vettoriali, è il primo passo per utilizzare Vector assist. Una specifica vettoriale è un oggetto in cui definisci l'intento e i requisiti del workload vettoriale. Include tutte le informazioni necessarie, tra cui:
- Tabelle e colonne pertinenti (testo o vettore)
- Preferenze del modello di embedding (se utilizzi la generazione di embedding)
- Tipo di indice preferito:
HNSWoIVFFlat.ScaNNnon è supportato. - Richiamo target per le query di ricerca
- Limitazioni di memoria
Definisci le specifiche vettoriali utilizzando la
vector_assist.define_spec
funzione e puoi modificarle in qualsiasi momento. Il sistema assegna a ogni specifica un ID univoco e lo memorizza in una tabella denominata vector_assist.VECTOR_SPECS.
Vector assist deduce gli input delle specifiche e un algoritmo di ottimizzazione automatica ottimizzato che calcola la configurazione ottimale dell'indice. Sebbene Vector assist utilizzi questi valori per semplificare il processo di sviluppo, puoi comunque personalizzarli in base alle tue preferenze.
Consigli di Vector assist
Dopo aver definito le specifiche vettoriali, Vector assist elabora l'input e genera consigli. Questi consigli sono un elenco ordinato di passaggi utili, in genere comandi SQL, che devi eseguire per eseguire il deployment del workload vettoriale in base alle specifiche. Ogni consiglio include:
- La query SQL da eseguire.
- Una spiegazione dettagliata di cosa fa la query e perché è consigliata.
- Informazioni su potenziali compromessi o costi, come le dimensioni stimate dell'indice o il tempo di compilazione.
Vector assist memorizza i consigli in una tabella denominata vector_assist.RECOMMENDATIONS e puoi esaminarli, modificarli e applicarli singolarmente o nel complesso.
Ogni volta che modifichi le specifiche vettoriali per il workload, Vector assist rigenera i consigli in modo che siano conformi alle specifiche aggiornate.
Limitazioni
Quando utilizzi Vector assist con le istanze AlloyDB Omni, tieni presente le seguenti limitazioni:
- Vector assist supporta solo le versioni 17 e successive di PostgreSQL.
- Sebbene Vector assist supporti tutte le versioni di
pgvector, ti consigliamo di utilizzare la versione più recente per prestazioni e supporto delle funzionalità ottimali. Per ulteriori informazioni, consulta ilpgvectorlog delle modifiche. - Se l'istanza utilizza l'estensione
google_ml_integrationper generare gli embedding, le relative limitazioni si applicano anche quando utilizzi Vector assist. Per ulteriori informazioni, consulta la panoramica Registra e chiama modelli di AI remoti in AlloyDB Omni. - Vector assist supporta solo i tipi di indice
HNSWeIVFFlat. I tipi di indiceScaNNnon sono supportati. - Vector assist supporta solo i modelli di text embedding per la generazione automatica di embedding e utilizza
text_column_namecome parametro di input. Se il workload vettoriale richiede un modello di embedding multimodale, utilizza l'estensionegoogle_ml_integrationo un'altra estensione per generare manualmente questi embedding prima di utilizzare Vector assist per abilitare la ricerca semantica su questi embedding.