Panoramica di Vector Assist

Select a documentation version:

Vector assist è un'estensione di AlloyDB Omni che semplifica il deployment e la gestione dei workload vettoriali. Fornisce un framework SQL dichiarativo che ti aiuta a configurare funzionalità di ricerca vettoriale pronte per la produzione, come la generazione di embedding, l'ottimizzazione delle query e la creazione di indici. Questo framework riduce la complessità dei workload vettoriali:

  • Semplificando la dichiarazione dell'intento: i requisiti (come tabella, colonna di testo o richiamo target) vengono dichiarati utilizzando le funzioni SQL.
  • Automatizzando le best practice: genera comandi SQL ottimizzati, noti anche come consigli, per configurare il workload vettoriale utilizzando la specifica vettoriale definita e un algoritmo di ottimizzazione automatica ottimizzato che calcola la configurazione ottimale dell'indice.
  • Fornendo trasparenza e controllo: fornisce spiegazioni chiare per ogni consiglio durante l'automazione delle attività che ti consentono di esaminare, modificare e applicare i consigli al tuo ritmo.
  • Consentendo la prototipazione rapida: ti consente di eseguire rapidamente il deployment di una configurazione di ricerca vettoriale ottimizzata, riducendo il tempo che intercorre tra il concetto e la produzione.
  • Concentrandosi sulla facilità d'uso: semplifica la complessità della ricerca semantica, colmando il divario tra i requisiti aziendali e di progettazione.

Con Vector assist, puoi creare applicazioni end-to-end con funzionalità di ricerca semantica con una configurazione semplificata.

Come funziona Vector assist

Vector assist richiede di definire le specifiche vettoriali. Il framework utilizza queste specifiche vettoriali, note anche come specifiche vettoriali, per generare i passaggi necessari per creare un indice vettoriale. Vector assist restituisce i passaggi necessari per eseguire il deployment del workload vettoriale come consigli. Ogni volta che modifichi le specifiche vettoriali, Vector assist rigenera i consigli.

Dopo aver generato l'indice vettoriale utilizzando questi passaggi consigliati, puoi utilizzare Vector assist per generare query di ricerca ottimizzate.

Specifiche di Vector assist

La configurazione delle specifiche dell'indice vettoriale, o specifiche vettoriali, è il primo passo per utilizzare Vector assist. Una specifica vettoriale è un oggetto in cui definisci l'intento e i requisiti del workload vettoriale. Include tutte le informazioni necessarie, tra cui:

  • Tabelle e colonne pertinenti (testo o vettore)
  • Preferenze del modello di embedding (se utilizzi la generazione di embedding)
  • Tipo di indice preferito: HNSW o IVFFlat. ScaNN non è supportato.
  • Richiamo target per le query di ricerca
  • Limitazioni di memoria

Definisci le specifiche vettoriali utilizzando la vector_assist.define_spec funzione e puoi modificarle in qualsiasi momento. Il sistema assegna a ogni specifica un ID univoco e lo memorizza in una tabella denominata vector_assist.VECTOR_SPECS.

Vector assist deduce gli input delle specifiche e un algoritmo di ottimizzazione automatica ottimizzato che calcola la configurazione ottimale dell'indice. Sebbene Vector assist utilizzi questi valori per semplificare il processo di sviluppo, puoi comunque personalizzarli in base alle tue preferenze.

Consigli di Vector assist

Dopo aver definito le specifiche vettoriali, Vector assist elabora l'input e genera consigli. Questi consigli sono un elenco ordinato di passaggi utili, in genere comandi SQL, che devi eseguire per eseguire il deployment del workload vettoriale in base alle specifiche. Ogni consiglio include:

  • La query SQL da eseguire.
  • Una spiegazione dettagliata di cosa fa la query e perché è consigliata.
  • Informazioni su potenziali compromessi o costi, come le dimensioni stimate dell'indice o il tempo di compilazione.

Vector assist memorizza i consigli in una tabella denominata vector_assist.RECOMMENDATIONS e puoi esaminarli, modificarli e applicarli singolarmente o nel complesso.

Ogni volta che modifichi le specifiche vettoriali per il workload, Vector assist rigenera i consigli in modo che siano conformi alle specifiche aggiornate.

Limitazioni

Quando utilizzi Vector assist con le istanze AlloyDB Omni, tieni presente le seguenti limitazioni:

  • Vector assist supporta solo le versioni 17 e successive di PostgreSQL.
  • Sebbene Vector assist supporti tutte le versioni di pgvector, ti consigliamo di utilizzare la versione più recente per prestazioni e supporto delle funzionalità ottimali. Per ulteriori informazioni, consulta il pgvector log delle modifiche.
  • Se l'istanza utilizza l'estensione google_ml_integration per generare gli embedding, le relative limitazioni si applicano anche quando utilizzi Vector assist. Per ulteriori informazioni, consulta la panoramica Registra e chiama modelli di AI remoti in AlloyDB Omni.
  • Vector assist supporta solo i tipi di indice HNSW e IVFFlat. I tipi di indice ScaNN non sono supportati.
  • Vector assist supporta solo i modelli di text embedding per la generazione automatica di embedding e utilizza text_column_name come parametro di input. Se il workload vettoriale richiede un modello di embedding multimodale, utilizza l'estensione google_ml_integration o un'altra estensione per generare manualmente questi embedding prima di utilizzare Vector assist per abilitare la ricerca semantica su questi embedding.

Passaggi successivi