Questa pagina documenta la versione 15.12.0 di AlloyDB Omni utilizzando l'opzione di deployment Kubernetes. Scegli un'altra opzione di implementazione.

Crea applicazioni di AI generativa utilizzando AlloyDB AI

Seleziona una versione della documentazione:

AlloyDB AI è una suite di funzionalità incluse in AlloyDB per PostgreSQL e AlloyDB Omni che ti consentono di applicare la potenza semantica e predittiva dei modelli di machine learning (ML) ai tuoi dati. Questa pagina fornisce una panoramica delle funzioni di AI basate sul machine learning disponibili tramite AlloyDB.

Archivia, indicizza ed esegui query sui vettori

L'estensione pgvector PostgreSQL è personalizzata per AlloyDB e viene chiamata vector. Supporta l'archiviazione degli embedding generati in una colonna vettoriale. L'estensione aggiunge anche il supporto della funzionalità di quantizzazione scalare per creare indici IVF. Puoi anche creare un indice IVFFlat o HSNW disponibile con le azioni pgvector.

Per saperne di più sull'archiviazione dei vettori, consulta Archiviazione di vector embedding.

Oltre all'estensione vector personalizzata, AlloyDB include l'estensione alloydb_scann che implementa un indice di ricerca dei vicini più prossimi altamente efficiente basato sull'algoritmo ScaNN.

Per saperne di più sulla creazione di indici e sull'esecuzione di query sui vettori, consulta Creare indici ed eseguire query sui vettori.

Ottimizzare il rendimento delle query vettoriali

Puoi ottimizzare gli indici per trovare un equilibrio tra query al secondo (QPS) e richiamo con le tue query. Per ulteriori informazioni sull'ottimizzazione degli indici, consulta Ottimizzare le prestazioni delle query sui vettori.

Generare embedding e previsioni di testo

AlloyDB AI estende la sintassi PostgreSQL con due funzioni per interrogare i modelli utilizzando l'estensione google_ml_integration:

Richiama le previsioni per chiamare un modello utilizzando SQL all'interno di una transazione.
Genera incorporamenti per consentire a un LLM di tradurre i prompt di testo in vettori numerici.

Puoi utilizzare la funzione embedding() per eseguire query sui modelli Vertex AI, mentre la funzione google_ml.embedding() può essere utilizzata per eseguire query sui modelli registrati di Vertex AI, ospitati e di terze parti.

Puoi quindi applicare questi incorporamenti vettoriali come input alle funzioni pgvector. Sono inclusi metodi per confrontare e ordinare campioni di testo in base alla loro distanza semantica relativa.

Utilizzare i modelli nel cloud con Vertex AI

Puoi configurare AlloyDB Omni per funzionare con Vertex AI.

Ciò offre i seguenti vantaggi alle tue applicazioni:

Le tue applicazioni possono richiamare le previsioni utilizzando qualsiasi modello archiviato in Vertex AI Model Garden a cui hanno accesso.
Le tue applicazioni possono generare embedding utilizzando l'LLM dei text-embedding-005modelli in inglese.