Generare embedding multimodali

Puoi generare incorporamenti multimodali in AlloyDB per PostgreSQL utilizzando il modello multimodale della piattaforma di agenti Gemini Enterprise supportato, multimodalembedding@001.

Puoi utilizzare i modelli di embedding multimodali di Agent Platform indicati in Modelli supportati.

Questa pagina presuppone che tu abbia familiarità con AlloyDB per PostgreSQL e con i concetti di AI generativa. Per saperne di più, consulta Che cosa sono gli incorporamenti.

Prima di iniziare

Prima di utilizzare gli incorporamenti multimodali:

Integrare Agent Platform e installare l'estensione

  1. Configura l'accesso utente ai modelli di Agent Platform.
  2. Verifica che sia installata l'ultima versione di google_ml_integration.
    1. Per controllare la versione installata, esegui questo comando:

      SELECT extversion FROM pg_extension WHERE extname = 'google_ml_integration';
      extversion 
      ------------
      1.5.2
      (1 row)
    2. Se l'estensione non è installata o se la versione installata è precedente alla 1.5.2, aggiornala.

      CREATE EXTENSION IF NOT EXISTS google_ml_integration;
      ALTER EXTENSION google_ml_integration UPDATE;

      Se riscontri problemi durante l'esecuzione dei comandi precedenti o se l'estensione non viene aggiornata alla versione 1.5.2 dopo l'esecuzione dei comandi precedenti, contatta l'Google Cloud assistenza.

  3. Per utilizzare la funzionalità del motore di query AlloyDB AI, imposta il flag google_ml_integration.enable_ai_query_engine su on.

    SQL

    1. Attiva il motore di query AI per la sessione corrente.
      SET google_ml_integration.enable_ai_query_engine = on;
    2. Attiva le funzionalità per un database specifico in più sessioni.
      ALTER DATABASE DATABASE_NAME SET google_ml_integration.enable_ai_query_engine = 'on';
    3. Attiva il motore di query AI per un utente specifico in tutte le sessioni e i database.
      ALTER ROLE postgres SET google_ml_integration.enable_ai_query_engine = 'on';

    Console

    Per modificare il valore del flag google_ml_integration.enable_ai_query_engine, segui i passaggi descritti in Configurare i flag di database di un'istanza.

    gcloud

    Per utilizzare gcloud CLI, puoi installare e inizializzare Google Cloud CLI oppure puoi utilizzare Cloud Shell.

    Puoi modificare il valore del flag google_ml_integration.enable_ai_query_engine. Per saperne di più, consulta Configurare i flag di database di un'istanza.

    gcloud alloydb instances update INSTANCE_ID \
      --database-flags google_ml_integration.enable_ai_query_engine=on \
      --region=REGION_ID \
      --cluster=CLUSTER_ID \
      --project=PROJECT_ID

Accedere ai dati in Cloud Storage per generare incorporamenti multimodali

  • Per generare incorporamenti multimodali, fai riferimento ai contenuti in Cloud Storage utilizzando un URI gs://.
  • Accedi ai contenuti di Cloud Storage tramite l'agente di servizio Agent Platform del progetto attuale. Per impostazione predefinita, il service agent Agent Platform ha già l'autorizzazione per accedere al bucket nello stesso progetto. Per saperne di più, consulta l'indice di ruoli e autorizzazioni IAM.
  • Per accedere ai dati in un bucket Cloud Storage in un altro progetto Google Cloud , esegui il seguente comando gcloud CLI per concedere il ruolo Visualizzatore oggetti Storage (roles/storage.objectViewer) all'agente di servizio Agent Platform del tuo progetto AlloyDB.

    gcloud projects add-iam-policy-binding <ANOTHER_PROJECT_ID> \
    --member="serviceAccount:service-<PROJECT_ID>@gcp-sa-aiplatform.iam.gserviceaccount.com" \
    --role="roles/storage.objectViewer"

    Per saperne di più, consulta Impostare e gestire le policy IAM sui bucket.

Per generare incorporamenti multimodali, seleziona uno dei seguenti schemi.

Generare embedding multimodali

Per generare embedding di testo per un endpoint del modello multimodalembedding@001, esegui la seguente istruzione:

SELECT
  ai.text_embedding(
    model_id => 'multimodalembedding@001',
    content => 'TEXT');

Sostituisci TEXT con il testo per cui generare l'incorporamento.

Per generare embedding di immagini per un endpoint del modello multimodalembedding@001 registrato in cui il tipo MIME dell'immagine è image/jpeg predefinito, esegui la seguente istruzione:

SELECT
  ai.image_embedding(
    model_id => 'multimodalembedding@001',
    image => 'IMAGE_PATH_OR_TEXT',
    mimetype => MIMETYPE');

Sostituisci quanto segue:

  • IMAGE_PATH_OR_TEXT con l'URI Cloud Storage dell'immagine, ad esempio gs://my-bucket/embeddings/flowers.jpeg, o la stringa base64 dell'immagine.
  • MIMETYPE con il tipo MIME dell'immagine, ad esempio image/jpeg. Per l'elenco completo dei tipi MIME supportati, consulta l'API Multimodal Embeddings.

Per generare embedding video per un endpoint del modello multimodalembedding@001 registrato, esegui la seguente istruzione:

SELECT
  ai.video_embedding(
    model_id => 'multimodalembedding@001',
    video => 'VIDEO_URI');

Sostituisci VIDEO_URI con l'URI Cloud Storage del video di destinazione, ad esempio gs://my-bucket/embeddings/supermarket-video.mp4, o la stringa base64 del video. Si tratta di array bidimensionali a cui è possibile accedere come sintassi my_array[0][5]. Per saperne di più, consulta la sezione Array.

Passaggi successivi