Questa pagina descrive come richiamare le previsioni o generare embedding utilizzando un modello e poi registrare l'endpoint del modello con la gestione degli endpoint del modello.
Prima di iniziare
- Se l'endpoint del modello richiede l'autenticazione, abilita l'estensione
google_ml_integration.
- In base al provider del modello, configura l'autenticazione.
- Assicurati di utilizzare il nome utente predefinito
postgresper accedere al database.
Abilitare l'estensione
Imposta il flag di database
google_ml_integration.enable_model_supportsuonper l'istanza. Per ulteriori informazioni sull'impostazione dei flag di database, consulta Configurare i flag di database.Connettiti all'istanza principale utilizzando un client
psqlo Cloud SQL Studio.Esegui il comando seguente per assicurarti che l'estensione
google_ml_integrationsia aggiornata alla versione 1.4.2:ALTER EXTENSION google_ml_integration UPDATE TO '1.4.2'Aggiungi l'estensione
google_ml_integrationversione 1.4.2 utilizzandopsql:CREATE EXTENSION google_ml_integration VERSION '1.4.2';(Facoltativo) Concedi l'autorizzazione a un utente PostgreSQL non superutente per gestire i metadati del modello:
GRANT SELECT, INSERT, UPDATE, DELETE ON ALL TABLES IN SCHEMA google_ml TO NON_SUPER_USER;Sostituisci
NON_SUPER_USERcon il nome utente PostgreSQL non superutente.
Configurare l'autenticazione
Le sezioni seguenti mostrano come configurare l'autenticazione prima di aggiungere un endpoint del modello Vertex AI o endpoint del modello ospitati all'interno Google Cloud.
Configurare l'autenticazione per Vertex AI
Per utilizzare gli endpoint del modello Google Vertex AI, devi aggiungere le autorizzazioni Vertex AI al account di servizio Cloud SQL basato su IAM che utilizzi per connetterti al database. Per ulteriori informazioni sull' integrazione con Vertex AI, consulta Integrare Cloud SQL con Vertex AI.
Configurare l'autenticazione per i modelli ospitati dal cliente
Questa sezione spiega come configurare l'autenticazione se utilizzi Secret Manager. Per tutti i modelli, ad eccezione degli endpoint del modello Vertex AI, puoi archiviare le tue chiavi API o i token di autenticazione in Secret Manager.
Se l'endpoint del modello non gestisce l'autenticazione tramite Secret Manager, questa sezione è facoltativa. Ad esempio, se l'endpoint del modello utilizza le intestazioni HTTP per trasmettere le informazioni di autenticazione o non utilizza affatto l'autenticazione, non completare i passaggi in questa sezione.
Per creare e utilizzare una chiave API o un token di autenticazione, completa i seguenti passaggi:
Crea un secret in Secret Manager. Per ulteriori informazioni, consulta Creare un secret e accedere a una versione del secret.
Il nome e il percorso del secret vengono utilizzati nella
google_ml.create_sm_secret()funzione SQL.Concedi all'istanza Cloud SQL le autorizzazioni per accedere al secret.
gcloud secrets add-iam-policy-binding SECRET_ID \ --member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \ --role="roles/secretmanager.secretAccessor"Sostituisci quanto segue:
SECRET_ID: l'ID del secret in Secret Manager.SERVICE_ACCOUNT_EMAIL: l'indirizzo email del account di servizio Cloud SQL basato su IAM. Per trovare questo indirizzo email, utilizza ilgcloud sql instances describe INSTANCE_NAMEcomando e sostituisci INSTANCE_NAME con il nome dell'istanza. Il valore visualizzato accanto al parametroserviceAccountEmailAddressè l'indirizzo email.
Modelli di text embedding con supporto integrato
Questa sezione mostra come registrare gli endpoint del modello per la gestione degli endpoint del modello.
Modelli di embedding Vertex AI
La gestione degli endpoint del modello fornisce il supporto integrato per tutte le versioni dei
text-embedding-gecko, text-embedding, e gemini-embedding modelli di
Vertex AI. Utilizza il nome completo per impostare la versione del modello su textembedding-gecko@001 o textembedding-gecko@002.
Poiché gli ID degli endpoint del modello di embedding Vertex AI sono supportati per impostazione predefinita dalla gestione degli endpoint del modello, puoi utilizzarli direttamente come ID del modello. Per questi modelli, l'estensione configura automaticamente le funzioni di trasformazione predefinite.
Assicurati che sia l'istanza Cloud SQL sia il modello Vertex AI su cui stai eseguendo query si trovino nella stessa regione.
Per registrare l'endpoint del modello textembedding-gecko@002, chiama la funzione create_model:
CALL
google_ml.create_model(
model_id => 'textembedding-gecko@002',
model_provider => 'google',
model_qualified_name => 'textembedding-gecko@002',
model_type => 'text_embedding',
model_auth_type => 'cloudsql_service_agent_iam');
Modelli di text embedding ospitati dal cliente
Questa sezione mostra come registrare gli endpoint del modello personalizzato ospitati in reti all'interno di Google Cloud.
L'aggiunta di endpoint del modello di text embedding ospitati dal cliente comporta la creazione di funzioni di trasformazione e, facoltativamente, di intestazioni HTTP personalizzate. D'altra parte, l'aggiunta di endpoint del modello generico ospitati dal cliente comporta, facoltativamente, la generazione di intestazioni HTTP personalizzate e l'impostazione dell'URL della richiesta del modello.
L'esempio seguente aggiunge l'endpoint del modello di text embedding custom-embedding-model ospitato da
Cymbal, che è ospitato all'interno di Google Cloud. Le funzioni di trasformazione cymbal_text_input_transform e cymbal_text_output_transform vengono utilizzate per trasformare il formato di input e output del modello nel formato di input e output della funzione di previsione.
Per registrare gli endpoint del modello di text embedding ospitati dal cliente, completa i seguenti passaggi:
Chiama il secret archiviato in Secret Manager:
CALL google_ml.create_sm_secret( secret_id => 'SECRET_ID', secret_path => 'projects/project-id/secrets/SECRET_MANAGER_SECRET_ID/versions/VERSION_NUMBER');Sostituisci quanto segue:
SECRET_ID: l'ID del secret che hai impostato e che viene utilizzato in seguito durante la registrazione di un endpoint del modello, ad esempiokey1.SECRET_MANAGER_SECRET_ID: l'ID del secret impostato in Secret Manager quando hai creato il secret.PROJECT_ID: l'ID del tuo Google Cloud progetto.VERSION_NUMBER: il numero di versione dell'ID del secret.
Crea le funzioni di trasformazione di input e output in base alla seguente firma per la funzione di previsione per gli endpoint del modello di text embedding. Per ulteriori informazioni su come creare funzioni di trasformazione, consulta Esempio di funzioni di trasformazione.
Di seguito sono riportate le funzioni di trasformazione di esempio specifiche per l'endpoint del modello di text embedding
custom-embedding-model:-- Input Transform Function corresponding to the custom model endpoint CREATE OR REPLACE FUNCTION cymbal_text_input_transform(model_id VARCHAR(100), input_text TEXT) RETURNS JSON LANGUAGE plpgsql AS $$ DECLARE transformed_input JSON; model_qualified_name TEXT; BEGIN SELECT json_build_object('prompt', json_build_array(input_text))::JSON INTO transformed_input; RETURN transformed_input; END; $$; -- Output Transform Function corresponding to the custom model endpoint CREATE OR REPLACE FUNCTION cymbal_text_output_transform(model_id VARCHAR(100), response_json JSON) RETURNS REAL[] LANGUAGE plpgsql AS $$ DECLARE transformed_output REAL[]; BEGIN SELECT ARRAY(SELECT json_array_elements_text(response_json->0)) INTO transformed_output; RETURN transformed_output; END; $$;Chiama la funzione di creazione del modello per registrare l'endpoint del modello di embedding personalizzato:
CALL
google_ml.create_model(
model_id => 'MODEL_ID',
model_request_url => 'REQUEST_URL',
model_provider => 'custom',
model_type => 'text_embedding',
model_auth_type => 'secret_manager',
model_auth_id => 'SECRET_ID',
model_qualified_name => 'MODEL_QUALIFIED_NAME',
model_in_transform_fn => 'cymbal_text_input_transform',
model_out_transform_fn => 'cymbal_text_output_transform');
Sostituisci quanto segue:
MODEL_ID: obbligatorio. Un ID univoco per l'endpoint del modello che definisci (ad esempio,custom-embedding-model). Questo ID del modello viene fatto riferimento per i metadati di cui l'endpoint del modello ha bisogno per generare embedding o richiamare le previsioni.REQUEST_URL: obbligatorio. L'endpoint specifico del modello quando si aggiungono endpoint del modello generico e di text embedding personalizzato, ad esempiohttps://cymbal.com/models/text/embeddings/v1. Assicurati che l'endpoint del modello sia accessibile tramite un indirizzo IP interno. La gestione degli endpoint del modello non supporta gli indirizzi IP esterni.MODEL_QUALIFIED_NAME: obbligatorio se l'endpoint del modello utilizza un nome completo. Il nome completo nel caso in cui l'endpoint del modello abbia più versioni.SECRET_ID: l'ID del secret che hai utilizzato in precedenza nella proceduragoogle_ml.create_sm_secret().
Modelli generici
Questa sezione mostra come registrare un endpoint del modello genericogemini-pro da Model Garden di Vertex AI, che non ha il supporto integrato.
Puoi registrare qualsiasi
endpoint del modello generico ospitato all'interno di Google Cloud.
Cloud SQL supporta solo gli endpoint del modello disponibili tramite Model Garden di Vertex AI e gli endpoint del modello ospitati in reti all'interno di Google Cloud.
Modello di Gemini
L'esempio seguente aggiunge l'endpoint del modello gemini-1.0-pro da Model Garden di Vertex AI.
Per registrare l'endpoint del modello gemini-1.0-pro, chiama la funzione create model:
CALL
google_ml.create_model(
model_id => 'MODEL_ID',
model_request_url => 'https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.0-pro:streamGenerateContent',
model_provider => 'google',
model_auth_type => 'cloudsql_service_agent_iam');
Sostituisci quanto segue:
MODEL_ID: un ID univoco per l'endpoint del modello che definisci (ad esempio,
gemini-1). Questo ID del modello viene fatto riferimento per i metadati di cui l'endpoint del modello ha bisogno per generare embedding o richiamare le previsioni.PROJECT_ID: l'ID del tuo Google Cloud progetto.
Per ulteriori informazioni, consulta la sezione su come richiamare le previsioni per gli endpoint del modello generico.
Passaggi successivi
- Scopri di più sulla documentazione di riferimento per la gestione degli endpoint del modello.