Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Integra Cloud SQL con Vertex AI

MySQL | PostgreSQL | SQL Server

Questa pagina descrive come integrare Cloud SQL con Vertex AI.

Questa integrazione consente di applicare modelli linguistici di grandi dimensioni (LLM), ospitati in Vertex AI, a un database Cloud SQL per SQL Server 2025.

Integrando Cloud SQL con Vertex AI, puoi applicare la potenza semantica e predittiva dei modelli di machine learning (ML) ai tuoi dati. Questa integrazione estende la sintassi SQL con la funzione generate embeddings per eseguire query sui modelli.

Utilizzi la funzione di generazione di embedding in modo che il modello di embedding possa tradurre i prompt di testo in vettori numerici. Puoi quindi applicare questi vector embedding come input ai tipi di dati vettoriali. Per ulteriori informazioni, consulta la documentazione di Microsoft sulla ricerca vettoriale e sugli indici vettoriali nel motore di database SQL.

Per saperne di più su Vertex AI, consulta Introduzione a Vertex AI.

Versioni ed edizioni del database supportate

L'integrazione di Vertex AI è supportata sia per le versioni Cloud SQL Enterprise Plus e Cloud SQL Enterprise sia per tutte le versioni del database di SQL Server 2025.

Tipi di modelli supportati

L'integrazione di Vertex AI con Cloud SQL supporta gli endpoint dei modelli dalle seguenti origini:

Vertex AI
Hugging Face
OpenAI

Prima di iniziare

Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Abilita le API Google Cloud necessarie.
Console
1. Vai alla pagina API e servizi.
2. Dall'elenco dei progetti, seleziona il tuo progetto.
3. Se la libreria API non è aperta, seleziona Libreria dal menu di navigazione.
4. Fai clic sulle API che vuoi abilitare. Per questa procedura, attiva le seguenti opzioni:
  - API Cloud SQL Admin
  - API Vertex AI
  - API Compute Engine
  - (Facoltativo) Se utilizzi un modello di terze parti, è necessaria l'API Secret Manager.
  Nota:se hai bisogno di aiuto per trovare queste API, utilizza il campo di ricerca.
5. Dopo aver selezionato ogni API, fai clic su Attiva.
gcloud
1. Apri Cloud Shell, che fornisce l'accesso da riga di comando alle tue risorse Google Cloud direttamente dal browser.
2. Per abilitare le API richieste, utilizza il comando gcloud services enable:
  gcloud services enable sqladmin.googleapis.com \ aiplatform.googleapis.com \ compute.googleapis.com \ secretmanager.googleapis.com

Concedi al account di servizio Cloud SQL le autorizzazioni Identity and Access Management (IAM) per accedere a Vertex AI.

gcloud

Per aggiungere le autorizzazioni Vertex AI al account di servizio Cloud SQL per il progetto in cui si trova l'istanza Cloud SQL, utilizza il comando gcloud projects add-iam-policy-binding:

gcloud projects add-iam-policy-binding PROJECT_ID \
--member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
--role="roles/aiplatform.user"

Esegui le seguenti sostituzioni:

PROJECT_ID: l'ID del progetto che ha l'endpoint Vertex AI. Cloud SQL utilizza questo endpoint per accedere al modello LLM ospitato in Vertex AI.
SERVICE_ACCOUNT_EMAIL: l'indirizzo email del account di servizio Cloud SQL.

Per trovare questo indirizzo email, utilizza il comando gcloud sql instances describe:
```
gcloud sql instances describe INSTANCE_NAME | grep EmailAddress
```
Sostituisci INSTANCE_NAME con il nome dell'istanza Cloud SQL.

Assicurati che all'utente Cloud SQL che lavora con i modelli di embedding vengano concesse le seguenti autorizzazioni del database:
- Per consentire a un utente del database di creare o modificare modelli, devi concedere all'utente Cloud SQL l'autorizzazione EXECUTE sulle seguenti stored procedure:
  - [msdb].gcloudsql_ml_create_external_model: crea un oggetto modello esterno che contiene la posizione, il metodo di autenticazione e lo scopo di un endpoint di inferenza del modello di AI.
  - [msdb].gcloudsql_ml_alter_external_model: consente di modificare l'oggetto modello esterno.
  - [msdb].gcloudsql_ml_drop_external_model: rimuove l'oggetto modello esterno dal database.
- Per chiamare le stored procedure elencate in precedenza, devi disporre delle seguenti autorizzazioni nel database di destinazione:
  - CREATE EXTERNAL MODEL
  - ALTER EXTERNAL MODEL
Se vuoi utilizzare un modello esterno di terze parti, devi disporre di una chiave API valida per il modello memorizzata in una posizione di Secret Manager accessibile all'istanza Cloud SQL.
Se utilizzi un modello esterno di terze parti, l'istanza Cloud SQL deve utilizzare un indirizzo IP pubblico. Le istanze con IP privato non possono accedere a modelli esterni di terze parti. L'accesso privato ai servizi e Private Service Connect sono supportati solo con l'integrazione di Vertex AI.

Abilitare l'integrazione del database con Vertex AI

Per abilitare l'integrazione del database con Vertex AI, completa i seguenti passaggi:

Crea o aggiorna un'istanza Cloud SQL in modo che possa integrarsi con Vertex AI.
gcloud

Crea l'istanza

Per creare l'istanza Cloud SQL, utilizza il comando gcloud sql instances create.
```
gcloud sql instances create INSTANCE_NAME \
--database-version=DATABASE_VERSION \
--tier=MACHINE_TYPE \
--region=REGION_NAME \
--enable-google-ml-integration
```
Effettua le seguenti sostituzioni:
- INSTANCE_NAME: il nome dell'istanza
- DATABASE_VERSION: la versione del database per l'istanza, ad esempio SQLSERVER_2025_ENTERPRISE.
- MACHINE_TYPE: il tipo di macchina per l'istanza, ad esempio db-perf-optimized-N-8..
- REGION_NAME: la regione dell'istanza, ad esempio us-central1.
Nota: per saperne di più su questi parametri, consulta Crea istanze.

Aggiorna l'istanza

Per aggiornare l'istanza, utilizza il comando gcloud sql instances patch.
```
gcloud sql instances patch INSTANCE_NAME \
--enable-google-ml-integration
```
Nota: per saperne di più sull'aggiornamento di un'istanza, consulta Modificare le istanze.
REST v1

Crea l'istanza

Utilizza questo esempio per creare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances:insert. Per informazioni sulle impostazioni delle istanze, inclusi i valori validi per una regione, vedi Impostazioni delle istanze.

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza.
- INSTANCE_NAME: il nome dell'istanza
- REGION_NAME: il nome della regione per l'istanza.
- DATABASE_VERSION: stringa enum della versione del database, ad esempio SQLSERVER_2025_ENTERPRISE.
- PASSWORD: la password per l'utente del database root.
- MACHINE_TYPE: stringa enum del tipo di macchina (livello), ad esempio db-custom-[CPUS]-[MEMORY_MBS]. Per saperne di più, consulta Livelli di macchine.
- EDITION_TYPE: la tua versione di Cloud SQL, ad esempio ENTERPRISE.
Nota: per saperne di più su questi parametri, consulta Crea istanze.

Devi includere anche l'oggetto enableGoogleMlIntegration nella richiesta. Imposta i seguenti parametri, se necessario:
- enableGoogleMlIntegration: quando questo parametro è impostato su true, le istanze Cloud SQL possono connettersi a Vertex AI per inoltrare richieste di previsioni in tempo reale e insight all'AI.
Metodo HTTP e URL:
POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances
Corpo JSON della richiesta:
{ "name": "INSTANCE_NAME", "region": "REGION_NAME", "databaseVersion": "DATABASE_VERSION", "rootPassword": "PASSWORD", "settings": { "tier": "MACHINE_TYPE", "edition": "EDITION_TYPE", "enableGoogleMlIntegration": "true" | "false" } }
Per inviare la richiesta, espandi una di queste opzioni:
curl (Linux, macOS o Cloud Shell)

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances"
PowerShell (Windows)

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances" | Select-Object -Expand Content
Dovresti ricevere una risposta JSON simile alla seguente:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_ID", "status": "PENDING", "user": "user@example.com", "insertTime": "2019-09-25T22:19:33.735Z", "operationType": "CREATE", "name": "OPERATION_ID", "targetId": "INSTANCE_ID", "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Aggiorna l'istanza

Utilizza questo esempio per aggiornare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances.patch.

Se questo aggiornamento modifica un valore che richiede un riavvio, viene visualizzato un prompt per procedere con la modifica o annullarla.

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza
- INSTANCE_NAME: il nome dell'istanza
Metodo HTTP e URL:
PATCH https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME
Corpo JSON della richiesta:
{ "settings": { "enableGoogleMlIntegration": true, } }
Per inviare la richiesta, espandi una di queste opzioni:
curl (Linux, macOS o Cloud Shell)

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME"
PowerShell (Windows)

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME" | Select-Object -Expand Content
Dovresti ricevere una risposta JSON simile alla seguente:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME", "status": "PENDING", "user": "user@example.com", "insertTime": "2020-01-16T02:32:12.281Z", "operationType": "UPDATE", "name": "OPERATION_ID", "targetId": "INSTANCE_NAME", "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Nota: per ulteriori informazioni sull'aggiornamento di un'istanza, consulta Modifica istanze.
REST v1beta4

Crea l'istanza

Utilizza questo esempio per creare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances:insert. Per informazioni sulle impostazioni delle istanze, inclusi i valori validi per una regione, vedi Impostazioni delle istanze.

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza.
- INSTANCE_NAME: il nome dell'istanza
- REGION_NAME: il nome della regione per l'istanza.
- DATABASE_VERSION: stringa enum della versione del database, ad esempio SQLSERVER_2025_ENTERPRISE.
- PASSWORD: la password per l'utente del database root.
- MACHINE_TYPE: stringa enum del tipo di macchina (livello), ad esempio db-custom-[CPUS]-[MEMORY_MBS]. Per ulteriori informazioni, vedi Livelli di macchine.
- EDITION_TYPE: la tua versione di Cloud SQL, ad esempio ENTERPRISE.
Nota: per saperne di più su questi parametri, consulta Crea istanze.

Devi includere anche l'oggetto enableGoogleMlIntegration nella richiesta. Imposta i seguenti parametri, se necessario:
- enableGoogleMlIntegration: quando questo parametro è impostato su true, le istanze Cloud SQL possono connettersi a Vertex AI per inoltrare richieste di previsioni in tempo reale e insight all'AI.
Metodo HTTP e URL:
POST https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances
Corpo JSON della richiesta:
{ "name": "INSTANCE_NAME", "region": "REGION_NAME", "databaseVersion": "DATABASE_VERSION", "rootPassword": "PASSWORD", "settings": { "tier": "MACHINE_TYPE", "edition": "EDITION_TYPE", "enableGoogleMlIntegration": "true" | "false" } }
Per inviare la richiesta, espandi una di queste opzioni:
curl (Linux, macOS o Cloud Shell)

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances"
PowerShell (Windows)

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances" | Select-Object -Expand Content
Dovresti ricevere una risposta JSON simile alla seguente:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_ID", "status": "PENDING", "user": "user@example.com", "insertTime": "2019-09-25T22:19:33.735Z", "operationType": "CREATE", "name": "OPERATION_ID", "targetId": "INSTANCE_ID", "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Aggiorna l'istanza

Utilizza questo esempio per aggiornare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances.patch.

Se questo aggiornamento modifica un valore che richiede un riavvio, viene visualizzato un prompt per procedere con la modifica o annullarla.

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza
- INSTANCE_NAME: il nome dell'istanza
Metodo HTTP e URL:
PATCH https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME
Corpo JSON della richiesta:
{ "settings": { "enableGoogleMlIntegration": true, } }
Per inviare la richiesta, espandi una di queste opzioni:
curl (Linux, macOS o Cloud Shell)

Nota: il seguente comando presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login oppure utilizzando Cloud Shell, che consente di accedere automaticamente all'interfaccia a riga di comando gcloud. Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME"
PowerShell (Windows)

Nota: il comando seguente presuppone che tu abbia eseguito l'accesso all'interfaccia a riga di comando gcloud con il tuo account utente eseguendo gcloud init o gcloud auth login . Puoi controllare l'account attualmente attivo eseguendo gcloud auth list.

Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME" | Select-Object -Expand Content
Dovresti ricevere una risposta JSON simile alla seguente:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME", "status": "PENDING", "user": "user@example.com", "insertTime": "2020-01-16T02:32:12.281Z", "operationType": "UPDATE", "name": "OPERATION_ID", "targetId": "INSTANCE_NAME", "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Nota: per ulteriori informazioni sull'aggiornamento di un'istanza, consulta Modifica delle istanze.

Aggiungi autorizzazioni Secret Manager

Se vuoi utilizzare un modello di un'origine esterna, ad esempio OpenAI o Hugging Face, devi archiviare la chiave API dell'origine del modello in Secret Manager.

Dopodiché, devi concedere all'istanza Cloud SQL l'accesso alla chiave API dell'origine del modello in Secret Manager. Per ottenere l'accesso, esegui questo comando:


SA_NAME=$(gcloud sql instances describe INSTANCE_NAME --format="value(serviceAccountEmailAddress)");

gcloud secrets add-iam-policy-binding SECRET_NAME \
    --member="serviceAccount:${SA_NAME}" \
    --role="roles/secretmanager.secretAccessor"

Sostituisci quanto segue:

INSTANCE_NAME: il nome dell'istanza Cloud SQL.
SECRET_NAME: il nome del secret utilizzato in Secret Manager.

Oggetti modello esterni

Per accedere a un modello da una fonte esterna, devi creare un oggetto modello da utilizzare per SQL Server. Cloud SQL fornisce tre stored procedure che consentono di creare, modificare ed eliminare un oggetto modello esterno:

gcloudsql_ml_create_external_model
gcloudsql_ml_alter_external_model
gcloudsql_ml_drop_external_model

Creare un modello esterno

Per creare un modello, esegui la stored procedure gcloudsql_ml_create_external_model nel database msdb:

EXECUTE [msdb].[dbo].[gcloudsql_ml_create_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Sostituisci quanto segue:

DB_NAME: il database di destinazione in cui vuoi creare il modello esterno.
MODEL_NAME: il nome del nuovo modello esterno.
MODEL_PROVIDER: il nome del fornitore del modello, ad esempio uno dei seguenti:
- Vertex AI
- OpenAI
- Hugging Face
MODEL_URL: l'URL dell'endpoint del modello.
Un esempio utilizza il seguente formato:
```
    https://region-aiplatform.googleapis.com/v1/projects/project-id/locations/region/publishers/google/models/model:predict
    
```
Sostituisci quanto segue:
- REGION: la regione in cui si trova l'endpoint del modello.
- PROJECT_ID: l'ID progetto in cui si trova l'endpoint del modello.
- MODEL: il nome del modello.
MODEL: il modello di AI richiamato. Ad esempio, text-embedding-005.
SECRET_URL: se Vertex AI è il fornitore del modello, questo parametro deve essere vuoto. Se utilizzi un modello esterno, questo valore deve fare riferimento alla posizione di Secret Manager della chiave API.
Un URL di esempio utilizza il seguente formato:
```
    https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
    
```
Sostituisci quanto segue:
- PROJECT_ID: l'ID progetto in cui si trova il secret.
- SECRET_NAME: il nome del secret utilizzato in Secret Manager.
- VERSION: il numero di versione del secret.

Modificare un modello esterno

Per modificare un oggetto modello esterno, esegui la stored procedure gcloudsql_ml_alter_external_model nel database msdb:

EXECUTE [msdb].[dbo].[gcloudsql_ml_alter_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Sostituisci quanto segue:

DB_NAME: il database di destinazione in cui esiste il modello che vuoi modificare.
MODEL_NAME: il nome del modello esistente.
MODEL_PROVIDER: il nome del fornitore del modello, ad esempio uno dei seguenti:
- Vertex AI
- OpenAI
- Hugging Face
MODEL_URL: l'URL dell'endpoint del modello.
Un esempio utilizza il seguente formato:
```
    https://region-aiplatform.googleapis.com/v1/projects/project-id/locations/region/publishers/google/models/model:predict
    
```
Sostituisci quanto segue:
- REGION: la regione in cui si trova l'endpoint del modello.
- PROJECT_ID: l'ID progetto in cui si trova l'endpoint del modello.
- MODEL: il nome del modello.
MODEL: il modello di AI richiamato. Ad esempio, gemini-embedding-001.
SECRET_URL: se Vertex AI è il fornitore del modello, questo parametro deve essere vuoto. Se utilizzi un modello esterno, questo valore deve fare riferimento alla posizione di Secret Manager della chiave API.
Un URL di esempio utilizza il seguente formato:
```
    https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
    
```
Sostituisci quanto segue:
- PROJECT_ID: l'ID progetto in cui si trova il secret.
- SECRET_NAME: il nome del secret utilizzato in Secret Manager.
- VERSION: il numero di versione del secret.

Disattivare l'integrazione di Vertex AI

Per disattivare l'integrazione di Vertex AI in un'istanza Cloud SQL, esegui il comando seguente:

gcloud sql instances patch [instance-name] --no-enable-google-ml-integration

Sostituisci INSTANCE_NAME con il nome dell'istanza Cloud SQL.

Eliminare un modello esterno in SQL Server

Per eliminare un modello esterno da SQL Server, esegui la stored procedure gcloudsql_ml_drop_external_model disponibile nel database msdb:

EXECUTE [msdb].[dbo].[gcloudsql_ml_drop_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME

Sostituisci quanto segue:

DB_NAME: il database di destinazione in cui esiste il modello esterno che vuoi eliminare.
MODEL_NAME: il nome del modello esterno da eliminare.

Richiamare un modello esterno

Dopo aver abilitato l'integrazione di Vertex AI nell'istanza Cloud SQL e aver creato un oggetto modello da utilizzare per SQL Server, puoi richiamare la funzione AI_GENERATE_EMBEDDINGS di SQL Server per creare embedding vettoriali per i tuoi dati.

Per creare embedding vettoriali utilizzando il modello esterno, esegui questo comando:

SELECT AI_GENERATE_EMBEDDINGS(N'Test Text' USE MODEL MODEL_NAME)

Sostituisci MODEL_NAME con il nome del modello che vuoi utilizzare.

All'utente principale che esegue l'operazione devono essere state concesse le autorizzazioni EXECUTE ON EXTERNAL MODEL utilizzando un ruolo o una concessione appropriati.

Per saperne di più, consulta la documentazione di Microsoft sulle concessioni di modelli esterni.

Limitazioni delle dimensioni del modello

Alcuni modelli, come gemini-embedding-01, hanno dimensioni di output predefinite superiori a quelle supportate da SQL Server per i vettori float32, che hanno un massimo di 1998 dimensioni. Se necessario, devi utilizzare float16 (una funzionalità di anteprima di Microsoft) per il tipo di base vettoriale, che offre un massimo di 3996 dimensioni vettoriali, oppure il parametro delle dimensioni deve essere fornito nella richiesta AI_GENERATE_EMBEDDINGS per ridurre la dimensionalità.

Per saperne di più, consulta la sezione Supporto di numeri in virgola mobile a mezza precisione nel tipo di dati vettoriale.

Per un esempio, vedi quanto segue:

DECLARE @params JSON = N'{"dimensions": "DIMENSIONS"}';
SELECT AI_GENERATE_EMBEDDINGS('This article introduces AI concepts.' USE MODEL MODEL_NAME PARAMETERS @params)

Sostituisci quanto segue:

DIMENSIONS: le dimensioni che vuoi utilizzare per il modello, ad esempio 1536. Questo valore viene accettato come stringa.
MODEL_NAME: il nome del modello che vuoi utilizzare.

Risoluzione dei problemi

Di seguito sono riportati i potenziali messaggi di errore che potresti ricevere:

Contesto	Errore o messaggio ricevuto	Possibile causa:
`CREATE/ALTER` procedura	"Il provider di modelli specificato non è valido."	È stato specificato un provider di modelli non supportato.
`CREATE/ALTER` procedura	"L'URL del secret specificato non è valido per questo fornitore di modelli."	Per Vertex AI, l'URL segreto deve essere vuoto. Per gli altri fornitori di modelli, l'URL segreto non deve essere vuoto.
`CREATE/ALTER/DROP` procedura	"Il nome del modello specificato non è valido."	Il nome del modello è un campo obbligatorio.
`CREATE/ALTER` procedura	"L'URL del modello specificato non è valido."	L'URL del modello è un campo obbligatorio.
`CREATE/ALTER/DROP` procedura	"Il nome del database specificato non è valido."	Il campo Nome DB valido è obbligatorio.
`AI_GENERATE_EMBEDDINGS` chiamata	Vari codici di errore, tra cui `400`, `403`, `404`, `405`, `500`.	Se riscontri problemi durante il tentativo di eseguire la funzione `AI_GENERATE_EMBEDDINGS`, vengono restituiti solo i codici di errore. Si tratta di una limitazione nota di Microsoft.
`AI_GENERATE_EMBEDDINGS` chiamata	"La risposta HTTP non contiene un JSON valido."	L'agente di machine learning ha restituito un codice di errore che ti chiede di riprovare, ad esempio `429` o `500`. Tuttavia, il cliente riceve questo messaggio di testo. Si tratta di una limitazione nota di Microsoft.

Codici di errore

La funzione AI_GENERATE_EMBEDDINGS fornisce solo codici di errore, non messaggi. La seguente tabella elenca le possibili cause di alcuni codici di errore:

Codice di errore	Possibile causa:
`400 Bad Request`	Tipo di modello non supportato. Payload JSON non valido. URL non valido per il tipo di modello.
`401 Unauthorized`	Al modello di terze parti manca una chiave API valida.
`403 Forbidden`	L'istanza Cloud SQL non dispone delle autorizzazioni appropriate per accedere a Vertex AI. L'istanza Cloud SQL non dispone delle autorizzazioni appropriate per accedere a Secret Manager. La chiave API non concede l'autorizzazione al modello di terze parti specificato. Vertex AI non è abilitato nel progetto.
`404 Not Found`	Il `secret_url` specificato non esiste. Il `model_url` specificato non esiste.
`405 Method Not Allowed`	È stato fornito un metodo diverso da `POST`.
`413 Request Body Too Large`	Le dimensioni della richiesta superano il limite di 1 MB.
`429 Too Many Requests`	Errore di esaurimento del provider del modello.
`500 Internal Server Error`	Errori non specificati del fornitore del modello. Risposta imprevista dal fornitore del modello.

Passaggi successivi

Utilizzare i vector embedding

Integra Cloud SQL con Vertex AI Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Versioni ed edizioni del database supportate

Tipi di modelli supportati

Prima di iniziare

Console

gcloud

gcloud

Abilitare l'integrazione del database con Vertex AI

gcloud

Crea l'istanza

Aggiorna l'istanza

REST v1

Crea l'istanza

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Aggiorna l'istanza

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

REST v1beta4

Crea l'istanza

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Aggiorna l'istanza

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Aggiungi autorizzazioni Secret Manager

Oggetti modello esterni

Creare un modello esterno

Modificare un modello esterno

Disattivare l'integrazione di Vertex AI

Eliminare un modello esterno in SQL Server

Richiamare un modello esterno

Limitazioni delle dimensioni del modello

Risoluzione dei problemi

Codici di errore

Passaggi successivi

Integra Cloud SQL con Vertex AI