Integra Cloud SQL con Vertex AI

Questa pagina descrive come integrare Cloud SQL con Vertex AI.

Questa integrazione consente di applicare modelli linguistici di grandi dimensioni (LLM), ospitati in Vertex AI, a un database Cloud SQL per SQL Server 2025.

Integrando Cloud SQL con Vertex AI, puoi applicare la potenza semantica e predittiva dei modelli di machine learning (ML) ai tuoi dati. Questa integrazione estende la sintassi SQL con la funzione generate embeddings per eseguire query sui modelli.

Utilizzi la funzione di generazione di embedding in modo che il modello di embedding possa tradurre i prompt di testo in vettori numerici. Puoi quindi applicare questi vector embedding come input ai tipi di dati vettoriali. Per ulteriori informazioni, consulta la documentazione di Microsoft sulla ricerca vettoriale e sugli indici vettoriali nel motore di database SQL.

Per saperne di più su Vertex AI, consulta Introduzione a Vertex AI.

Versioni ed edizioni del database supportate

L'integrazione di Vertex AI è supportata sia per le versioni Cloud SQL Enterprise Plus e Cloud SQL Enterprise sia per tutte le versioni del database di SQL Server 2025.

Tipi di modelli supportati

L'integrazione di Vertex AI con Cloud SQL supporta gli endpoint dei modelli dalle seguenti origini:

  • Vertex AI
  • Hugging Face
  • OpenAI

Prima di iniziare

  1. Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Verify that billing is enabled for your Google Cloud project.

  6. Abilita le API Google Cloud necessarie.

    Console

    1. Vai alla pagina API e servizi.
    2. Dall'elenco dei progetti, seleziona il tuo progetto.
    3. Se la libreria API non è aperta, seleziona Libreria dal menu di navigazione.
    4. Fai clic sulle API che vuoi abilitare. Per questa procedura, attiva quanto segue:

      • API Cloud SQL Admin
      • API Vertex AI
      • API Compute Engine
      • (Facoltativo) Se utilizzi un modello di terze parti, è necessaria l'API Secret Manager.
    5. Dopo aver selezionato ogni API, fai clic su Attiva.

    gcloud

    1. Apri Cloud Shell, che fornisce l'accesso da riga di comando alle tue risorse Google Cloud direttamente dal browser.
    2. Per abilitare le API richieste, utilizza il comando gcloud services enable:
      gcloud services enable sqladmin.googleapis.com \
        aiplatform.googleapis.com \
        compute.googleapis.com \
        secretmanager.googleapis.com
      
    3. Questo comando abilita le seguenti API:
      • API Cloud SQL Admin
      • API Vertex AI
      • API Compute Engine
      • (Facoltativo) Se utilizzi un modello di terze parti, è necessaria l'API Secret Manager.

  7. Concedi al account di servizio Cloud SQL le autorizzazioni Identity and Access Management (IAM) per accedere a Vertex AI.
  8. gcloud

    Per aggiungere le autorizzazioni Vertex AI al account di servizio Cloud SQL per il progetto in cui si trova l'istanza Cloud SQL, utilizza il comando gcloud projects add-iam-policy-binding:

    gcloud projects add-iam-policy-binding PROJECT_ID \
    --member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
    --role="roles/aiplatform.user"
    

    Esegui le seguenti sostituzioni:
    • PROJECT_ID: l'ID del progetto che ha l'endpoint Vertex AI. Cloud SQL utilizza questo endpoint per accedere al modello LLM ospitato in Vertex AI.
    • SERVICE_ACCOUNT_EMAIL: l'indirizzo email del account di servizio Cloud SQL.

      Per trovare questo indirizzo email, utilizza il comando gcloud sql instances describe:

      gcloud sql instances describe INSTANCE_NAME | grep EmailAddress
      

      Sostituisci INSTANCE_NAME con il nome dell'istanza Cloud SQL.

  9. Assicurati che all'utente Cloud SQL che lavora con i modelli di embedding vengano concesse le seguenti autorizzazioni del database:
    • Per consentire a un utente del database di creare o modificare modelli, devi concedere all'utente Cloud SQL l'autorizzazione EXECUTE sulle seguenti stored procedure:
      • [msdb].gcloudsql_ml_create_external_model: crea un oggetto modello esterno che contiene la posizione, il metodo di autenticazione e lo scopo di un endpoint di inferenza del modello di AI.
      • [msdb].gcloudsql_ml_alter_external_model: consente di modificare l'oggetto modello esterno.
      • [msdb].gcloudsql_ml_drop_external_model: rimuove l'oggetto modello esterno dal database.
    • Per chiamare le stored procedure elencate in precedenza, devi disporre delle seguenti autorizzazioni nel database di destinazione:
      • CREATE EXTERNAL MODEL
      • ALTER EXTERNAL MODEL
    • Per scoprire come concedere queste autorizzazioni, consulta la documentazione Microsoft sul comando e sulla nomenclatura Create external model.

      Per informazioni sulle autorizzazioni di superuser di Cloud SQL, consulta Informazioni sugli utenti e sulle stored procedure di SQL Server.

  10. Se vuoi utilizzare un modello esterno di terze parti, devi disporre di una chiave API valida per il modello memorizzata in una posizione di Secret Manager accessibile all'istanza Cloud SQL.
  11. Se utilizzi un modello esterno di terze parti, l'istanza Cloud SQL deve utilizzare un indirizzo IP pubblico. Le istanze con IP privato non possono accedere a modelli esterni di terze parti. L'accesso privato ai servizi e Private Service Connect sono supportati solo con l'integrazione di Vertex AI.

Abilitare l'integrazione del database con Vertex AI

Per abilitare l'integrazione del database con Vertex AI, completa i seguenti passaggi:

  1. Crea o aggiorna un'istanza Cloud SQL in modo che possa integrarsi con Vertex AI.

    gcloud

    Crea l'istanza

    Per creare l'istanza Cloud SQL, utilizza il comando gcloud sql instances create.

    gcloud sql instances create INSTANCE_NAME \
    --database-version=DATABASE_VERSION \
    --tier=MACHINE_TYPE \
    --region=REGION_NAME \
    --enable-google-ml-integration

    Effettua le seguenti sostituzioni:

    • INSTANCE_NAME: il nome dell'istanza
    • DATABASE_VERSION: la versione del database per l'istanza, ad esempio SQLSERVER_2025_ENTERPRISE.
    • MACHINE_TYPE: il tipo di macchina per l'istanza, ad esempio db-perf-optimized-N-8..
    • REGION_NAME: la regione dell'istanza, ad esempio us-central1.

    Aggiorna l'istanza

    Per aggiornare l'istanza, utilizza il comando gcloud sql instances patch.

    gcloud sql instances patch INSTANCE_NAME \
    --enable-google-ml-integration

    REST v1

    Crea l'istanza

    Utilizza questo esempio per creare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances:insert. Per informazioni sulle impostazioni delle istanze, inclusi i valori validi per una regione, vedi Impostazioni delle istanze.

    Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

    • PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza.
    • INSTANCE_NAME: il nome dell'istanza
    • REGION_NAME: il nome della regione per l'istanza.
    • DATABASE_VERSION: stringa enum della versione del database, ad esempio SQLSERVER_2025_ENTERPRISE.
    • PASSWORD: la password per l'utente del database root.
    • MACHINE_TYPE: stringa enum del tipo di macchina (livello), ad esempio db-custom-[CPUS]-[MEMORY_MBS]. Per ulteriori informazioni, vedi Livelli di macchine.
    • EDITION_TYPE: la tua versione di Cloud SQL, ad esempio ENTERPRISE.

    Devi includere anche l'oggetto enableGoogleMlIntegration nella richiesta. Imposta i seguenti parametri, se necessario:

    • enableGoogleMlIntegration: quando questo parametro è impostato su true, le istanze Cloud SQL possono connettersi a Vertex AI per inoltrare richieste di previsioni in tempo reale e insight all'AI.

    Metodo HTTP e URL:

    POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances

    Corpo JSON della richiesta:

    {
      "name": "INSTANCE_NAME",
      "region": "REGION_NAME",
      "databaseVersion": "DATABASE_VERSION",
      "rootPassword": "PASSWORD",
      "settings": {
        "tier": "MACHINE_TYPE",
        "edition": "EDITION_TYPE",
        "enableGoogleMlIntegration": "true" | "false"
        
      }
    }
    

    Per inviare la richiesta, espandi una di queste opzioni:

    Dovresti ricevere una risposta JSON simile alla seguente:

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_ID",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2019-09-25T22:19:33.735Z",
      "operationType": "CREATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_ID",
      "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

    Aggiorna l'istanza

    Utilizza questo esempio per aggiornare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances.patch.

    Se questo aggiornamento modifica un valore che richiede un riavvio, viene visualizzato un prompt per procedere con la modifica o annullarla.

    Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

    • PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza
    • INSTANCE_NAME: il nome dell'istanza

    Metodo HTTP e URL:

    PATCH https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME

    Corpo JSON della richiesta:

    {
      "settings": {
        "enableGoogleMlIntegration": true,
        
       }
    }

    Per inviare la richiesta, espandi una di queste opzioni:

    Dovresti ricevere una risposta JSON simile alla seguente:

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2020-01-16T02:32:12.281Z",
      "operationType": "UPDATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_NAME",
      "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

    REST v1beta4

    Crea l'istanza

    Utilizza questo esempio per creare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances:insert. Per informazioni sulle impostazioni delle istanze, inclusi i valori validi per una regione, vedi Impostazioni delle istanze.

    Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

    • PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza.
    • INSTANCE_NAME: il nome dell'istanza
    • REGION_NAME: il nome della regione per l'istanza.
    • DATABASE_VERSION: stringa enum della versione del database, ad esempio SQLSERVER_2025_ENTERPRISE.
    • PASSWORD: la password per l'utente del database root.
    • MACHINE_TYPE: stringa enum del tipo di macchina (livello), ad esempio db-custom-[CPUS]-[MEMORY_MBS]. Per ulteriori informazioni, vedi Livelli di macchine.
    • EDITION_TYPE: la tua versione di Cloud SQL, ad esempio ENTERPRISE.

    Devi includere anche l'oggetto enableGoogleMlIntegration nella richiesta. Imposta i seguenti parametri, se necessario:

    • enableGoogleMlIntegration: quando questo parametro è impostato su true, le istanze Cloud SQL possono connettersi a Vertex AI per inoltrare richieste di previsioni in tempo reale e insight all'AI.

    Metodo HTTP e URL:

    POST https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances

    Corpo JSON della richiesta:

    {
      "name": "INSTANCE_NAME",
      "region": "REGION_NAME",
      "databaseVersion": "DATABASE_VERSION",
      "rootPassword": "PASSWORD",
      "settings": {
        "tier": "MACHINE_TYPE",
        "edition": "EDITION_TYPE",
        "enableGoogleMlIntegration": "true" | "false"
        
      }
    }
    

    Per inviare la richiesta, espandi una di queste opzioni:

    Dovresti ricevere una risposta JSON simile alla seguente:

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_ID",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2019-09-25T22:19:33.735Z",
      "operationType": "CREATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_ID",
      "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

    Aggiorna l'istanza

    Utilizza questo esempio per aggiornare l'istanza. Per un elenco completo dei parametri per questa chiamata, consulta la pagina instances.patch.

    Se questo aggiornamento modifica un valore che richiede un riavvio, viene visualizzato un prompt per procedere con la modifica o annullarla.

    Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

    • PROJECT_ID: l'ID o il numero di progetto del progetto Google Cloud che contiene l'istanza
    • INSTANCE_NAME: il nome dell'istanza

    Metodo HTTP e URL:

    PATCH https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME

    Corpo JSON della richiesta:

    {
      "settings": {
        "enableGoogleMlIntegration": true,
        
       }
    }

    Per inviare la richiesta, espandi una di queste opzioni:

    Dovresti ricevere una risposta JSON simile alla seguente:

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2020-01-16T02:32:12.281Z",
      "operationType": "UPDATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_NAME",
      "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

Aggiungi autorizzazioni Secret Manager

Se vuoi utilizzare un modello di un'origine esterna, ad esempio OpenAI o Hugging Face, devi archiviare la chiave API dell'origine del modello in Secret Manager.

Poi, devi concedere all'istanza Cloud SQL l'accesso alla chiave API dell'origine del modello in Secret Manager. Per ottenere l'accesso, esegui questo comando:


SA_NAME=$(gcloud sql instances describe INSTANCE_NAME --format="value(serviceAccountEmailAddress)");

gcloud secrets add-iam-policy-binding SECRET_NAME \
    --member="serviceAccount:${SA_NAME}" \
    --role="roles/secretmanager.secretAccessor"

Sostituisci quanto segue:

  • INSTANCE_NAME: il nome dell'istanza Cloud SQL.
  • SECRET_NAME: il nome del secret utilizzato in Secret Manager.

Oggetti modello esterni

Per accedere a un modello da una fonte esterna, devi creare un oggetto modello da utilizzare per SQL Server. Cloud SQL fornisce tre stored procedure che consentono di creare, modificare ed eliminare un oggetto modello esterno:

  • gcloudsql_ml_create_external_model
  • gcloudsql_ml_alter_external_model
  • gcloudsql_ml_drop_external_model

Creare un modello esterno

Per creare un modello, esegui la stored procedure gcloudsql_ml_create_external_model nel database msdb:

EXECUTE [msdb].[dbo].[gcloudsql_ml_create_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Sostituisci quanto segue:

  • DB_NAME: il database di destinazione in cui vuoi creare il modello esterno.
  • MODEL_NAME: il nome del nuovo modello esterno.
  • MODEL_PROVIDER: il nome del fornitore del modello, ad esempio uno dei seguenti:
    • Vertex AI
    • OpenAI
    • Hugging Face
  • MODEL_URL: l'URL dell'endpoint del modello.
  • MODEL: il modello di AI richiamato. Ad esempio, gemini-embedding-002.
  • SECRET_URL: se Vertex AI è il fornitore del modello, questo parametro deve essere vuoto. Se utilizzi un modello esterno, questo valore deve fare riferimento alla posizione di Secret Manager della chiave API. Un URL di esempio utilizza il seguente formato:
        https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
        

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto in cui si trova il secret.
    • SECRET_NAME: il nome del secret utilizzato in Secret Manager.
    • VERSION: il numero di versione del secret.

Modificare un modello esterno

Per modificare un oggetto modello esterno, esegui la stored procedure gcloudsql_ml_alter_external_model nel database msdb:

EXECUTE [msdb].[dbo].[gcloudsql_ml_alter_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Sostituisci quanto segue:

  • DB_NAME: il database di destinazione in cui esiste il modello che vuoi modificare.
  • MODEL_NAME: il nome del modello esistente.
  • MODEL_PROVIDER: il nome del fornitore del modello, ad esempio uno dei seguenti:
    • Vertex AI
    • OpenAI
    • Hugging Face
  • MODEL_URL: l'URL dell'endpoint del modello.
  • MODEL: il modello di AI richiamato. Ad esempio, gemini-embedding-001.
  • SECRET_URL: se Vertex AI è il fornitore del modello, questo parametro deve essere vuoto. Se utilizzi un modello esterno, questo valore deve fare riferimento alla posizione di Secret Manager della chiave API. Un URL di esempio utilizza il seguente formato:
        https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
        

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto in cui si trova il secret.
    • SECRET_NAME: il nome del secret utilizzato in Secret Manager.
    • VERSION: il numero di versione del secret.

Disattivare l'integrazione di Vertex AI

Per disattivare l'integrazione di Vertex AI in un'istanza Cloud SQL, esegui il comando seguente:

gcloud sql instances patch [instance-name] --no-enable-google-ml-integration

Sostituisci INSTANCE_NAME con il nome dell'istanza Cloud SQL.

Eliminare un modello esterno in SQL Server

Per eliminare un modello esterno da SQL Server, esegui la stored procedure gcloudsql_ml_drop_external_model disponibile nel database msdb:

EXECUTE [msdb].[dbo].[gcloudsql_ml_drop_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME

Sostituisci quanto segue:

  • DB_NAME: il database di destinazione in cui esiste il modello esterno che vuoi eliminare.
  • MODEL_NAME: il nome del modello esterno da eliminare.

Richiamare un modello esterno

Dopo aver abilitato l'integrazione di Vertex AI nell'istanza Cloud SQL e aver creato un oggetto modello da utilizzare per SQL Server, puoi richiamare la funzione AI_GENERATE_EMBEDDINGS di SQL Server per creare embedding vettoriali per i tuoi dati.

Per creare embedding vettoriali utilizzando il modello esterno, esegui questo comando:

SELECT AI_GENERATE_EMBEDDINGS(N'Test Text' USE MODEL MODEL_NAME)

Sostituisci MODEL_NAME con il nome del modello che vuoi utilizzare.

All'utente principale che esegue l'operazione devono essere state concesse le autorizzazioni EXECUTE ON EXTERNAL MODEL utilizzando un ruolo o una concessione appropriati.

Per saperne di più, consulta la documentazione di Microsoft sulle concessioni di modelli esterni.

Limitazioni delle dimensioni del modello

Alcuni modelli, come gemini-embedding-01, hanno dimensioni di output predefinite superiori a quelle supportate da SQL Server per i vettori float32, che hanno un massimo di 1998 dimensioni. Se necessario, devi utilizzare float16 (una funzionalità di anteprima di Microsoft) per il tipo di base vettoriale, che offre un massimo di 3996 dimensioni vettoriali, oppure il parametro delle dimensioni deve essere fornito nella richiesta AI_GENERATE_EMBEDDINGS per ridurre la dimensionalità.

Per saperne di più, consulta la sezione Supporto di numeri in virgola mobile a mezza precisione nel tipo di dati vettoriale.

Per un esempio, vedi quanto segue:

DECLARE @params JSON = N'{"dimensions": "DIMENSIONS"}';
SELECT AI_GENERATE_EMBEDDINGS('This article introduces AI concepts.' USE MODEL MODEL_NAME PARAMETERS @params)

Sostituisci quanto segue:

  • DIMENSIONS: le dimensioni che vuoi utilizzare per il modello, ad esempio 1536. Questo valore viene accettato come stringa.
  • MODEL_NAME: il nome del modello che vuoi utilizzare.

Risoluzione dei problemi

Di seguito sono riportati i potenziali messaggi di errore che potresti ricevere:

Contesto Errore o messaggio ricevuto Possibile causa
CREATE/ALTER procedura "Il provider di modelli specificato non è valido." È stato specificato un provider di modelli non supportato.
CREATE/ALTER procedura "L'URL segreto specificato non è valido per questo fornitore di modelli." Per Vertex AI, l'URL del secret deve essere vuoto. Per gli altri fornitori di modelli, l'URL segreto non deve essere vuoto.
CREATE/ALTER/DROP procedura "Il nome del modello specificato non è valido." Il nome del modello è un campo obbligatorio.
CREATE/ALTER procedura "L'URL del modello specificato non è valido." L'URL del modello è un campo obbligatorio.
CREATE/ALTER/DROP procedura "Il nome del database specificato non è valido." Il campo Nome DB valido è obbligatorio.
AI_GENERATE_EMBEDDINGS chiamata Vari codici di errore, tra cui 400, 403, 404, 405, 500. Se riscontri problemi durante il tentativo di eseguire la funzione AI_GENERATE_EMBEDDINGS, vengono restituiti solo i codici di errore. Si tratta di una limitazione nota di Microsoft.
AI_GENERATE_EMBEDDINGS chiamata "La risposta HTTP non contiene un JSON valido." L'agente di machine learning ha restituito un codice di errore che ti chiede di riprovare, ad esempio 429 o 500. Tuttavia, il cliente riceve questo messaggio di testo. Si tratta di una limitazione nota di Microsoft.

Codici di errore

La funzione AI_GENERATE_EMBEDDINGS fornisce solo codici di errore, non messaggi. La seguente tabella elenca le possibili cause di alcuni codici di errore:

Codice di errore Possibile causa
400 Bad Request
  • Tipo di modello non supportato.
  • Payload JSON non valido.
  • URL non valido per il tipo di modello.
401 Unauthorized Al modello di terze parti manca una chiave API valida.
403 Forbidden
  • L'istanza Cloud SQL non dispone delle autorizzazioni appropriate per accedere a Vertex AI.
  • L'istanza Cloud SQL non dispone delle autorizzazioni appropriate per accedere a Secret Manager.
  • La chiave API non concede l'autorizzazione al modello di terze parti specificato.
  • Vertex AI non è abilitato nel progetto.
404 Not Found
  • Il secret_url specificato non esiste.
  • L'model_url specificato non esiste.
405 Method Not Allowed È stato fornito un metodo diverso da POST.
413 Request Body Too Large Le dimensioni della richiesta superano il limite di 1 MB.
429 Too Many Requests Errore di esaurimento del provider del modello.
500 Internal Server Error
  • Errori non specificati del fornitore del modello.
  • Risposta imprevista dal fornitore del modello.

Passaggi successivi