Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Intégrer Cloud SQL à Vertex AI

Cette page explique comment intégrer Cloud SQL à Vertex AI.

Cette intégration vous permet d'appliquer de grands modèles de langage (LLM), hébergés dans Vertex AI, à une base de données Cloud SQL pour SQL Server 2025.

En intégrant Cloud SQL à Vertex AI, vous pouvez appliquer la puissance sémantique et prédictive des modèles de machine learning (ML) à vos données. Cette intégration étend la syntaxe SQL avec la fonction generate embeddings pour interroger vos modèles.

Vous utilisez la fonction de génération d'embeddings pour que le modèle d'embedding puisse traduire les requêtes textuelles en vecteurs numériques. Vous pouvez ensuite appliquer ces embeddings vectoriels en tant qu'entrées aux types de données vectorielles. Pour en savoir plus, consultez la documentation Microsoft sur la recherche vectorielle et les index vectoriels dans le moteur de base de données SQL.

Pour en savoir plus sur Vertex AI, consultez la Présentation de Vertex AI.

Éditions et versions de bases de données compatibles

L'intégration de Vertex AI est compatible avec les éditions Cloud SQL Enterprise Plus et Cloud SQL Enterprise, ainsi qu'avec toutes les versions de base de données de SQL Server 2025.

Types de modèles compatibles

L'intégration de Vertex AI à Cloud SQL est compatible avec les points de terminaison de modèle provenant des sources suivantes :

Vertex AI
Hugging Face
OpenAI

Avant de commencer

Connectez-vous à votre compte Google Cloud . Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits sans frais pour exécuter, tester et déployer des charges de travail.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Activez les API Google Cloud nécessaires.
Console
1. Accédez à la page API et services.
2. Dans la liste des projets, sélectionnez un projet.
3. Si la bibliothèque d'API n'est pas ouverte, sélectionnez Bibliothèque dans le menu de navigation.
4. Cliquez sur les API que vous souhaitez activer. Pour cette procédure, activez les éléments suivants :
  - API Cloud SQL Admin
  - API Vertex AI
  - API Compute Engine
  - Facultatif : Si vous utilisez un modèle tiers, l'API Secret Manager est requise.
  Remarque : Si vous avez besoin d'aide pour trouver ces API, utilisez le champ de recherche.
5. Après avoir sélectionné chaque API, cliquez sur Activer.
gcloud
1. Ouvrez Cloud Shell, qui fournit un accès en ligne de commande à vos ressources Google Cloud directement depuis votre navigateur.
2. Pour activer les API requises, utilisez la commande gcloud services enable :
  gcloud services enable sqladmin.googleapis.com \ aiplatform.googleapis.com \ compute.googleapis.com \ secretmanager.googleapis.com

Accordez au compte de service Cloud SQL les autorisations IAM (Identity and Access Management) pour accéder à Vertex AI.

gcloud

Pour ajouter les autorisations Vertex AI au compte de service Cloud SQL pour le projet où se trouve l'instance Cloud SQL, utilisez la commande gcloud projects add-iam-policy-binding :

gcloud projects add-iam-policy-binding PROJECT_ID \
--member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
--role="roles/aiplatform.user"

Effectuez les remplacements suivants :

PROJECT_ID : ID du projet contenant le point de terminaison Vertex AI. Cloud SQL utilise ce point de terminaison pour accéder au LLM hébergé dans Vertex AI.
SERVICE_ACCOUNT_EMAIL : adresse e-mail du compte de service Cloud SQL.

Pour trouver cette adresse e-mail, utilisez la commande gcloud sql instances describe :
```
gcloud sql instances describe INSTANCE_NAME | grep EmailAddress
```
Remplacez INSTANCE_NAME par le nom de l'instance Cloud SQL.

Assurez-vous que l'utilisateur Cloud SQL qui travaille avec les modèles d'embedding dispose des autorisations de base de données suivantes :
- Pour permettre à un utilisateur de base de données de créer ou de modifier des modèles, vous devez accorder à l'utilisateur Cloud SQL l'autorisation EXECUTE sur les procédures stockées suivantes :
  - [msdb].gcloudsql_ml_create_external_model : crée un objet de modèle externe qui contient l'emplacement, la méthode d'authentification et l'objectif d'un point de terminaison d'inférence de modèle d'IA.
  - [msdb].gcloudsql_ml_alter_external_model : vous permet de modifier l'objet de modèle externe.
  - [msdb].gcloudsql_ml_drop_external_model : supprime l'objet de modèle externe de la base de données.
- Pour appeler les procédures stockées listées précédemment, vous devez disposer des autorisations suivantes dans la base de données cible :
  - CREATE EXTERNAL MODEL
  - ALTER EXTERNAL MODEL
Si vous souhaitez utiliser un modèle externe tiers, vous devez disposer d'une clé API valide pour le modèle, stockée dans un emplacement Secret Manager accessible à l'instance Cloud SQL.
Si vous utilisez un modèle externe tiers, l'instance Cloud SQL doit utiliser une adresse IP publique. Les instances d'adresse IP privée ne peuvent pas accéder aux modèles externes tiers. L'accès aux services privés et Private Service Connect ne sont compatibles qu'avec l'intégration de Vertex AI.

Activer l'intégration de la base de données avec Vertex AI

Pour activer l'intégration de la base de données avec Vertex AI, procédez comme suit :

Créez ou mettez à jour une instance Cloud SQL afin que l'instance puisse s'intégrer à Vertex AI.
gcloud

Créer l'instance

Pour créer l'instance Cloud SQL, utilisez la commande gcloud sql instances create.
```
gcloud sql instances create INSTANCE_NAME \
--database-version=DATABASE_VERSION \
--tier=MACHINE_TYPE \
--region=REGION_NAME \
--enable-google-ml-integration
```
Effectuez les remplacements suivants :
- INSTANCE_NAME : nom de l'instance.
- DATABASE_VERSION : version de la base de données pour l'instance, telle que SQLSERVER_2025_ENTERPRISE.
- MACHINE_TYPE : type de machine de l'instance, par exemple db-perf-optimized-N-8..
- REGION_NAME : région de l'instance, par exemple us-central1.
Remarque : Pour en savoir plus sur ces paramètres, consultez Créer des instances.

Mettre à jour l'instance

Pour mettre à jour l'instance, utilisez la commande gcloud sql instances patch.
```
gcloud sql instances patch INSTANCE_NAME \
--enable-google-ml-integration
```
Remarque : Pour en savoir plus sur la mise à jour d'une instance, consultez la page Modifier les instances.
REST v1

Créer l'instance

Utilisez cet exemple pour créer l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert. Pour en savoir plus sur les paramètres des instances, y compris sur les valeurs valides pour la région, consultez la page Paramètres des instances.

Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
- INSTANCE_NAME : nom de l'instance.
- REGION_NAME : nom de la région pour l'instance.
- DATABASE_VERSION : chaîne d'énumération de la version de base de données, telle que SQLSERVER_2025_ENTERPRISE.
- PASSWORD : mot de passe de l'utilisateur root de la base de données.
- MACHINE_TYPE : chaîne d'énumération du type (niveau) de machine, par exemple db-custom-[CPUS]-[MEMORY_MBS]. Pour en savoir plus, consultez Niveaux de machines.
- EDITION_TYPE : votre édition Cloud SQL, telle que ENTERPRISE.
Remarque : Pour en savoir plus sur ces paramètres, consultez Créer des instances.

Vous devez également inclure l'objet enableGoogleMlIntegration dans la requête. Définissez les paramètres suivants, si nécessaire :
- enableGoogleMlIntegration : lorsque ce paramètre est défini sur true, les instances Cloud SQL peuvent se connecter à Vertex AI pour transmettre des requêtes de prédictions en temps réel et des insights à l'IA.
Méthode HTTP et URL :
POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances
Corps JSON de la requête :
{ "name": "INSTANCE_NAME", "region": "REGION_NAME", "databaseVersion": "DATABASE_VERSION", "rootPassword": "PASSWORD", "settings": { "tier": "MACHINE_TYPE", "edition": "EDITION_TYPE", "enableGoogleMlIntegration": "true" | "false" } }
Pour envoyer votre requête, développez l'une des options suivantes :
curl (Linux, macOS ou Cloud Shell)

Remarque : La commande suivante suppose que vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances"
PowerShell (Windows)

Remarque : La commande suivante suppose que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_ID", "status": "PENDING", "user": "user@example.com", "insertTime": "2019-09-25T22:19:33.735Z", "operationType": "CREATE", "name": "OPERATION_ID", "targetId": "INSTANCE_ID", "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Mettre à jour l'instance

Utilisez cet exemple pour mettre à jour l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert.

Si cette mise à jour modifie une valeur dont la modification nécessite un redémarrage de l'instance, un message vous invite à procéder à la modification ou à annuler l'opération.

Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
- INSTANCE_NAME : nom de l'instance
Méthode HTTP et URL :
PATCH https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME
Corps JSON de la requête :
{ "settings": { "enableGoogleMlIntegration": true, } }
Pour envoyer votre requête, développez l'une des options suivantes :
curl (Linux, macOS ou Cloud Shell)

Remarque : La commande suivante suppose que vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME"
PowerShell (Windows)

Remarque : La commande suivante suppose que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME", "status": "PENDING", "user": "user@example.com", "insertTime": "2020-01-16T02:32:12.281Z", "operationType": "UPDATE", "name": "OPERATION_ID", "targetId": "INSTANCE_NAME", "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Remarque : Pour en savoir plus sur la mise à jour d'une instance, consultez la page Modifier les instances.
REST v1beta4

Créer l'instance

Utilisez cet exemple pour créer l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert. Pour en savoir plus sur les paramètres des instances, y compris sur les valeurs valides pour la région, consultez la page Paramètres des instances.

Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
- INSTANCE_NAME : nom de l'instance.
- REGION_NAME : nom de la région pour l'instance.
- DATABASE_VERSION : chaîne d'énumération de la version de base de données, telle que SQLSERVER_2025_ENTERPRISE.
- PASSWORD : mot de passe de l'utilisateur root de la base de données.
- MACHINE_TYPE : chaîne d'énumération du type (niveau) de machine, par exemple db-custom-[CPUS]-[MEMORY_MBS]. Pour en savoir plus, consultez Niveaux de machines.
- EDITION_TYPE : votre édition Cloud SQL, telle que ENTERPRISE.
Remarque : Pour en savoir plus sur ces paramètres, consultez Créer des instances.

Vous devez également inclure l'objet enableGoogleMlIntegration dans la requête. Définissez les paramètres suivants, si nécessaire :
- enableGoogleMlIntegration : lorsque ce paramètre est défini sur true, les instances Cloud SQL peuvent se connecter à Vertex AI pour transmettre des requêtes de prédictions en temps réel et des insights à l'IA.
Méthode HTTP et URL :
POST https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances
Corps JSON de la requête :
{ "name": "INSTANCE_NAME", "region": "REGION_NAME", "databaseVersion": "DATABASE_VERSION", "rootPassword": "PASSWORD", "settings": { "tier": "MACHINE_TYPE", "edition": "EDITION_TYPE", "enableGoogleMlIntegration": "true" | "false" } }
Pour envoyer votre requête, développez l'une des options suivantes :
curl (Linux, macOS ou Cloud Shell)

Remarque : La commande suivante suppose que vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances"
PowerShell (Windows)

Remarque : La commande suivante suppose que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_ID", "status": "PENDING", "user": "user@example.com", "insertTime": "2019-09-25T22:19:33.735Z", "operationType": "CREATE", "name": "OPERATION_ID", "targetId": "INSTANCE_ID", "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Mettre à jour l'instance

Utilisez cet exemple pour mettre à jour l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert.

Si cette mise à jour modifie une valeur dont la modification nécessite un redémarrage de l'instance, un message vous invite à procéder à la modification ou à annuler l'opération.

Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
- INSTANCE_NAME : nom de l'instance
Méthode HTTP et URL :
PATCH https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME
Corps JSON de la requête :
{ "settings": { "enableGoogleMlIntegration": true, } }
Pour envoyer votre requête, développez l'une des options suivantes :
curl (Linux, macOS ou Cloud Shell)

Remarque : La commande suivante suppose que vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME"
PowerShell (Windows)

Remarque : La commande suivante suppose que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME", "status": "PENDING", "user": "user@example.com", "insertTime": "2020-01-16T02:32:12.281Z", "operationType": "UPDATE", "name": "OPERATION_ID", "targetId": "INSTANCE_NAME", "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Remarque : Pour en savoir plus sur la mise à jour d'une instance, consultez la page Modifier les instances.

Ajouter des autorisations Secret Manager

Si vous souhaitez utiliser un modèle provenant d'une source externe, telle qu'OpenAI ou Hugging Face, vous devez stocker la clé API de la source du modèle dans Secret Manager.

Vous devez ensuite accorder à l'instance Cloud SQL l'accès à la clé API de la source du modèle dans Secret Manager. Pour y accéder, exécutez la commande suivante :


SA_NAME=$(gcloud sql instances describe INSTANCE_NAME --format="value(serviceAccountEmailAddress)");

gcloud secrets add-iam-policy-binding SECRET_NAME \
    --member="serviceAccount:${SA_NAME}" \
    --role="roles/secretmanager.secretAccessor"

Remplacez les éléments suivants :

INSTANCE_NAME : nom de l'instance Cloud SQL.
SECRET_NAME : nom du secret tel qu'il est utilisé dans Secret Manager.

Objets de modèle externe

Pour accéder à un modèle à partir d'une source externe, vous devez créer un objet de modèle que SQL Server pourra utiliser. Cloud SQL fournit trois procédures stockées qui vous permettent de créer, de modifier et de supprimer un objet de modèle externe :

gcloudsql_ml_create_external_model
gcloudsql_ml_alter_external_model
gcloudsql_ml_drop_external_model

Créer un modèle externe

Pour créer un modèle, exécutez la procédure stockée gcloudsql_ml_create_external_model qui se trouve dans la base de données msdb :

EXECUTE [msdb].[dbo].[gcloudsql_ml_create_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Remplacez les éléments suivants :

DB_NAME : base de données cible dans laquelle vous souhaitez créer le modèle externe.
MODEL_NAME : nom du nouveau modèle externe.
MODEL_PROVIDER : nom du fournisseur du modèle, tel que l'un des suivants :
- Vertex AI
- OpenAI
- Hugging Face
MODEL_URL : URL du point de terminaison du modèle.
Un exemple utilise le format suivant :
```
    https://region-aiplatform.googleapis.com/v1/projects/project-id/locations/region/publishers/google/models/model:predict
    
```
Remplacez les éléments suivants :
- REGION : région où se trouve le point de terminaison du modèle.
- PROJECT_ID : ID du projet dans lequel se trouve le point de terminaison du modèle.
- MODEL : nom du modèle
MODEL : modèle d'IA appelé. Par exemple : text-embedding-005.
SECRET_URL : si Vertex AI est le fournisseur de modèles, ce paramètre doit être vide. Si vous utilisez un modèle externe, cette valeur doit faire référence à l'emplacement Secret Manager de la clé API.
Une URL d'exemple utilise le format suivant :
```
    https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
    
```
Remplacez les éléments suivants :
- PROJECT_ID : ID du projet dans lequel se trouve le secret.
- SECRET_NAME : nom du secret tel qu'il est utilisé dans Secret Manager.
- VERSION : numéro de version du secret.

Modifier un modèle externe

Pour modifier un objet de modèle externe, exécutez la procédure stockée gcloudsql_ml_alter_external_model disponible dans la base de données msdb :

EXECUTE [msdb].[dbo].[gcloudsql_ml_alter_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Remplacez les éléments suivants :

DB_NAME : base de données cible dans laquelle se trouve le modèle que vous souhaitez modifier.
MODEL_NAME : nom du modèle existant.
MODEL_PROVIDER : nom du fournisseur du modèle, tel que l'un des suivants :
- Vertex AI
- OpenAI
- Hugging Face
MODEL_URL : URL du point de terminaison du modèle.
Un exemple utilise le format suivant :
```
    https://region-aiplatform.googleapis.com/v1/projects/project-id/locations/region/publishers/google/models/model:predict
    
```
Remplacez les éléments suivants :
- REGION : région où se trouve le point de terminaison du modèle.
- PROJECT_ID : ID du projet dans lequel se trouve le point de terminaison du modèle.
- MODEL : nom du modèle
MODEL : modèle d'IA invoqué. Exemple :gemini-embedding-001
SECRET_URL : si Vertex AI est le fournisseur de modèles, ce paramètre doit être vide. Si vous utilisez un modèle externe, cette valeur doit faire référence à l'emplacement Secret Manager de la clé API.
Une URL exemple utilise le format suivant :
```
    https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
    
```
Remplacez les éléments suivants :
- PROJECT_ID : ID du projet dans lequel se trouve le secret.
- SECRET_NAME : nom du secret tel qu'il est utilisé dans Secret Manager.
- VERSION : numéro de version du secret.

Désactiver l'intégration à Vertex AI

Pour désactiver l'intégration de Vertex AI sur une instance Cloud SQL, exécutez la commande suivante :

gcloud sql instances patch [instance-name] --no-enable-google-ml-integration

Remplacez INSTANCE_NAME par le nom de l'instance Cloud SQL.

Supprimer un modèle externe dans SQL Server

Pour supprimer un modèle externe de SQL Server, exécutez la procédure stockée gcloudsql_ml_drop_external_model disponible dans la base de données msdb :

EXECUTE [msdb].[dbo].[gcloudsql_ml_drop_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME

Remplacez les éléments suivants :

DB_NAME : base de données cible dans laquelle se trouve le modèle externe que vous souhaitez supprimer.
MODEL_NAME : nom du modèle externe à supprimer.

Appeler un modèle externe

Une fois l'intégration de Vertex AI activée sur l'instance Cloud SQL et un objet de modèle créé pour que SQL Server l'utilise, vous pouvez appeler la fonction SQL Server AI_GENERATE_EMBEDDINGS pour créer des embeddings vectoriels pour vos données.

Pour créer des embeddings vectoriels à l'aide du modèle externe, exécutez la commande suivante :

SELECT AI_GENERATE_EMBEDDINGS(N'Test Text' USE MODEL MODEL_NAME)

Remplacez MODEL_NAME par le nom du modèle que vous souhaitez utiliser.

L'utilisateur principal exécutant doit avoir reçu les autorisations EXECUTE ON EXTERNAL MODEL à l'aide d'un rôle ou d'un octroi approprié.

Pour en savoir plus, consultez la documentation Microsoft sur les autorisations de modèle externe.

Restrictions concernant la taille des modèles

Certains modèles, tels que gemini-embedding-01, ont des dimensions de sortie par défaut plus élevées que celles que SQL Server peut prendre en charge pour les vecteurs float32, qui ont un maximum de 1 998 dimensions. Si nécessaire, vous devez utiliser float16 (une fonctionnalité d'aperçu Microsoft) pour le type de base vectorielle, qui offre un maximum de 3 996 dimensions vectorielles, ou le paramètre de dimensions doit être fourni dans la requête AI_GENERATE_EMBEDDINGS pour réduire la dimensionnalité.

Pour en savoir plus, consultez Prise en charge des valeurs float de demi-précision dans le type de données vector.

Par exemple :

DECLARE @params JSON = N'{"dimensions": "DIMENSIONS"}';
SELECT AI_GENERATE_EMBEDDINGS('This article introduces AI concepts.' USE MODEL MODEL_NAME PARAMETERS @params)

Remplacez les éléments suivants :

DIMENSIONS : dimensions que vous souhaitez utiliser pour votre modèle, par exemple 1536. Cette valeur est acceptée sous forme de chaîne.
MODEL_NAME : nom du modèle que vous souhaitez utiliser.

Résoudre les problèmes

Voici quelques messages d'erreur courants qui pourraient s'afficher :

Contexte	Erreur ou message reçu	Cause possible
Procédure `CREATE/ALTER`	"Le fournisseur de modèle spécifié n'est pas valide."	Un fournisseur de modèle non compatible a été fourni.
Procédure `CREATE/ALTER`	"L'URL secrète spécifiée n'est pas valide pour ce fournisseur de modèle."	Pour Vertex AI, l'URL du secret doit être vide. Pour les autres fournisseurs de modèles, l'URL secrète est obligatoire.
Procédure `CREATE/ALTER/DROP`	"Le nom de modèle spécifié n'est pas valide."	Veuillez indiquer un nom de modèle.
Procédure `CREATE/ALTER`	"L'URL du modèle spécifiée n'est pas valide."	L'URL du modèle est un champ obligatoire.
Procédure `CREATE/ALTER/DROP`	"Le nom de base de données spécifié n'est pas valide."	Veuillez indiquer un nom de base de données valide.
`AI_GENERATE_EMBEDDINGS` appel	Divers codes d'erreur, y compris `400`, `403`, `404`, `405`, `500`.	Si vous rencontrez des problèmes lors de l'exécution de la fonction `AI_GENERATE_EMBEDDINGS`, seuls les codes d'erreur sont renvoyés. Il s'agit d'une limitation connue de Microsoft.
`AI_GENERATE_EMBEDDINGS` appel	"La réponse HTTP ne contient pas de fichier JSON valide."	Un code d'erreur vous invitant à réessayer, tel que `429` ou `500`, a été renvoyé par l'agent de machine learning. Toutefois, le client reçoit ce message à la place. Il s'agit d'une limitation connue de Microsoft.

Codes d'erreur

La fonction AI_GENERATE_EMBEDDINGS ne fournit que des codes d'erreur, et non des messages. Le tableau suivant répertorie les causes possibles de certains codes d'erreur :

Code d'erreur	Cause possible
`400 Bad Request`	Type de modèle non accepté. Charge utile JSON mal formée. URL non valide pour le type de modèle.
`401 Unauthorized`	Le modèle tiers ne dispose pas d'une clé API valide.
`403 Forbidden`	L'instance Cloud SQL ne dispose pas des autorisations appropriées pour accéder à Vertex AI. L'instance Cloud SQL ne dispose pas des autorisations appropriées pour accéder à Secret Manager. La clé API n'accorde pas d'autorisation au modèle tiers spécifié. Vertex AI n'est pas activé dans le projet.
`404 Not Found`	Le `secret_url` spécifié n'existe pas. Le `model_url` spécifié n'existe pas.
`405 Method Not Allowed`	Une méthode autre que `POST` a été fournie.
`413 Request Body Too Large`	La taille de la requête dépasse la limite de 1 Mo.
`429 Too Many Requests`	Erreur d'épuisement du fournisseur de modèle.
`500 Internal Server Error`	Erreurs non spécifiées du fournisseur de modèles. Réponse inattendue du fournisseur de modèle.

Étapes suivantes

Utiliser des embeddings vectoriels

Intégrer Cloud SQL à Vertex AI Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Éditions et versions de bases de données compatibles

Types de modèles compatibles

Avant de commencer

Console

gcloud

gcloud

Activer l'intégration de la base de données avec Vertex AI

gcloud

Créer l'instance

Mettre à jour l'instance

REST v1

Créer l'instance

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Mettre à jour l'instance

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

REST v1beta4

Créer l'instance

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Mettre à jour l'instance

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Ajouter des autorisations Secret Manager

Objets de modèle externe

Créer un modèle externe

Modifier un modèle externe

Désactiver l'intégration à Vertex AI

Supprimer un modèle externe dans SQL Server

Appeler un modèle externe

Restrictions concernant la taille des modèles

Résoudre les problèmes

Codes d'erreur

Étapes suivantes

Intégrer Cloud SQL à Vertex AI