Intégrer Cloud SQL à Vertex AI

Cette page explique comment intégrer Cloud SQL à Vertex AI.

Cette intégration vous permet d'appliquer de grands modèles de langage (LLM), hébergés dans Vertex AI, à une base de données Cloud SQL pour SQL Server 2025.

En intégrant Cloud SQL à Vertex AI, vous pouvez appliquer la puissance sémantique et prédictive des modèles de machine learning (ML) à vos données. Cette intégration étend la syntaxe SQL avec la fonction generate embeddings pour interroger vos modèles.

Vous utilisez la fonction de génération d'embeddings pour que le modèle d'embedding puisse traduire les requêtes textuelles en vecteurs numériques. Vous pouvez ensuite appliquer ces embeddings vectoriels en tant qu'entrées aux types de données vectorielles. Pour en savoir plus, consultez la documentation Microsoft sur la recherche vectorielle et les index vectoriels dans le moteur de base de données SQL.

Pour en savoir plus sur Vertex AI, consultez la Présentation de Vertex AI.

Éditions et versions de bases de données compatibles

L'intégration de Vertex AI est compatible avec les éditions Cloud SQL Enterprise Plus et Cloud SQL Enterprise, ainsi qu'avec toutes les versions de base de données de SQL Server 2025.

Types de modèles compatibles

L'intégration de Vertex AI à Cloud SQL est compatible avec les points de terminaison de modèle provenant des sources suivantes :

  • Vertex AI
  • Hugging Face
  • OpenAI

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud . Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $de crédits sans frais pour exécuter, tester et déployer des charges de travail.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Verify that billing is enabled for your Google Cloud project.

  6. Activez les API Google Cloud nécessaires.

    Console

    1. Accédez à la page API et services.
    2. Dans la liste des projets, sélectionnez un projet.
    3. Si la bibliothèque d'API n'est pas ouverte, sélectionnez Bibliothèque dans le menu de navigation.
    4. Cliquez sur les API que vous souhaitez activer. Pour cette procédure, activez les éléments suivants :

      • API Cloud SQL Admin
      • API Vertex AI
      • API Compute Engine
      • Facultatif : Si vous utilisez un modèle tiers, l'API Secret Manager est requise.
    5. Après avoir sélectionné chaque API, cliquez sur Activer.

    gcloud

    1. Ouvrez Cloud Shell, qui fournit un accès en ligne de commande à vos ressources Google Cloud directement depuis votre navigateur.
    2. Pour activer les API requises, utilisez la commande gcloud services enable :
      gcloud services enable sqladmin.googleapis.com \
        aiplatform.googleapis.com \
        compute.googleapis.com \
        secretmanager.googleapis.com
      
    3. Cette commande active les API suivantes :
      • API Cloud SQL Admin
      • API Vertex AI
      • API Compute Engine
      • Facultatif : Si vous utilisez un modèle tiers, l'API Secret Manager est requise.

  7. Accordez au compte de service Cloud SQL les autorisations IAM (Identity and Access Management) pour accéder à Vertex AI.
  8. gcloud

    Pour ajouter les autorisations Vertex AI au compte de service Cloud SQL pour le projet où se trouve l'instance Cloud SQL, utilisez la commande gcloud projects add-iam-policy-binding :

    gcloud projects add-iam-policy-binding PROJECT_ID \
    --member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
    --role="roles/aiplatform.user"
    

    Effectuez les remplacements suivants :
    • PROJECT_ID : ID du projet contenant le point de terminaison Vertex AI. Cloud SQL utilise ce point de terminaison pour accéder au LLM hébergé dans Vertex AI.
    • SERVICE_ACCOUNT_EMAIL : adresse e-mail du compte de service Cloud SQL.

      Pour trouver cette adresse e-mail, utilisez la commande gcloud sql instances describe :

      gcloud sql instances describe INSTANCE_NAME | grep EmailAddress
      

      Remplacez INSTANCE_NAME par le nom de l'instance Cloud SQL.

  9. Assurez-vous que l'utilisateur Cloud SQL qui travaille avec les modèles d'embedding dispose des autorisations de base de données suivantes :
    • Pour permettre à un utilisateur de base de données de créer ou de modifier des modèles, vous devez accorder à l'utilisateur Cloud SQL l'autorisation EXECUTE sur les procédures stockées suivantes :
      • [msdb].gcloudsql_ml_create_external_model : crée un objet de modèle externe qui contient l'emplacement, la méthode d'authentification et l'objectif d'un point de terminaison d'inférence de modèle d'IA.
      • [msdb].gcloudsql_ml_alter_external_model : vous permet de modifier l'objet de modèle externe.
      • [msdb].gcloudsql_ml_drop_external_model : supprime l'objet de modèle externe de la base de données.
    • Pour appeler les procédures stockées listées précédemment, vous devez disposer des autorisations suivantes dans la base de données cible :
      • CREATE EXTERNAL MODEL
      • ALTER EXTERNAL MODEL
    • Pour savoir comment accorder ces autorisations, consultez la documentation Microsoft sur la commande et la nomenclature Créer un modèle externe.

      Pour en savoir plus sur les autorisations de super-utilisateur Cloud SQL, consultez À propos des utilisateurs SQL Server et des procédures stockées.

  10. Si vous souhaitez utiliser un modèle externe tiers, vous devez disposer d'une clé API valide pour le modèle, stockée dans un emplacement Secret Manager accessible à l'instance Cloud SQL.
  11. Si vous utilisez un modèle externe tiers, l'instance Cloud SQL doit utiliser une adresse IP publique. Les instances d'adresse IP privée ne peuvent pas accéder aux modèles externes tiers. L'accès aux services privés et Private Service Connect ne sont compatibles qu'avec l'intégration de Vertex AI.

Activer l'intégration de la base de données avec Vertex AI

Pour activer l'intégration de la base de données avec Vertex AI, procédez comme suit :

  1. Créez ou mettez à jour une instance Cloud SQL afin que l'instance puisse s'intégrer à Vertex AI.

    gcloud

    Créer l'instance

    Pour créer l'instance Cloud SQL, utilisez la commande gcloud sql instances create.

    gcloud sql instances create INSTANCE_NAME \
    --database-version=DATABASE_VERSION \
    --tier=MACHINE_TYPE \
    --region=REGION_NAME \
    --enable-google-ml-integration

    Effectuez les remplacements suivants :

    • INSTANCE_NAME : nom de l'instance.
    • DATABASE_VERSION : version de la base de données pour l'instance, telle que SQLSERVER_2025_ENTERPRISE.
    • MACHINE_TYPE : type de machine de l'instance, par exemple db-perf-optimized-N-8..
    • REGION_NAME : région de l'instance, par exemple us-central1.

    Mettre à jour l'instance

    Pour mettre à jour l'instance, utilisez la commande gcloud sql instances patch.

    gcloud sql instances patch INSTANCE_NAME \
    --enable-google-ml-integration

    REST v1

    Créer l'instance

    Utilisez cet exemple pour créer l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert. Pour en savoir plus sur les paramètres des instances, y compris sur les valeurs valides pour la région, consultez la page Paramètres des instances.

    Avant d'utiliser les données de requête, effectuez les remplacements suivants :

    • PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
    • INSTANCE_NAME : nom de l'instance.
    • REGION_NAME : nom de la région pour l'instance.
    • DATABASE_VERSION : chaîne d'énumération de la version de base de données, telle que SQLSERVER_2025_ENTERPRISE.
    • PASSWORD : mot de passe de l'utilisateur root de la base de données.
    • MACHINE_TYPE : chaîne d'énumération du type (niveau) de machine, par exemple db-custom-[CPUS]-[MEMORY_MBS]. Pour en savoir plus, consultez Niveaux de machines.
    • EDITION_TYPE : votre édition Cloud SQL, telle que ENTERPRISE.

    Vous devez également inclure l'objet enableGoogleMlIntegration dans la requête. Définissez les paramètres suivants, si nécessaire :

    • enableGoogleMlIntegration : lorsque ce paramètre est défini sur true, les instances Cloud SQL peuvent se connecter à Vertex AI pour transmettre des requêtes de prédictions en temps réel et des insights à l'IA.

    Méthode HTTP et URL :

    POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances

    Corps JSON de la requête :

    {
      "name": "INSTANCE_NAME",
      "region": "REGION_NAME",
      "databaseVersion": "DATABASE_VERSION",
      "rootPassword": "PASSWORD",
      "settings": {
        "tier": "MACHINE_TYPE",
        "edition": "EDITION_TYPE",
        "enableGoogleMlIntegration": "true" | "false"
        
      }
    }
    

    Pour envoyer votre requête, développez l'une des options suivantes :

    Vous devriez recevoir une réponse JSON de ce type :

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_ID",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2019-09-25T22:19:33.735Z",
      "operationType": "CREATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_ID",
      "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

    Mettre à jour l'instance

    Utilisez cet exemple pour mettre à jour l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert.

    Si cette mise à jour modifie une valeur dont la modification nécessite un redémarrage de l'instance, un message vous invite à procéder à la modification ou à annuler l'opération.

    Avant d'utiliser les données de requête, effectuez les remplacements suivants :

    • PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
    • INSTANCE_NAME : nom de l'instance

    Méthode HTTP et URL :

    PATCH https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME

    Corps JSON de la requête :

    {
      "settings": {
        "enableGoogleMlIntegration": true,
        
       }
    }

    Pour envoyer votre requête, développez l'une des options suivantes :

    Vous devriez recevoir une réponse JSON de ce type :

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2020-01-16T02:32:12.281Z",
      "operationType": "UPDATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_NAME",
      "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

    REST v1beta4

    Créer l'instance

    Utilisez cet exemple pour créer l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert. Pour en savoir plus sur les paramètres des instances, y compris sur les valeurs valides pour la région, consultez la page Paramètres des instances.

    Avant d'utiliser les données de requête, effectuez les remplacements suivants :

    • PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
    • INSTANCE_NAME : nom de l'instance.
    • REGION_NAME : nom de la région pour l'instance.
    • DATABASE_VERSION : chaîne d'énumération de la version de base de données, telle que SQLSERVER_2025_ENTERPRISE.
    • PASSWORD : mot de passe de l'utilisateur root de la base de données.
    • MACHINE_TYPE : chaîne d'énumération du type (niveau) de machine, par exemple db-custom-[CPUS]-[MEMORY_MBS]. Pour en savoir plus, consultez Niveaux de machines.
    • EDITION_TYPE : votre édition Cloud SQL, telle que ENTERPRISE.

    Vous devez également inclure l'objet enableGoogleMlIntegration dans la requête. Définissez les paramètres suivants, si nécessaire :

    • enableGoogleMlIntegration : lorsque ce paramètre est défini sur true, les instances Cloud SQL peuvent se connecter à Vertex AI pour transmettre des requêtes de prédictions en temps réel et des insights à l'IA.

    Méthode HTTP et URL :

    POST https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances

    Corps JSON de la requête :

    {
      "name": "INSTANCE_NAME",
      "region": "REGION_NAME",
      "databaseVersion": "DATABASE_VERSION",
      "rootPassword": "PASSWORD",
      "settings": {
        "tier": "MACHINE_TYPE",
        "edition": "EDITION_TYPE",
        "enableGoogleMlIntegration": "true" | "false"
        
      }
    }
    

    Pour envoyer votre requête, développez l'une des options suivantes :

    Vous devriez recevoir une réponse JSON de ce type :

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_ID",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2019-09-25T22:19:33.735Z",
      "operationType": "CREATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_ID",
      "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

    Mettre à jour l'instance

    Utilisez cet exemple pour mettre à jour l'instance. Pour obtenir la liste complète des paramètres de cet appel, consultez la page instances:insert.

    Si cette mise à jour modifie une valeur dont la modification nécessite un redémarrage de l'instance, un message vous invite à procéder à la modification ou à annuler l'opération.

    Avant d'utiliser les données de requête, effectuez les remplacements suivants :

    • PROJECT_ID : ID ou numéro de projet du projet Google Cloud contenant l'instance.
    • INSTANCE_NAME : nom de l'instance

    Méthode HTTP et URL :

    PATCH https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME

    Corps JSON de la requête :

    {
      "settings": {
        "enableGoogleMlIntegration": true,
        
       }
    }

    Pour envoyer votre requête, développez l'une des options suivantes :

    Vous devriez recevoir une réponse JSON de ce type :

    {
      "kind": "sql#operation",
      "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME",
      "status": "PENDING",
      "user": "user@example.com",
      "insertTime": "2020-01-16T02:32:12.281Z",
      "operationType": "UPDATE",
      "name": "OPERATION_ID",
      "targetId": "INSTANCE_NAME",
      "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID",
      "targetProject": "PROJECT_ID"
    }
    

Ajouter des autorisations Secret Manager

Si vous souhaitez utiliser un modèle provenant d'une source externe, telle qu'OpenAI ou Hugging Face, vous devez stocker la clé API de la source du modèle dans Secret Manager.

Vous devez ensuite accorder à l'instance Cloud SQL l'accès à la clé API de la source du modèle dans Secret Manager. Pour y accéder, exécutez la commande suivante :


SA_NAME=$(gcloud sql instances describe INSTANCE_NAME --format="value(serviceAccountEmailAddress)");

gcloud secrets add-iam-policy-binding SECRET_NAME \
    --member="serviceAccount:${SA_NAME}" \
    --role="roles/secretmanager.secretAccessor"

Remplacez les éléments suivants :

  • INSTANCE_NAME : nom de l'instance Cloud SQL.
  • SECRET_NAME : nom du secret tel qu'il est utilisé dans Secret Manager.

Objets de modèle externe

Pour accéder à un modèle à partir d'une source externe, vous devez créer un objet de modèle que SQL Server pourra utiliser. Cloud SQL fournit trois procédures stockées qui vous permettent de créer, de modifier et de supprimer un objet de modèle externe :

  • gcloudsql_ml_create_external_model
  • gcloudsql_ml_alter_external_model
  • gcloudsql_ml_drop_external_model

Créer un modèle externe

Pour créer un modèle, exécutez la procédure stockée gcloudsql_ml_create_external_model qui se trouve dans la base de données msdb :

EXECUTE [msdb].[dbo].[gcloudsql_ml_create_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Remplacez les éléments suivants :

  • DB_NAME : base de données cible dans laquelle vous souhaitez créer le modèle externe.
  • MODEL_NAME : nom du nouveau modèle externe.
  • MODEL_PROVIDER : nom du fournisseur du modèle, tel que l'un des suivants :
    • Vertex AI
    • OpenAI
    • Hugging Face
  • MODEL_URL : URL du point de terminaison du modèle.
  • MODEL : modèle d'IA appelé. Par exemple : gemini-embedding-002.
  • SECRET_URL : si Vertex AI est le fournisseur de modèles, ce paramètre doit être vide. Si vous utilisez un modèle externe, cette valeur doit faire référence à l'emplacement Secret Manager de la clé API. Une URL exemple utilise le format suivant :
        https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
        

    Remplacez les éléments suivants :

    • PROJECT_ID : ID du projet dans lequel se trouve le secret.
    • SECRET_NAME : nom du secret tel qu'il est utilisé dans Secret Manager.
    • VERSION : numéro de version du secret.

Modifier un modèle externe

Pour modifier un objet de modèle externe, exécutez la procédure stockée gcloudsql_ml_alter_external_model disponible dans la base de données msdb :

EXECUTE [msdb].[dbo].[gcloudsql_ml_alter_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Remplacez les éléments suivants :

  • DB_NAME : base de données cible dans laquelle se trouve le modèle que vous souhaitez modifier.
  • MODEL_NAME : nom du modèle existant.
  • MODEL_PROVIDER : nom du fournisseur du modèle, tel que l'un des suivants :
    • Vertex AI
    • OpenAI
    • Hugging Face
  • MODEL_URL : URL du point de terminaison du modèle.
  • MODEL : modèle d'IA appelé. Exemple :gemini-embedding-001
  • SECRET_URL : si Vertex AI est le fournisseur de modèles, ce paramètre doit être vide. Si vous utilisez un modèle externe, cette valeur doit faire référence à l'emplacement Secret Manager de la clé API. Voici un exemple d'URL :
        https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
        

    Remplacez les éléments suivants :

    • PROJECT_ID : ID du projet dans lequel se trouve le secret.
    • SECRET_NAME : nom du secret tel qu'il est utilisé dans Secret Manager.
    • VERSION : numéro de version du secret.

Désactiver l'intégration à Vertex AI

Pour désactiver l'intégration de Vertex AI sur une instance Cloud SQL, exécutez la commande suivante :

gcloud sql instances patch [instance-name] --no-enable-google-ml-integration

Remplacez INSTANCE_NAME par le nom de l'instance Cloud SQL.

Supprimer un modèle externe dans SQL Server

Pour supprimer un modèle externe de SQL Server, exécutez la procédure stockée gcloudsql_ml_drop_external_model disponible dans la base de données msdb :

EXECUTE [msdb].[dbo].[gcloudsql_ml_drop_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME

Remplacez les éléments suivants :

  • DB_NAME : base de données cible dans laquelle se trouve le modèle externe que vous souhaitez supprimer.
  • MODEL_NAME : nom du modèle externe à supprimer.

Appeler un modèle externe

Une fois l'intégration de Vertex AI activée sur l'instance Cloud SQL et un objet de modèle créé pour que SQL Server l'utilise, vous pouvez appeler la fonction SQL Server AI_GENERATE_EMBEDDINGS pour créer des embeddings vectoriels pour vos données.

Pour créer des embeddings vectoriels à l'aide du modèle externe, exécutez la commande suivante :

SELECT AI_GENERATE_EMBEDDINGS(N'Test Text' USE MODEL MODEL_NAME)

Remplacez MODEL_NAME par le nom du modèle que vous souhaitez utiliser.

L'utilisateur principal exécutant doit avoir reçu les autorisations EXECUTE ON EXTERNAL MODEL à l'aide d'un rôle ou d'une autorisation appropriés.

Pour en savoir plus, consultez la documentation Microsoft sur les autorisations de modèle externe.

Restrictions concernant la taille des modèles

Certains modèles, tels que gemini-embedding-01, ont des dimensions de sortie par défaut plus élevées que celles que SQL Server peut prendre en charge pour les vecteurs float32, qui ont un maximum de 1 998 dimensions. Si nécessaire, vous devez utiliser float16 (une fonctionnalité d'aperçu Microsoft) pour le type de base vectorielle, qui offre un maximum de 3 996 dimensions vectorielles, ou le paramètre de dimensions doit être fourni dans la requête AI_GENERATE_EMBEDDINGS pour réduire la dimensionnalité.

Pour en savoir plus, consultez Prise en charge des valeurs float de demi-précision dans le type de données vectorielles.

Par exemple :

DECLARE @params JSON = N'{"dimensions": "DIMENSIONS"}';
SELECT AI_GENERATE_EMBEDDINGS('This article introduces AI concepts.' USE MODEL MODEL_NAME PARAMETERS @params)

Remplacez les éléments suivants :

  • DIMENSIONS : dimensions que vous souhaitez utiliser pour votre modèle, par exemple 1536. Cette valeur est acceptée sous forme de chaîne.
  • MODEL_NAME : nom du modèle que vous souhaitez utiliser.

Résoudre les problèmes

Voici quelques messages d'erreur courants qui pourraient s'afficher :

Contexte Erreur ou message reçu Cause possible
Procédure CREATE/ALTER "Le fournisseur de modèle spécifié n'est pas valide." Un fournisseur de modèle non compatible a été fourni.
Procédure CREATE/ALTER "L'URL secrète spécifiée n'est pas valide pour ce fournisseur de modèle." Pour Vertex AI, l'URL du secret doit être vide. Pour les autres fournisseurs de modèles, l'URL secrète ne doit pas être vide.
Procédure CREATE/ALTER/DROP "Le nom de modèle spécifié n'est pas valide." Veuillez indiquer un nom de modèle.
Procédure CREATE/ALTER "L'URL du modèle spécifiée n'est pas valide." L'URL du modèle est un champ obligatoire.
Procédure CREATE/ALTER/DROP "Le nom de base de données spécifié n'est pas valide." Veuillez indiquer un nom de base de données valide.
AI_GENERATE_EMBEDDINGS appel Différents codes d'erreur, y compris 400, 403, 404, 405, 500. Si vous rencontrez des problèmes lors de l'exécution de la fonction AI_GENERATE_EMBEDDINGS, seuls les codes d'erreur sont renvoyés. Il s'agit d'une limitation connue de Microsoft.
AI_GENERATE_EMBEDDINGS appel "La réponse HTTP ne contient pas de fichier JSON valide." Un code d'erreur vous invitant à réessayer, tel que 429 ou 500, a été renvoyé par l'agent de machine learning. Toutefois, le client reçoit ce message à la place. Il s'agit d'une limitation connue de Microsoft.

Codes d'erreur

La fonction AI_GENERATE_EMBEDDINGS ne fournit que des codes d'erreur, et non des messages. Le tableau suivant répertorie les causes possibles de certains codes d'erreur :

Code d'erreur Cause possible
400 Bad Request
  • Type de modèle non accepté.
  • Charge utile JSON mal formée.
  • URL non valide pour le type de modèle.
401 Unauthorized Le modèle tiers ne dispose pas d'une clé API valide.
403 Forbidden
  • L'instance Cloud SQL ne dispose pas des autorisations appropriées pour accéder à Vertex AI.
  • L'instance Cloud SQL ne dispose pas des autorisations appropriées pour accéder à Secret Manager.
  • La clé API n'accorde pas l'autorisation au modèle tiers spécifié.
  • Vertex AI n'est pas activé dans le projet.
404 Not Found
  • Le secret_url spécifié n'existe pas.
  • Le model_url spécifié n'existe pas.
405 Method Not Allowed Une méthode autre que POST a été fournie.
413 Request Body Too Large La taille de la requête dépasse la limite de 1 Mo.
429 Too Many Requests Erreur d'épuisement du fournisseur de modèle.
500 Internal Server Error
  • Erreurs non spécifiées du fournisseur de modèles.
  • Réponse inattendue du fournisseur de modèle.

Étapes suivantes