Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud SQL in Vertex AI einbinden

MySQL | PostgreSQL | SQL Server

Auf dieser Seite wird beschrieben, wie Sie Cloud SQL in Vertex AI einbinden.

Mit dieser Einbindung können Sie Large Language Models (LLMs), die in Vertex AI gehostet werden, auf eine Cloud SQL for SQL Server 2025-Datenbank anwenden.

Durch die Einbindung von Cloud SQL in Vertex AI können Sie die semantischen und prädiktiven Möglichkeiten von ML-Modellen (maschinelles Lernen) auf Ihre Daten anwenden. Diese Integration erweitert die SQL-Syntax um die Funktion generate embeddings zum Abfragen Ihrer Modelle.

Sie verwenden die Funktion „Einbettungen generieren“, damit das Einbettungsmodell Text-Prompts in numerische Vektoren übersetzen kann. Anschließend können Sie diese Vektoreinbettungen als Eingaben auf Vektordatentypen anwenden. Weitere Informationen finden Sie in der Microsoft-Dokumentation unter Vektorsuche und Vektorindexe in der SQL-Datenbank-Engine.

Weitere Informationen zu Vertex AI finden Sie unter Einführung in Vertex AI.

Unterstützte Versionen und Datenbankversionen

Die Vertex AI-Integration wird sowohl für die Cloud SQL Enterprise Plus-Version als auch für die Cloud SQL Enterprise-Version und für alle Datenbankversionen von SQL Server 2025 unterstützt.

Unterstützte Modelltypen

Die Vertex AI-Einbindung in Cloud SQL unterstützt Modellendpunkte aus den folgenden Quellen:

Vertex AI
Hugging Face
OpenAI

Hinweis

Melden Sie sich in Ihrem Google Cloud -Konto an. Wenn Sie mit Google Cloudnoch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Aktivieren Sie die erforderlichen Google Cloud APIs.
Console
1. Rufen Sie die Seite APIs & Dienste auf.
2. Wählen Sie Ihr Projekt aus der Projektliste aus.
3. Wenn die API-Bibliothek nicht geöffnet ist, wählen Sie im Navigationsmenü die Option Bibliothek aus.
4. Klicken Sie auf die APIs, die Sie aktivieren möchten. Aktivieren Sie für dieses Verfahren Folgendes:
  - Cloud SQL Admin API
  - Vertex AI API
  - Compute Engine API
  - Optional: Wenn Sie ein Drittanbietermodell verwenden, ist die Secret Manager API erforderlich.
  Hinweis: Um diese APIs zu finden, können Sie das Suchfeld nutzen.
5. Nachdem Sie die einzelnen APIs ausgewählt haben, klicken Sie auf Aktivieren.
gcloud
1. Öffnen Sie Cloud Shell, um direkt über den Browser über die Befehlszeile auf Ihre Google Cloud Ressourcen zuzugreifen.
2. Aktivieren Sie die erforderlichen APIs mit dem Befehl gcloud services enable:
  gcloud services enable sqladmin.googleapis.com \ aiplatform.googleapis.com \ compute.googleapis.com \ secretmanager.googleapis.com

Gewähren Sie dem Cloud SQL-Dienstkonto IAM-Berechtigungen (Identity and Access Management) für den Zugriff auf Vertex AI.

gcloud

Verwenden Sie den Befehl gcloud projects add-iam-policy-binding, um dem Cloud SQL-Dienstkonto für das Projekt, in dem sich die Cloud SQL-Instanz befindet, Vertex AI-Berechtigungen hinzuzufügen:

gcloud projects add-iam-policy-binding PROJECT_ID \
--member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
--role="roles/aiplatform.user"

Ersetzen Sie die folgenden Werte:

PROJECT_ID: die ID des Projekts mit dem Vertex AI-Endpunkt. Cloud SQL verwendet diesen Endpunkt, um auf das in Vertex AI gehostete LLM zuzugreifen.
SERVICE_ACCOUNT_EMAIL: die E-Mail-Adresse des Cloud SQL-Dienstkontos.

Verwenden Sie den Befehl gcloud sql instances describe, um diese E‑Mail-Adresse zu ermitteln:
```
gcloud sql instances describe INSTANCE_NAME | grep EmailAddress
```
Ersetzen Sie INSTANCE_NAME durch den Namen der Cloud SQL-Instanz.

Achten Sie darauf, dass dem Cloud SQL-Nutzer, der mit den Einbettungsmodellen arbeitet, die folgenden Datenbankberechtigungen gewährt werden:
- Damit ein Datenbanknutzer Modelle erstellen oder ändern kann, müssen Sie dem Cloud SQL-Nutzer die Berechtigung EXECUTE für die folgenden gespeicherten Prozeduren erteilen:
  - [msdb].gcloudsql_ml_create_external_model: Erstellt ein externes Modellobjekt, das den Standort, die Authentifizierungsmethode und den Zweck eines KI-Modell-Inferenzendpunkts enthält.
  - [msdb].gcloudsql_ml_alter_external_model: Ermöglicht es Ihnen, das externe Modellobjekt zu ändern.
  - [msdb].gcloudsql_ml_drop_external_model: Entfernt das externe Modellobjekt aus der Datenbank.
- Zum Aufrufen der oben aufgeführten gespeicherten Prozeduren benötigen Sie die folgenden Berechtigungen in der Zieldatenbank:
  - CREATE EXTERNAL MODEL
  - ALTER EXTERNAL MODEL
Wenn Sie ein externes Drittanbietermodell verwenden möchten, benötigen Sie einen gültigen API-Schlüssel für das Modell, der an einem für die Cloud SQL-Instanz zugänglichen Secret Manager-Speicherort gespeichert ist.
Wenn Sie ein externes Drittanbietermodell verwenden, muss die Cloud SQL-Instanz eine öffentliche IP-Adresse verwenden. Auf Instanzen mit privaten IP-Adressen kann nicht auf externe Drittanbietermodelle zugegriffen werden. Der Zugriff auf private Dienste und Private Service Connect werden nur bei der Vertex AI-Integration unterstützt.

Datenbankeinbindung mit Vertex AI aktivieren

Führen Sie folgende Schritte aus, um die Datenbankeinbindung in Vertex AI zu aktivieren:

Erstellen oder aktualisieren Sie eine Cloud SQL-Instanz, damit die Instanz in Vertex AI eingebunden werden kann.
gcloud

Die Instanz erstellen

Verwenden Sie den Befehl gcloud sql instances create, um die Cloud SQL-Instanz zu erstellen.
```
gcloud sql instances create INSTANCE_NAME \
--database-version=DATABASE_VERSION \
--tier=MACHINE_TYPE \
--region=REGION_NAME \
--enable-google-ml-integration
```
Ersetzen Sie die folgenden Werte:
- INSTANCE_NAME: der Name der Instanz.
- DATABASE_VERSION: die Datenbankversion für die Instanz, z. B. SQLSERVER_2025_ENTERPRISE.
- MACHINE_TYPE: der Maschinentyp für die Instanz, z. B. db-perf-optimized-N-8..
- REGION_NAME: Die Region für die Instanz, z. B. us-central1.
Hinweis: Weitere Informationen zu diesen Parametern finden Sie unter Instanzen erstellen.

Instanz aktualisieren

Verwenden Sie zum Aktualisieren der Instanz den Befehl gcloud sql instances patch.
```
gcloud sql instances patch INSTANCE_NAME \
--enable-google-ml-integration
```
Hinweis: Weitere Informationen zum Aktualisieren einer Instanz finden Sie unter Instanzen bearbeiten.
REST Version 1

Die Instanz erstellen

Verwenden Sie dieses Beispiel, um die Instanz zu erstellen. Eine vollständige Liste der Parameter für diesen Aufruf finden Sie auf der Seite Instanzen: insert. Informationen zu den Instanzeinstellungen, einschließlich der gültigen Werte für die Region, finden Sie unter Instanzeinstellungen.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: die ID oder Projektnummer des Google Cloud -Projekts, das die Instanz enthält.
- INSTANCE_NAME: der Name der Instanz.
- REGION_NAME: der Name der Region für die Instanz.
- DATABASE_VERSION: Enum-String der Datenbankversion, z. B. SQLSERVER_2025_ENTERPRISE.
- PASSWORD: Das Passwort für den Datenbanknutzer root.
- MACHINE_TYPE: Enum-String des Maschinentyps (Stufe), z. B. db-custom-[CPUS]-[MEMORY_MBS]. Weitere Informationen finden Sie unter Maschinenstufen.
- EDITION_TYPE: Ihre Cloud SQL-Version, z. B. ENTERPRISE.
Hinweis: Weitere Informationen zu diesen Parametern finden Sie unter Instanzen erstellen.

Darüber hinaus müssen Sie in die Anfrage das Objekt enableGoogleMlIntegration aufnehmen. Legen Sie nach Bedarf die folgenden Parameter fest:
- enableGoogleMlIntegration: Wenn dieser Parameter auf true gesetzt ist, können Cloud SQL-Instanzen eine Verbindung zu Vertex AI herstellen, um Anfragen für Echtzeitvorhersagen und Statistiken an die KI zu übergeben.
HTTP-Methode und URL:
POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances
JSON-Text anfordern:
{ "name": "INSTANCE_NAME", "region": "REGION_NAME", "databaseVersion": "DATABASE_VERSION", "rootPassword": "PASSWORD", "settings": { "tier": "MACHINE_TYPE", "edition": "EDITION_TYPE", "enableGoogleMlIntegration": "true" | "false" } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt haben, die Sie automatisch in der gcloud-Befehlszeile anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances"
PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances" | Select-Object -Expand Content
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_ID", "status": "PENDING", "user": "user@example.com", "insertTime": "2019-09-25T22:19:33.735Z", "operationType": "CREATE", "name": "OPERATION_ID", "targetId": "INSTANCE_ID", "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Instanz aktualisieren

In diesem Beispiel können Sie die Instanz aktualisieren. Eine vollständige Liste der Parameter für diesen Aufruf finden Sie auf der Seite Instanzen: insert.

Wenn diese Aktualisierung einen Wert ändert, der einen Neustart notwendig macht, werden Sie aufgefordert, mit der Änderung fortzufahren oder sie abzubrechen.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: die ID oder Projektnummer des Google Cloud -Projekts, das die Instanz enthält
- INSTANCE_NAME den Namen der Instanz
HTTP-Methode und URL:
PATCH https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME
JSON-Text anfordern:
{ "settings": { "enableGoogleMlIntegration": true, } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt haben, die Sie automatisch in der gcloud-Befehlszeile anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME"
PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME" | Select-Object -Expand Content
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/INSTANCE_NAME", "status": "PENDING", "user": "user@example.com", "insertTime": "2020-01-16T02:32:12.281Z", "operationType": "UPDATE", "name": "OPERATION_ID", "targetId": "INSTANCE_NAME", "selfLink": "https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Hinweis: Weitere Informationen zum Aktualisieren einer Instanz finden Sie unter Instanzen bearbeiten.
REST v1beta4

Die Instanz erstellen

Verwenden Sie dieses Beispiel, um die Instanz zu erstellen. Eine vollständige Liste der Parameter für diesen Aufruf finden Sie auf der Seite Instanzen: insert. Informationen zu den Instanzeinstellungen, einschließlich der gültigen Werte für die Region, finden Sie unter Instanzeinstellungen.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: die ID oder Projektnummer des Google Cloud -Projekts, das die Instanz enthält.
- INSTANCE_NAME: der Name der Instanz.
- REGION_NAME: der Name der Region für die Instanz.
- DATABASE_VERSION: Enum-String der Datenbankversion, z. B. SQLSERVER_2025_ENTERPRISE.
- PASSWORD: Das Passwort für den Datenbanknutzer root.
- MACHINE_TYPE: Enum-String des Maschinentyps (Stufe), z. B. db-custom-[CPUS]-[MEMORY_MBS]. Weitere Informationen finden Sie unter Maschinenstufen.
- EDITION_TYPE: Ihre Cloud SQL-Version, z. B. ENTERPRISE.
Hinweis: Weitere Informationen zu diesen Parametern finden Sie unter Instanzen erstellen.

Darüber hinaus müssen Sie in die Anfrage das Objekt enableGoogleMlIntegration aufnehmen. Legen Sie nach Bedarf die folgenden Parameter fest:
- enableGoogleMlIntegration: Wenn dieser Parameter auf true gesetzt ist, können Cloud SQL-Instanzen eine Verbindung zu Vertex AI herstellen, um Anfragen für Echtzeitvorhersagen und Statistiken an die KI zu übergeben.
HTTP-Methode und URL:
POST https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances
JSON-Text anfordern:
{ "name": "INSTANCE_NAME", "region": "REGION_NAME", "databaseVersion": "DATABASE_VERSION", "rootPassword": "PASSWORD", "settings": { "tier": "MACHINE_TYPE", "edition": "EDITION_TYPE", "enableGoogleMlIntegration": "true" | "false" } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt haben, die Sie automatisch in der gcloud-Befehlszeile anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances"
PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances" | Select-Object -Expand Content
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_ID", "status": "PENDING", "user": "user@example.com", "insertTime": "2019-09-25T22:19:33.735Z", "operationType": "CREATE", "name": "OPERATION_ID", "targetId": "INSTANCE_ID", "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Instanz aktualisieren

In diesem Beispiel können Sie die Instanz aktualisieren. Eine vollständige Liste der Parameter für diesen Aufruf finden Sie auf der Seite Instanzen: insert.

Wenn diese Aktualisierung einen Wert ändert, der einen Neustart notwendig macht, werden Sie aufgefordert, mit der Änderung fortzufahren oder sie abzubrechen.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: die ID oder Projektnummer des Google Cloud -Projekts, das die Instanz enthält
- INSTANCE_NAME den Namen der Instanz
HTTP-Methode und URL:
PATCH https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME
JSON-Text anfordern:
{ "settings": { "enableGoogleMlIntegration": true, } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt haben, die Sie automatisch in der gcloud-Befehlszeile anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME"
PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME" | Select-Object -Expand Content
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "kind": "sql#operation", "targetLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/instances/INSTANCE_NAME", "status": "PENDING", "user": "user@example.com", "insertTime": "2020-01-16T02:32:12.281Z", "operationType": "UPDATE", "name": "OPERATION_ID", "targetId": "INSTANCE_NAME", "selfLink": "https://sqladmin.googleapis.com/v1beta4/projects/PROJECT_ID/operations/OPERATION_ID", "targetProject": "PROJECT_ID" }
Hinweis: Weitere Informationen zum Aktualisieren einer Instanz finden Sie unter Instanzen bearbeiten.

Secret Manager-Berechtigungen hinzufügen

Wenn Sie ein Modell aus einer externen Quelle wie OpenAI oder Hugging Face verwenden möchten, müssen Sie den API-Schlüssel der Modellquelle in Secret Manager speichern.

Anschließend müssen Sie der Cloud SQL-Instanz Zugriff auf den API-Schlüssel der Modellquelle in Secret Manager gewähren. Führen Sie den folgenden Befehl aus, um Zugriff zu erhalten:


SA_NAME=$(gcloud sql instances describe INSTANCE_NAME --format="value(serviceAccountEmailAddress)");

gcloud secrets add-iam-policy-binding SECRET_NAME \
    --member="serviceAccount:${SA_NAME}" \
    --role="roles/secretmanager.secretAccessor"

Ersetzen Sie Folgendes:

INSTANCE_NAME: Der Name der Cloud SQL-Instanz.
SECRET_NAME: Der Name des Secrets, wie er im Secret Manager verwendet wird.

Externe Modellobjekte

Wenn Sie auf ein Modell aus einer externen Quelle zugreifen möchten, müssen Sie ein Modellobjekt für SQL Server erstellen. Cloud SQL bietet drei gespeicherte Prozeduren, mit denen Sie ein externes Modellobjekt erstellen, ändern und löschen können:

gcloudsql_ml_create_external_model
gcloudsql_ml_alter_external_model
gcloudsql_ml_drop_external_model

Externes Modell erstellen

Führen Sie die gespeicherte Prozedur gcloudsql_ml_create_external_model in der Datenbank msdb aus, um ein Modell zu erstellen:

EXECUTE [msdb].[dbo].[gcloudsql_ml_create_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Ersetzen Sie Folgendes:

DB_NAME: Die Zieldatenbank, in der das externe Modell erstellt werden soll.
MODEL_NAME: Der Name des neuen externen Modells.
MODEL_PROVIDER: Der Name des Modellanbieters, z. B. einer der folgenden:
- Vertex AI
- OpenAI
- Hugging Face
MODEL_URL: Die URL des Modellendpunkts.
Ein Beispiel verwendet das folgende Format:
```
    https://region-aiplatform.googleapis.com/v1/projects/project-id/locations/region/publishers/google/models/model:predict
    
```
Ersetzen Sie Folgendes:
- REGION: die Region, in der sich der Modellendpunkt befindet.
- PROJECT_ID: Die Projekt-ID des Projekts, in dem sich der Modellendpunkt befindet.
- MODEL ist der Name des Modells.
MODEL: Das aufgerufene KI-Modell. Beispiel: text-embedding-005
SECRET_URL: Wenn Vertex AI der Modellanbieter ist, muss dieser Parameter leer sein. Wenn Sie ein externes Modell verwenden, muss dieser Wert auf den Secret Manager-Speicherort des API-Schlüssels verweisen.
Eine Beispiel-URL hat das folgende Format:
```
    https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
    
```
Ersetzen Sie Folgendes:
- PROJECT_ID: die Projekt-ID, in der sich das Secret befindet.
- SECRET_NAME: Der Name des Secrets, wie er im Secret Manager verwendet wird.
- VERSION: Die Versionsnummer des Secrets.

Externes Modell ändern

Um ein externes Modellobjekt zu ändern, führen Sie die gespeicherte Prozedur gcloudsql_ml_alter_external_model in der Datenbank msdb aus:

EXECUTE [msdb].[dbo].[gcloudsql_ml_alter_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME,
@model_provider = 'MODEL_PROVIDER',
@model = 'MODEL',
@model_url = MODEL_URL,
@secret_url = SECRET_URL

Ersetzen Sie Folgendes:

DB_NAME: Die Zieldatenbank, in der sich das zu ändernde Modell befindet.
MODEL_NAME: der Name des vorhandenen Modells.
MODEL_PROVIDER: Der Name des Modellanbieters, z. B. einer der folgenden:
- Vertex AI
- OpenAI
- Hugging Face
MODEL_URL: Die URL des Modellendpunkts.
Ein Beispiel verwendet das folgende Format:
```
    https://region-aiplatform.googleapis.com/v1/projects/project-id/locations/region/publishers/google/models/model:predict
    
```
Ersetzen Sie Folgendes:
- REGION: die Region, in der sich der Modellendpunkt befindet.
- PROJECT_ID: Die Projekt-ID des Projekts, in dem sich der Modellendpunkt befindet.
- MODEL ist der Name des Modells.
MODEL: Das aufgerufene KI-Modell. Beispiel: gemini-embedding-001.
SECRET_URL: Wenn Vertex AI der Modellanbieter ist, muss dieser Parameter leer sein. Wenn Sie ein externes Modell verwenden, muss dieser Wert auf den Secret Manager-Speicherort des API-Schlüssels verweisen.
Eine Beispiel-URL hat das folgende Format:
```
    https://secretmanager.googleapis.com/v1/projects/PROJECT_ID/secrets/SECRET_NAME/versions/VERSION
    
```
Ersetzen Sie Folgendes:
- PROJECT_ID: die Projekt-ID, in der sich das Secret befindet.
- SECRET_NAME: Der Name des Secrets, wie er im Secret Manager verwendet wird.
- VERSION: Die Versionsnummer des Secrets.

Vertex AI-Einbindung deaktivieren

Führen Sie Folgendes aus, um die Vertex AI-Einbindung für eine Cloud SQL-Instanz zu deaktivieren:

gcloud sql instances patch [instance-name] --no-enable-google-ml-integration

Ersetzen Sie INSTANCE_NAME durch den Namen der Cloud SQL-Instanz.

Externes Modell in SQL Server löschen

Wenn Sie ein externes Modell aus SQL Server entfernen möchten, führen Sie die gespeicherte Prozedur gcloudsql_ml_drop_external_model aus der Datenbank msdb aus:

EXECUTE [msdb].[dbo].[gcloudsql_ml_drop_external_model]
@db = [DB_NAME],
@model_name = MODEL_NAME

Ersetzen Sie Folgendes:

DB_NAME: Die Zieldatenbank, in der sich das externe Modell befindet, das Sie löschen möchten.
MODEL_NAME: Der Name des externen Modells, das gelöscht werden soll.

Externes Modell aufrufen

Nachdem die Vertex AI-Integration für die Cloud SQL-Instanz aktiviert und ein Modellobjekt für die Verwendung durch SQL Server erstellt wurde, können Sie die SQL Server-Funktion AI_GENERATE_EMBEDDINGS aufrufen, um Vektoreinbettungen für Ihre Daten zu erstellen.

Führen Sie den folgenden Befehl aus, um Vektoreinbettungen mit dem externen Modell zu erstellen:

SELECT AI_GENERATE_EMBEDDINGS(N'Test Text' USE MODEL MODEL_NAME)

Ersetzen Sie MODEL_NAME durch den Namen des Modells, das Sie verwenden möchten.

Dem ausführenden Prinzipal müssen die Berechtigungen EXECUTE ON EXTERNAL MODEL über eine entsprechende Rolle oder Berechtigung gewährt worden sein.

Weitere Informationen finden Sie in der Microsoft-Dokumentation unter External model grants.

Beschränkungen für die Modellgröße

Einige Modelle, z. B. gemini-embedding-01, haben höhere Standardausgabedimensionen als SQL Server für float32-Vektoren unterstützen kann. Diese haben maximal 1.998 Dimensionen. Bei Bedarf müssen Sie entweder float16 (eine Microsoft-Vorschaufunktion) für den Vektorbasistyp verwenden, der maximal 3.996 Vektordimensionen bietet, oder der Parameter „dimensions“ muss im AI_GENERATE_EMBEDDINGS-Aufruf angegeben werden, um die Dimensionalität zu verringern.

Weitere Informationen finden Sie unter Unterstützung von Gleitkommazahlen mit halber Genauigkeit im Vektordatentyp.

Ein Beispiel finden Sie hier:

DECLARE @params JSON = N'{"dimensions": "DIMENSIONS"}';
SELECT AI_GENERATE_EMBEDDINGS('This article introduces AI concepts.' USE MODEL MODEL_NAME PARAMETERS @params)

Ersetzen Sie Folgendes:

DIMENSIONS: Die Dimensionen, die Sie für Ihr Modell verwenden möchten, z. B. 1536. Dieser Wert wird als String akzeptiert.
MODEL_NAME: Der Name des Modells, das Sie verwenden möchten.

Fehlerbehebung

Im Folgenden finden Sie mögliche Fehlermeldungen:

Kontext	Erhaltene Fehlermeldung	Mögliche Ursache
`CREATE/ALTER`-Vorgang	„Der angegebene Modellanbieter ist ungültig.“	Es wurde ein nicht unterstützter Modellanbieter angegeben.
`CREATE/ALTER`-Vorgang	„Die angegebene geheime URL ist für diesen Modellanbieter nicht gültig.“	Bei Vertex AI muss die Secret-URL leer sein. Bei anderen Modellanbietern darf die geheime URL nicht leer sein.
`CREATE/ALTER/DROP`-Vorgang	„Der angegebene Modellname ist ungültig.“	Der Modellname ist ein Pflichtfeld.
`CREATE/ALTER`-Vorgang	„Die angegebene Modell-URL ist ungültig.“	Die Modell-URL ist ein Pflichtfeld.
`CREATE/ALTER/DROP` Vorgehensweise	„Der angegebene Datenbankname ist ungültig.“	Ein gültiger Datenbankname ist ein Pflichtfeld.
`AI_GENERATE_EMBEDDINGS` Anruf	Verschiedene Fehlercodes, darunter `400`, `403`, `404`, `405` und `500`.	Wenn beim Ausführen der Funktion `AI_GENERATE_EMBEDDINGS` Probleme auftreten, werden nur Fehlercodes zurückgegeben. Dies ist eine bekannte Einschränkung von Microsoft.
`AI_GENERATE_EMBEDDINGS` Anruf	„Die HTTP-Antwort enthält kein gültiges JSON.“	Der Machine-Learning-Agent hat einen Fehlercode zurückgegeben, der Sie auffordert, es noch einmal zu versuchen, z. B. `429` oder `500`. Der Kunde erhält jedoch diese SMS: Dies ist eine bekannte Einschränkung von Microsoft.

Fehlercodes

Die Funktion AI_GENERATE_EMBEDDINGS gibt nur Fehlercodes und keine Meldungen zurück. In der folgenden Tabelle sind mögliche Ursachen für einige Fehlercodes aufgeführt:

Fehlercode	Mögliche Ursache
`400 Bad Request`	Nicht unterstützter Modelltyp. Falsch formatierte JSON-Nutzlast. Ungültige URL für den Modelltyp.
`401 Unauthorized`	Für das Drittanbietermodell ist kein gültiger API-Schlüssel vorhanden.
`403 Forbidden`	Der Cloud SQL-Instanz fehlen die erforderlichen Berechtigungen für den Zugriff auf Vertex AI. Der Cloud SQL-Instanz fehlen die erforderlichen Berechtigungen für den Zugriff auf Secret Manager. Der API-Schlüssel gewährt keine Berechtigung für das angegebene Drittanbietermodell. Vertex AI ist für das Projekt nicht aktiviert.
`404 Not Found`	Die angegebene `secret_url` ist nicht vorhanden. Die angegebene `model_url` ist nicht vorhanden.
`405 Method Not Allowed`	Es wurde eine andere Methode als `POST` angegeben.
`413 Request Body Too Large`	Die Anfragedatei ist größer als das Limit von 1 MB.
`429 Too Many Requests`	Fehler vom Modellanbieter, der darauf hinweist, dass das Kontingent aufgebraucht ist.
`500 Internal Server Error`	Unbekannte Fehler vom Modellanbieter. Unerwartete Antwort vom Modellanbieter.

Nächste Schritte

Mit Vektoreinbettungen arbeiten

Cloud SQL in Vertex AI einbinden Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Unterstützte Versionen und Datenbankversionen

Unterstützte Modelltypen

Hinweis

Console

gcloud

gcloud

Datenbankeinbindung mit Vertex AI aktivieren

gcloud

Die Instanz erstellen

Instanz aktualisieren

REST Version 1

Die Instanz erstellen

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Instanz aktualisieren

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

REST v1beta4

Die Instanz erstellen

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Instanz aktualisieren

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Secret Manager-Berechtigungen hinzufügen

Externe Modellobjekte

Externes Modell erstellen

Externes Modell ändern

Vertex AI-Einbindung deaktivieren

Externes Modell in SQL Server löschen

Externes Modell aufrufen

Beschränkungen für die Modellgröße

Fehlerbehebung

Fehlercodes

Nächste Schritte

Cloud SQL in Vertex AI einbinden